HuggingFace镜像/Llama2-Chinese-7b-Chat-openmind
模型介绍文件和版本分析
下载使用量0

Llama2中文社区


Llama2中文微调参数

由于Llama2本身的中文对齐较弱,我们采用中文指令集,对meta-llama/Llama-2-7b-chat-hf进行LoRA微调,使其具备较强的中文对话能力。

🎯 该版本为LoRA中文微调参数FlagAlpha/Llama2-Chinese-7b-Chat-LoRA和meta-llama/Llama-2-7b-chat-hf参数结合后的版本,可直接使用


🚀 社区地址:

Github:Llama-Chinese

在线体验链接:llama.family

🔥 社区介绍

欢迎来到Llama2中文社区!

我们是一个专注于Llama2模型在中文方面的优化和上层建设的高级技术社区。

基于大规模中文数据,从预训练开始对Llama2模型进行中文能力的持续迭代升级。

我们热忱欢迎对大模型LLM充满热情的开发者和研究者加入我们的行列。

在Openmind中使用

from openmind import AutoTokenizer, AutoModelForCausalLM, pipeline, is_torch_npu_available
from openmind_hub import snapshot_download
import openmind
import torch
import argparse
import time

def parse_args():
    parser = argparse.ArgumentParser()
    parser.add_argument(
        "--model_name_or_path",
        type=str,
        help="Path to model",
        default="jeffding/Llama2-Chinese-7b-Chat-openmind",
    )
    args = parser.parse_args()
    return args

def main():
    args = parse_args()
    model_path = args.model_name_or_path

    if is_torch_npu_available():
        device = "npu:0"
    else:
        device = "cpu"
        
    
    model = AutoModelForCausalLM.from_pretrained(model_path,
                                             device_map=device,
                                             trust_remote_code=False,
                                             revision="main").to(device)
    tokenizer = AutoTokenizer.from_pretrained(model_path, use_fast=True,trust_remote_code=False)
    
    start_time = time.time()
    
    prompt = "简单介绍一下llamas这个模型"
    system_message = "你是一个故事写作小助手"
    prompt_template=f'''[INST] {prompt} [/INST]
    '''

    print("*** Pipeline:")
    pipe = pipeline(
        "text-generation",
        model=model,
        tokenizer=tokenizer,
        max_new_tokens=512,
        do_sample=True,
        temperature=0.7,
        top_p=0.95,
        top_k=40,
        repetition_penalty=1.1,
    )

    print(pipe(prompt_template))
    
    end_time = time.time()
    print(f"硬件环境:{device},推理执行时间:{end_time - start_time}秒")
    
if __name__ == "__main__":
    main()

🐼 社区资源

  • Llama2在线体验链接llama.family,同时包含Meta原版和中文微调版本!
    • Llama2 Chat模型的中文问答能力评测!
    • 社区飞书知识库,欢迎大家一起共建!