HuggingFace镜像/Yuan2.0-2B-hf
模型介绍文件和版本分析
下载使用量0

Yuan 2-2B

模型介绍/Introduction

源2.0 是浪潮信息发布的新一代基础语言大模型。我们开源了全部的3个模型源2.0-102B,源2.0-51B和源2.0-2B。并且我们提供了预训练,微调,推理服务的相关脚本,以供研发人员做进一步的开发。源2.0是在源1.0的基础上,利用更多样的高质量预训练数据和指令微调数据集,令模型在语义、数学、推理、代码、知识等不同方面具备更强的理解能力。

Yuan2.0 是浪潮信息研发的新一代基础语言大模型。我们已发布全部三款模型,分别是 Yuan 2.0-102B、Yuan 2.0-51B 和 Yuan 2.0-2B。同时,我们还提供了预训练、微调及推理服务的相关脚本,供其他开发者进行进一步开发。Yuan2.0 以 Yuan1.0 为基础,通过采用更丰富多样的高质量预训练数据和指令微调数据集,增强了模型在语义、数学、推理、代码、知识等多个领域的理解能力。

代码调用/Code Usage

可以通过如下代码调用 Yuan2-2B 模型来生成文本:

您可以通过以下代码调用 Yuan2-2B 模型生成文本:

import transformers
from transformers import AutoModelForCausalLM,AutoTokenizer,LlamaTokenizer
from openmind_hub import snapshot_download
import torch
import torch_npu
import argparse

def parse_args():
    parser = argparse.ArgumentParser()
    parser.add_argument(
        "--model_name_or_path",
        type=str,
        help="path_model",
        default="Jinan_AICC/Yuan2.0-2B-hf",
    )
    args = parser.parse_args()
    return args

args = parse_args()
if args.model_name_or_path:
    model_path = args.model_name_or_path
else:
    model_path = snapshot_download(
        "Jinan_AICC/Yuan2.0-2B-hf",
        revision="main",
        ignore_patterns=["*.h5", "*.ot", "*.msgpack"],       
    )

print("Creat tokenizer...")
tokenizer = LlamaTokenizer.from_pretrained(model_path, add_eos_token=False, add_bos_token=False, eos_token='<eod>')
tokenizer.add_tokens(['<sep>', '<pad>', '<mask>', '<predict>', '<FIM_SUFFIX>', '<FIM_PREFIX>', '<FIM_MIDDLE>','<commit_before>','<commit_msg>','<commit_after>','<jupyter_start>','<jupyter_text>','<jupyter_code>','<jupyter_output>','<empty_output>'], special_tokens=True)

print("Creat model...")
model = AutoModelForCausalLM.from_pretrained(model_path,device_map='auto',torch_dtype=torch.bfloat16,trust_remote_code=True)

inputs = tokenizer("请问目前最先进的机器学习算法有哪些?", return_tensors="pt")["input_ids"].to("npu:0")
outputs = model.generate(inputs,do_sample=False,max_length=100)
print(tokenizer.decode(outputs[0]))