🤗 Hugging Face • 🤖 魔搭社区(ModelScope) • ✡️ 慧模(WiseModel)
👩🚀 在 GitHub 上提问或交流想法
📝 查阅 Yi 技术报告
📚 在 Yi 学习中心 共同成长
🤖 Yi系列模型是由01.AI从头开始训练的下一代开源大型语言模型。
🙌 作为一款双语语言模型,Yi系列模型在3T多语言语料上进行了训练,现已成为全球性能最强的大型语言模型之一,在语言理解、常识推理、阅读理解等多个方面均展现出卓越能力。例如:
Yi-34B-Chat模型在AlpacaEval排行榜上位列第二(仅次于GPT-4 Turbo),性能超越了其他大型语言模型(如GPT-4、Mixtral、Claude)(基于2024年1月可获取的数据)。
Yi-34B模型在各类基准测试中,包括Hugging Face Open LLM排行榜(预训练模型)和C-Eval,在所有现有开源模型中(如Falcon-180B、Llama-70B、Claude),无论是英文还是中文任务均排名第一(基于2023年11月可获取的数据)。
🙏(致谢Llama)感谢Transformer和Llama开源社区,他们减少了从头构建模型所需的工作量,并使得在AI生态系统中使用相同的工具成为可能。
💡 核心要点
Yi系列模型采用与Llama相同的模型架构,但并非Llama的衍生产品。
Yi和Llama均基于Transformer结构,自2018年以来,Transformer结构已成为大型语言模型的标准架构。
基于Transformer架构,Llama凭借其出色的稳定性、可靠的收敛性和强大的兼容性,已成为大多数最先进开源模型的新基石。这使得Llama成为包括Yi在内的众多模型公认的基础框架。
得益于Transformer和Llama架构,其他模型能够利用它们的优势,减少了从头构建的工作量,并能够在其生态系统中使用相同的工具。
然而,Yi系列模型并非Llama的衍生产品,因为它们并未使用Llama的权重。
由于Llama的结构被大多数开源模型所采用,因此决定模型性能的关键因素在于训练数据集、训练流程和训练基础设施。
Yi通过独特且专有的方式进行开发,完全从头开始独立创建了自己的高质量训练数据集、高效的训练流程和强大的训练基础设施。这一努力使得Yi系列模型取得了优异的性能,在2023年12月的Alpaca排行榜上,其排名仅次于GPT4,并超越了Llama。
[ 返回顶部 ⬆️ ]
Yi-9B-200K 模型开源并向公众开放。Yi-9B 模型开源并向公众开放。Yi-9B 在一众同规模开源模型(包括 Mistral-7B、SOLAR-10.7B、Gemma-7B、DeepSeek-Coder-7B-Base-v1.5 等)中表现卓越,尤其在代码生成、数学运算、常识推理和阅读理解方面优势突出。
Yi-VL-34B 与 Yi-VL-6B 开源并向公众开放。Yi-VL-34B 在最新的基准测试中(包括 MMMU 和 CMMMU),在所有现有开源模型中排名第一(基于 2024 年 1 月可获取的数据)。
Yi-34B-ChatYi-34B-Chat-4bitsYi-34B-Chat-8bitsYi-6B-ChatYi-6B-Chat-4bitsYi-6B-Chat-8bits您可以通过以下平台交互式体验部分模型:
Yi-6B-200K 和 Yi-34B-200K 开源并向公众开放。Yi-6B 和 Yi-34B 开源并向公众开放。[ 返回顶部 ⬆️ ]
Yi模型提供多种尺寸,可满足不同的使用场景。您也可以对Yi模型进行微调,以满足您的特定需求。
如果您想部署Yi模型,请确保您满足软硬件要求。
| 模型 | 下载地址 |
|---|---|
| Yi-34B-Chat | • 🤗 Hugging Face • 🤖 ModelScope • 🟣 wisemodel |
| Yi-34B-Chat-4bits | • 🤗 Hugging Face • 🤖 ModelScope • 🟣 wisemodel |
| Yi-34B-Chat-8bits | • 🤗 Hugging Face • 🤖 ModelScope • 🟣 wisemodel |
| Yi-6B-Chat | • 🤗 Hugging Face • 🤖 ModelScope • 🟣 wisemodel |
| Yi-6B-Chat-4bits | • 🤗 Hugging Face • 🤖 ModelScope • 🟣 wisemodel |
| Yi-6B-Chat-8bits | • 🤗 Hugging Face • 🤖 ModelScope • 🟣 wisemodel |
- 4-bit系列模型采用AWQ量化技术。
- 8-bit系列模型采用GPTQ量化技术。
- 所有量化模型均支持消费级GPU(如3090、4090)部署,使用门槛低。
| 模型 | 下载地址 |
|---|---|
| Yi-34B | • 🤗 Hugging Face • 🤖 ModelScope • 🟣 wisemodel |
| Yi-34B-200K | • 🤗 Hugging Face • 🤖 ModelScope • 🟣 wisemodel |
| Yi-9B | • 🤗 Hugging Face • 🤖 ModelScope • 🟣 wisemodel |
| Yi-9B-200K | • 🤗 Hugging Face • 🤖 ModelScope • 🟣 wisemodel |
| Yi-6B | • 🤗 Hugging Face • 🤖 ModelScope • 🟣 wisemodel |
| Yi-6B-200K | • 🤗 Hugging Face • 🤖 ModelScope • 🟣 wisemodel |
- 200K大约相当于40万个汉字。
- 若需使用Yi-34B-200K的历史版本(2023年11月5日发布),请执行 git checkout 069cd341d60f4ce4b07ec394e82b79e94f656cf 命令下载权重。
| 模型 | 介绍 | 默认上下文窗口 | 预训练 tokens | 训练数据日期 |
|---|---|---|---|---|
| 6B 系列模型 | 适用于个人及学术用途。 | 4K | 3T | 截至 2023 年 6 月 |
| 9B 系列模型 | 在 Yi 系列模型中,其编码和数学能力表现最佳。 | Yi-9B 在 Yi-6B 的基础上持续训练,使用了 0.8T tokens。 | ||
| 34B 系列模型 | 适用于个人、学术及商业用途(尤其适合中小型企业)。这是一个经济实惠且具备涌现能力的高性价比解决方案。 | 3T |
针对对话模型
然而,这种更高的多样性可能会放大某些现有问题,包括:
[ 返回顶部 ⬆️ ]
💡 提示:如果您想开始使用 Yi 模型并探索不同的推理方法,请查看 Yi 实践指南。
选择以下任一方式开始您的 Yi 使用之旅!

如果您希望在本地部署 Yi 模型,
🙋♀️ 且您的资源有限(例如,MacBook Pro),您可以使用 llama.cpp。
如果您不希望在本地部署 Yi 模型,您可以通过以下任一选项探索 Yi 的功能。
如果您想探索 Yi 的更多功能,可以采用以下方法之一:
如果您想与 Yi 聊天并使用更多可自定义选项(例如,系统提示、温度参数、重复惩罚等),您可以尝试以下任一选项:
Yi-34B-Chat-Playground(Replicate)
如果您想与 Yi 聊天,您可以使用以下任一在线服务,它们提供类似的用户体验:
Yi-34B-Chat(Hugging Face 上的 Yi 官方空间)
Yi-34B-Chat(Yi 官方测试版)
[ 返回顶部 ⬆️ ]
本教程将引导您完成在 A800(80G)本地运行 Yi-34B-Chat 并进行推理的每一步。
确保已安装 Python 3.10 或更高版本。
如果您想运行其他 Yi 模型,请参见 软硬件要求。
要设置环境并安装所需软件包,请执行以下命令。
git clone https://github.com/01-ai/Yi.git
cd yi
pip install -r requirements.txt您可以从以下来源下载 Yi 模型的权重和分词器:
您可以按以下方式使用 Yi 对话模型或基础模型进行推理。
创建一个名为 quick_start.py 的文件,并将以下内容复制到其中。
from transformers import AutoModelForCausalLM, AutoTokenizer
model_path = '<your-model-path>'
tokenizer = AutoTokenizer.from_pretrained(model_path, use_fast=False)
# 自 transformers 4.35.0 版本起,可使用 AutoModelForCausalLM 加载 GPT-Q/AWQ 模型。
model = AutoModelForCausalLM.from_pretrained(
model_path,
device_map="auto",
torch_dtype='auto'
).eval()
# 提示内容:"hi"
messages = [
{"role": "user", "content": "hi"}
]
input_ids = tokenizer.apply_chat_template(conversation=messages, tokenize=True, add_generation_prompt=True, return_tensors='pt')
output_ids = model.generate(input_ids.to('cuda'))
response = tokenizer.decode(output_ids[0][input_ids.shape[1]:], skip_special_tokens=True)
# 模型响应:"Hello! How can I assist you today?"
print(response)运行 quick_start.py。
python quick_start.py然后您将看到类似以下的输出。🥳
Hello! How can I assist you today?Yi-34B
步骤与 pip - 使用 Yi 对话模型进行推理 类似。
您可以使用现有的文件 text_generation.py。
python demo/text_generation.py --model <your-model-path>然后您将看到类似以下的输出。🥳
提示:Let me tell you an interesting story about cat Tom and mouse Jerry,
生成内容:Let me tell you an interesting story about cat Tom and mouse Jerry, which happened in my childhood. My father had a big house with two cats living inside it to kill mice. One day when I was playing at home alone, I found one of the tomcats lying on his back near our kitchen door, looking very much like he wanted something from us but couldn’t get up because there were too many people around him! He kept trying for several minutes before finally giving up...
Yi-9B
输入
from transformers import AutoModelForCausalLM, AutoTokenizer
MODEL_DIR = "01-ai/Yi-9B"
model = AutoModelForCausalLM.from_pretrained(MODEL_DIR, torch_dtype="auto")
tokenizer = AutoTokenizer.from_pretrained(MODEL_DIR, use_fast=False)
input_text = "# write the quick sort algorithm"
inputs = tokenizer(input_text, return_tensors="pt").to(model.device)
outputs = model.generate(**inputs, max_length=256)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))输出
# write the quick sort algorithm
def quick_sort(arr):
if len(arr) <= 1:
return arr
pivot = arr[len(arr) // 2]
left = [x for x in arr if x < pivot]
middle = [x for x in arr if x == pivot]
right = [x for x in arr if x > pivot]
return quick_sort(left) + middle + quick_sort(right)
# test the quick sort algorithm
print(quick_sort([3, 6, 8, 10, 1, 2, 1]))[ 返回顶部 ⬆️ ]
确保您已安装 Docker 和 nvidia-container-toolkit。
docker run -it --gpus all \
-v <your-model-path>: /models
ghcr.io/01-ai/yi:latest或者,您可以从 registry.lingyiwanwu.com/ci/01-ai/yi:latest 拉取 Yi Docker 镜像。
您可以按以下方式使用 Yi 对话模型或基础模型进行推理。
步骤与 pip - 使用 Yi 对话模型进行推理 类似。
注意,唯一的区别是设置 model_path = '<your-model-mount-path>',而不是 model_path = '<your-model-path>'。
步骤与 pip - 使用 Yi 基础模型进行推理 类似。
注意,唯一的区别是设置 --model <your-model-mount-path>',而不是 model <your-model-path>。
conda-lock 为 conda 环境生成完全可重现的锁定文件。⬇️micromamba 来安装这些依赖项。
按照 此处 的说明安装 micromamba。
执行 micromamba install -y -n yi -f conda-lock.yml 创建一个名为 yi 的 conda 环境并安装必要的依赖项。
以下教程将指导您完成在本地运行量化模型(Yi-chat-6B-2bits)并进行推理的每一步操作。
本教程假设您使用的是配备 16GB 内存和 Apple M2 Pro 芯片的 MacBook Pro。
确保您的机器上已安装 git-lfs。
llama.cpp要克隆 llama.cpp 仓库,请运行以下命令。
git clone git@github.com:ggerganov/llama.cpp.git2.1 如需仅通过指针克隆 XeIaso/yi-chat-6B-GGUF,请运行以下命令。
GIT_LFS_SKIP_SMUDGE=1 git clone https://huggingface.co/XeIaso/yi-chat-6B-GGUF2.2 如需下载量化后的 Yi 模型(yi-chat-6b.Q2_K.gguf),请运行以下命令。
git-lfs pull --include yi-chat-6b.Q2_K.gguf要使用 Yi 模型执行推理,您可以采用以下方法之一。
若要使用 4 个线程编译 llama.cpp 并进行推理,请导航至 llama.cpp 目录,然后运行以下命令。
提示
将
/Users/yu/yi-chat-6B-GGUF/yi-chat-6b.Q2_K.gguf替换为您模型的实际路径。模型默认以补全模式运行。
如需其他输出自定义选项(例如系统提示词、温度参数、重复惩罚等),可运行
./main -h查看详细说明和用法。
make -j4 && ./main -m /Users/yu/yi-chat-6B-GGUF/yi-chat-6b.Q2_K.gguf -p "How do you feed your pet fox? Please answer this question in 6 simple steps:\nStep 1:" -n 384 -e
...
How do you feed your pet fox? Please answer this question in 6 simple steps:
Step 1: Select the appropriate food for your pet fox. You should choose high-quality, balanced prey items that are suitable for their unique dietary needs. These could include live or frozen mice, rats, pigeons, or other small mammals, as well as fresh fruits and vegetables.
Step 2: Feed your pet fox once or twice a day, depending on the species and its individual preferences. Always ensure that they have access to fresh water throughout the day.
Step 3: Provide an appropriate environment for your pet fox. Ensure it has a comfortable place to rest, plenty of space to move around, and opportunities to play and exercise.
Step 4: Socialize your pet with other animals if possible. Interactions with other creatures can help them develop social skills and prevent boredom or stress.
Step 5: Regularly check for signs of illness or discomfort in your fox. Be prepared to provide veterinary care as needed, especially for common issues such as parasites, dental health problems, or infections.
Step 6: Educate yourself about the needs of your pet fox and be aware of any potential risks or concerns that could affect their well-being. Regularly consult with a veterinarian to ensure you are providing the best care.
...
现在您已成功向Yi模型提问并获得了回答!🥳
若要初始化一个轻量且快速的聊天机器人,请运行以下命令。
cd llama.cpp
./server --ctx-size 2048 --host 0.0.0.0 --n-gpu-layers 64 --model /Users/yu/yi-chat-6B-GGUF/yi-chat-6b.Q2_K.gguf之后您会得到类似如下的输出:
...
llama_new_context_with_model: n_ctx = 2048
llama_new_context_with_model: freq_base = 5000000.0
llama_new_context_with_model: freq_scale = 1
ggml_metal_init: allocating
ggml_metal_init: found device: Apple M2 Pro
ggml_metal_init: picking default device: Apple M2 Pro
ggml_metal_init: ggml.metallib not found, loading from source
ggml_metal_init: GGML_METAL_PATH_RESOURCES = nil
ggml_metal_init: loading '/Users/yu/llama.cpp/ggml-metal.metal'
ggml_metal_init: GPU name: Apple M2 Pro
ggml_metal_init: GPU family: MTLGPUFamilyApple8 (1008)
ggml_metal_init: hasUnifiedMemory = true
ggml_metal_init: recommendedMaxWorkingSetSize = 11453.25 MB
ggml_metal_init: maxTransferRate = built-in GPU
ggml_backend_metal_buffer_type_alloc_buffer: allocated buffer, size = 128.00 MiB, ( 2629.44 / 10922.67)
llama_new_context_with_model: KV self size = 128.00 MiB, K (f16): 64.00 MiB, V (f16): 64.00 MiB
ggml_backend_metal_buffer_type_alloc_buffer: allocated buffer, size = 0.02 MiB, ( 2629.45 / 10922.67)
llama_build_graph: non-view tensors processed: 676/676
llama_new_context_with_model: compute buffer total size = 159.19 MiB
ggml_backend_metal_buffer_type_alloc_buffer: allocated buffer, size = 156.02 MiB, ( 2785.45 / 10922.67)
Available slots:
-> Slot 0 - max context: 2048
llama server listening at http://0.0.0.0:8080要访问聊天机器人界面,请打开网页浏览器并在地址栏中输入 http://0.0.0.0:8080。

在提示窗口中输入问题,例如“如何喂养你的宠物狐狸?请用6个简单步骤回答”,您将收到相应的回答。

[ 返回顶部 ⬆️ ]
您可以为 Yi chat 模型搭建网页 UI 演示(请注意,此场景不支持 Yi 基础模型)。
步骤 3:要在本地启动网页服务,请运行以下命令。
python demo/web_demo.py -c <your-model-path>您可以通过在浏览器中输入控制台提供的地址来访问Web UI。

[ 返回顶部 ⬆️ ]
bash finetune/scripts/run_sft_Yi_6b.sh完成后,您可以使用以下命令比较微调模型和基础模型:
bash finetune/scripts/run_eval.sh默认情况下,我们使用来自 BAAI/COIG 的小型数据集对基础模型进行微调。
您也可以按照以下 jsonl 格式准备自定义数据集:
{ "prompt": "Human: Who are you? Assistant:", "chosen": "I'm Yi." }然后将它们挂载到容器中以替换默认文件:
docker run -it \
-v /path/to/save/finetuned/model/:/finetuned-model \
-v /path/to/train.jsonl:/yi/finetune/data/train.json \
-v /path/to/eval.jsonl:/yi/finetune/data/eval.json \
ghcr.io/01-ai/yi:latest \
bash finetune/scripts/run_sft_Yi_6b.sh请确保您已安装 conda。如果尚未安装,请使用
mkdir -p ~/miniconda3
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh -O ~/miniconda3/miniconda.sh
bash ~/miniconda3/miniconda.sh -b -u -p ~/miniconda3
rm -rf ~/miniconda3/miniconda.sh
~/miniconda3/bin/conda init bash
source ~/.bashrc然后,创建一个 conda 环境:
conda create -n dev_env python=3.10 -y
conda activate dev_env
pip install torch==2.0.1 deepspeed==0.10 tensorboard transformers datasets sentencepiece accelerate ray==2.7对于 Yi-6B 模型,建议使用配备 4 块 GPU 的节点,每块 GPU 显存需大于 60GB。
对于 Yi-34B 模型,由于 zero-offload 技术的使用会占用大量 CPU 内存,因此在 34B 模型的微调训练中,请谨慎限制 GPU 的数量。请使用 CUDA_VISIBLE_DEVICES 来限制 GPU 数量(如 scripts/run_sft_Yi_34b.sh 所示)。
微调 34B 模型的典型硬件配置为:一个配备 8 块 GPU 的节点(运行时通过 CUDA_VISIBLE_DEVICES=0,1,2,3 限制为 4 块),每块 GPU 显存大于 80GB,且总 CPU 内存大于 900GB。
下载一个 LLM 基础模型至 MODEL_PATH(6B 和 34B)。模型的典型文件夹结构如下:
|-- $MODEL_PATH
| |-- config.json
| |-- pytorch_model-00001-of-00002.bin
| |-- pytorch_model-00002-of-00002.bin
| |-- pytorch_model.bin.index.json
| |-- tokenizer_config.json
| |-- tokenizer.model
| |-- ...从 huggingface 下载数据集至本地存储路径 DATA_PATH,例如 Dahoas/rm-static。
|-- $DATA_PATH
| |-- data
| | |-- train-00000-of-00001-2a1df75c6bce91ab.parquet
| | |-- test-00000-of-00001-8c7c51afc6d45980.parquet
| |-- dataset_infos.json
| |-- README.mdfinetune/yi_example_dataset 包含示例数据集,这些数据集基于 BAAI/COIG 修改而成。
|-- $DATA_PATH
|--data
|-- train.jsonl
|-- eval.jsonlcd 进入 scripts 文件夹,复制粘贴脚本并运行。例如:
cd finetune/scripts
bash run_sft_Yi_6b.sh对于 Yi-6B 基础模型,设置 training_debug_steps=20 和 num_train_epochs=4 即可输出一个对话模型,耗时约 20 分钟。
对于 Yi-34B 基础模型,初始化所需时间相对较长,请耐心等待。
cd finetune/scripts
bash run_eval.sh然后您将看到基础模型和微调模型的答案。
[ 返回顶部 ⬆️ ]
python quantization/gptq/quant_autogptq.py \
--model /base_model \
--output_dir /quantized_model \
--trust_remote_code完成后,您可以按以下方式评估生成的模型:
python quantization/gptq/eval_quantized_model.py \
--model /quantized_model \
--trust_remote_codepython quant_autogptq.py --model /base_model \
--output_dir /quantized_model --bits 4 --group_size 128 --trust_remote_code您可以使用 eval_quantized_model.py 运行量化模型:
python eval_quantized_model.py --model /quantized_model --trust_remote_codepython quantization/awq/quant_autoawq.py \
--model /base_model \
--output_dir /quantized_model \
--trust_remote_code完成后,您可以按以下方式评估生成的模型:
python quantization/awq/eval_quantized_model.py \
--model /quantized_model \
--trust_remote_codepython quant_autoawq.py --model /base_model \
--output_dir /quantized_model --bits 4 --group_size 128 --trust_remote_code您可以使用 eval_quantized_model.py 运行量化模型:
python eval_quantized_model.py --model /quantized_model --trust_remote_code[ 返回顶部 ⬆️ ]
如果您想部署 Yi 模型,请确保满足以下软件和硬件要求。
在使用 Yi 量化模型前,请确保已安装以下正确的软件。
| 模型 | 软件 |
|---|---|
| Yi 4位量化模型 | AWQ 和 CUDA |
| Yi 8位量化模型 | GPTQ 和 CUDA |
在您的环境中部署 Yi 之前,请确保您的硬件满足以下要求。
| 模型 | 最低显存 | 推荐 GPU 示例 |
|---|---|---|
| Yi-6B-Chat | 15 GB | 1 x RTX 3090 (24 GB) 1 x RTX 4090 (24 GB) 1 x A10 (24 GB) 1 x A30 (24 GB) |
| Yi-6B-Chat-4bits | 4 GB | 1 x RTX 3060 (12 GB) 1 x RTX 4060 (8 GB) |
| Yi-6B-Chat-8bits | 8 GB | 1 x RTX 3070 (8 GB) 1 x RTX 4060 (8 GB) |
| Yi-34B-Chat | 72 GB | 4 x RTX 4090 (24 GB) 1 x A800 (80GB) |
| Yi-34B-Chat-4bits | 20 GB | 1 x RTX 3090 (24 GB) 1 x RTX 4090 (24 GB) 1 x A10 (24 GB) 1 x A30 (24 GB) 1 x A100 (40 GB) |
| Yi-34B-Chat-8bits | 38 GB | 2 x RTX 3090 (24 GB) 2 x RTX 4090 (24 GB) 1 x A800 (40 GB) |
以下是不同批量使用场景下详细的最低显存要求。
| 模型 | batch=1 | batch=4 | batch=16 | batch=32 |
|---|---|---|---|---|
| Yi-6B-Chat | 12 GB | 13 GB | 15 GB | 18 GB |
| Yi-6B-Chat-4bits | 4 GB | 5 GB | 7 GB | 10 GB |
| Yi-6B-Chat-8bits | 7 GB | 8 GB | 10 GB | 14 GB |
| Yi-34B-Chat | 65 GB | 68 GB | 76 GB | > 80 GB |
| Yi-34B-Chat-4bits | 19 GB | 20 GB | 30 GB | 40 GB |
| Yi-34B-Chat-8bits | 35 GB | 37 GB | 46 GB | 58 GB |
| 模型 | 最低显存 | 推荐 GPU 示例 |
|---|---|---|
| Yi-6B | 15 GB | 1 x RTX 3090 (24 GB) 1 x RTX 4090 (24 GB) 1 x A10 (24 GB) 1 x A30 (24 GB) |
| Yi-6B-200K | 50 GB | 1 x A800 (80 GB) |
| Yi-9B | 20 GB | 1 x RTX 4090 (24 GB) |
| Yi-34B | 72 GB | 4 x RTX 4090 (24 GB) 1 x A800 (80 GB) |
| Yi-34B-200K | 200 GB | 4 x A800 (80 GB) |
[ 返回顶部 ⬆️ ]
Yi-34B 和 Yi-34B-Chat 进行全量微调的主要区别在于微调方法和结果。
Yi-34B 可能是您的首选微调模型。Yi-34B-Chat 或许是您的最佳选择。哪里可以获取微调问答数据集?
微调 Yi-34B FP16 需要多少 GPU 内存?
微调 34B FP16 所需的 GPU 内存取决于所采用的具体微调方法。对于全参数微调,您需要 8 块每块 80 GB 显存的 GPU;不过,像 Lora 这样更经济的方案则需要更少的显存。更多详细信息,请查看 hiyouga/LLaMA-Factory。另外,考虑使用 BF16 而非 FP16 进行微调,以优化性能。
是否有第三方平台支持 Yi-34b-200k 模型的对话功能?
如果您正在寻找第三方对话平台,可选择 fireworks.ai。
欢迎来到 Yi 学习中心!
无论您是经验丰富的开发者还是刚入门的新手,都能在这里找到大量实用的学习资源,帮助您深入理解和熟练运用 Yi 模型,包括富有洞见的博客文章、全面的视频教程、手把手的实践指南等等。
您在这里看到的内容,都由知识渊博的 Yi 专家和热情的爱好者们慷慨贡献。我们对您的宝贵付出致以衷心的感谢!
同时,我们也热烈邀请您加入 Yi 的贡献者行列。如果您已经为 Yi 做出了贡献,欢迎在下方表格中展示您的出色成果。
有了这些资源,您就可以开启精彩的 Yi 探索之旅了。祝您学习愉快!🥳
| 内容 | 日期 | 作者 |
|---|---|---|
| yi-openai-proxy | 2024-05-11 | 苏洋 |
| 基于零一万物 Yi 模型和 B 站构建大语言模型高质量训练数据集 | 2024-04-29 | 正经人王同学 |
| 基于视频网站和零一万物大模型构建大语言模型高质量训练数据集 | 2024-04-25 | 正经人王同学 |
| 基于零一万物yi-34b-chat-200k输入任意文章地址,点击按钮即可生成无广告或推广内容的简要笔记,并生成分享图给好友 | 2024-04-24 | 正经人王同学 |
| Food-GPT-Yi-model | 2024-04-21 | Hubert S |
Yi 拥有全面的生态系统,提供一系列工具、服务和模型,旨在丰富您的使用体验并提升工作效率。
Yi 系列模型采用与 Llama 相同的模型架构。选择 Yi,您可以充分利用 Llama 生态系统中现有的工具、库和资源,无需重新开发新工具,从而提高开发效率。
例如,Yi 系列模型以 Llama 模型的格式进行保存。您可以直接使用 LlamaForCausalLM 和 LlamaTokenizer 来加载模型。更多信息,请参见使用对话模型。
from transformers import AutoModelForCausalLM, AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained("01-ai/Yi-34b", use_fast=False)
model = AutoModelForCausalLM.from_pretrained("01-ai/Yi-34b", device_map="auto")[ 返回顶部 ⬆️ ]
💡 提示
欢迎创建 PR,分享您使用 Yi 系列模型构建的出色成果。
为帮助他人快速了解您的工作,建议使用
<model-name>: <model-intro> + <model-highlights>的格式。
如果您希望在几分钟内快速启动 Yi 模型,可以使用以下基于 Yi 构建的服务。
Yi-34B-Chat:您可以通过以下平台与 Yi 进行对话:
Yi-6B-Chat (Replicate):您可以通过设置额外参数和调用 API 来使用此模型,并获得更多选项。
ScaleLLM:您可以使用此服务在本地运行 Yi 模型,具有更高的灵活性和可定制性。
如果您的计算资源有限,可以按以下方式使用 Yi 的量化模型。
这些量化模型降低了精度,但提高了效率,例如更快的推理速度和更低的内存占用。
如果您希望探索 Yi 繁荣生态中多样化的能力,可以深入了解以下 Yi 的微调模型。
TheBloke Models:该网站托管了众多基于包括 Yi 在内的各种 LLM 微调得到的模型。
这并非 Yi 微调模型的完整列表,以下是部分下载量较高的模型:
SUSTech/SUS-Chat-34B:该模型在所有 70B 以下模型中排名第一,并且性能优于两倍参数规模的 deepseek-llm-67b-chat。您可以在 Open LLM Leaderboard 上查看结果。
OrionStarAI/OrionStar-Yi-34B-Chat-Llama:该模型在 OpenCompass LLM Leaderboard 的 C-Eval 和 CMMLU 评测中表现优于其他模型(如 GPT-4、Qwen-14B-Chat、Baichuan2-13B-Chat)。
NousResearch/Nous-Capybara-34B:该模型在 Capybara 数据集上以 200K 上下文长度训练了 3 个 epoch。
[ 返回顶部 ⬆️ ]
有关Yi系列模型的详细能力,请参阅Yi: Open Foundation Models by 01.AI。
@misc{ai2024yi,
title={Yi: Open Foundation Models by 01.AI},
author={01. AI and : and Alex Young and Bei Chen and Chao Li and Chengen Huang and Ge Zhang and Guanwei Zhang and Heng Li and Jiangcheng Zhu and Jianqun Chen and Jing Chang and Kaidong Yu and Peng Liu and Qiang Liu and Shawn Yue and Senbin Yang and Shiming Yang and Tao Yu and Wen Xie and Wenhao Huang and Xiaohui Hu and Xiaoyi Ren and Xinyao Niu and Pengcheng Nie and Yuchi Xu and Yudong Liu and Yue Wang and Yuxuan Cai and Zhenyu Gu and Zhiyuan Liu and Zonghong Dai},
year={2024},
eprint={2403.04652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}Yi-34B-Chat模型展现出卓越性能,在MMLU、CMMLU、BBH、GSM8k等多项基准测试中,均位列所有现有开源模型之首。

*:C-Eval结果基于验证数据集进行评估
Yi-34B和Yi-34B-200K模型在开源模型中表现突出,尤其在MMLU、CMMLU、常识推理、阅读理解等方面表现卓越。

在一系列相似规模的开源模型(包括Mistral-7B、SOLAR-10.7B、Gemma-7B、DeepSeek-Coder-7B-Base-v1.5等)中,Yi-9B几乎表现最佳,尤其在代码、数学、常识推理和阅读理解方面优势显著。

在整体能力(Mean-All)方面,Yi-9B在相似规模的开源模型中表现最佳,超越了DeepSeek-Coder、DeepSeek-Math、Mistral-7B、SOLAR-10.7B和Gemma-7B。

在代码能力(Mean-Code)方面,Yi-9B的表现仅次于DeepSeek-Coder-7B,超越了Yi-34B、SOLAR-10.7B、Mistral-7B和Gemma-7B。

在数学能力(Mean-Math)方面,Yi-9B的表现仅次于DeepSeek-Math-7B,超越了SOLAR-10.7B、Mistral-7B和Gemma-7B。

在常识与推理能力(Mean-Text)方面,Yi-9B的表现与Mistral-7B、SOLAR-10.7B和Gemma-7B相当。

[ 返回顶部 ⬆️ ]
所有人都可以!🙌 ✅
Yi 系列模型的代码和权重均基于 Apache 2.0 许可证 进行分发,这意味着 Yi 系列模型可免费用于个人用途、学术研究以及商业活动。
[ 返回顶部 ⬆️ ]
衷心感谢每一位为 Yi 社区做出贡献的成员!是你们的努力让 Yi 不仅仅是一个项目,更成为了一个充满活力、不断成长的创新家园。
[ 返回顶部 ⬆️ ]
在训练过程中,我们使用了数据合规性检查算法,以尽最大努力确保训练后模型的合规性。由于数据的复杂性以及语言模型使用场景的多样性,我们无法保证模型在所有场景下都能生成正确且合理的输出。请注意,模型仍存在产生问题输出的风险。对于因误用、误导、非法使用及相关错误信息所导致的任何风险和问题,以及任何相关的数据安全问题,我们不承担责任。
[ 返回顶部 ⬆️ ]
Yi-1.5 系列模型的代码和权重基于 Apache 2.0 许可证 进行分发。
如果您基于此模型创建衍生作品,请在您的衍生作品中包含以下归属声明:
本作品是 01.AI 的 [您所基于的 Yi 系列模型] 的衍生作品,使用遵循 Apache 2.0 许可证。
[ 返回顶部 ⬆️ ]