HuggingFace镜像/chinese-llama-2-7b
模型介绍文件和版本分析
下载使用量0

Chinese-LLaMA-2-7B

这是完整的Chinese-LLaMA-2-7B模型,可直接加载用于推理和全参数训练。

相关模型👇

  • 长上下文基础模型
    • [Chinese-LLaMA-2-7B-16K (full model)]
    • [Chinese-LLaMA-2-LoRA-7B-16K (LoRA model)]
    • [Chinese-LLaMA-2-13B-16K (full model)]
    • [Chinese-LLaMA-2-LoRA-13B-16K (LoRA model)]
  • 基础模型
    • [Chinese-LLaMA-2-7B (full model)]
    • [Chinese-LLaMA-2-LoRA-7B (LoRA model)]
    • [Chinese-LLaMA-2-13B (full model)]
    • [Chinese-LLaMA-2-LoRA-13B (LoRA model)]
  • 指令/对话模型
    • [Chinese-Alpaca-2-7B (full model)]
    • [Chinese-Alpaca-2-LoRA-7B (LoRA model)]
    • [Chinese-Alpaca-2-13B (full model)]
    • [Chinese-Alpaca-2-LoRA-13B (LoRA model)]

Chinese-LLaMA-Alpaca-2 说明

本项目基于Meta发布的Llama-2,是中文LLaMA & Alpaca大语言模型项目的第二代。我们开源了中文LLaMA-2(基础模型)和Alpaca-2(指令跟随模型)。这些模型在原始Llama-2的基础上扩展并优化了中文词汇表。我们使用大规模中文数据进行增量预训练,进一步提升了对中文语言的基础语义理解能力,与第一代模型相比性能有显著提升。相关模型支持4K上下文长度,并可通过NTK方法扩展至18K+。

本项目的主要内容包括:

  • 🚀 在Llama-2基础上新增扩展中文词汇表,开源中文LLaMA-2和Alpaca-2大语言模型。
  • 🚀 开源预训练和指令微调(SFT)脚本,方便用户在自有数据上进一步调优。
  • 🚀 在个人电脑的CPU/GPU上快速部署和体验量化后的大语言模型。
  • 🚀 支持🤗transformers、llama.cpp、text-generation-webui、LangChain、vLLM等LLaMA生态系统工具。

详细信息请参考https://github.com/ymcui/Chinese-LLaMA-Alpaca-2/。