HuggingFace镜像/chinese-llama-2-1.3b
模型介绍文件和版本分析
下载使用量0

Chinese-LLaMA-2-1.3B

这是完整的 Chinese-LLaMA-2-1.3B 模型,可直接加载用于推理和全参数训练。

相关模型👇

  • 长上下文基础模型(16K)
    • [Chinese-LLaMA-2-7B-16K (full model)]
    • [Chinese-LLaMA-2-LoRA-7B-16K (LoRA model)]
    • [Chinese-LLaMA-2-13B-16K (full model)]
    • [Chinese-LLaMA-2-LoRA-13B-16K (LoRA model)]
  • 长上下文指令/对话模型
    • [Chinese-Alpaca-2-7B-16K (full model)]
    • [Chinese-Alpaca-2-LoRA-7B-16K (LoRA model)]
    • [Chinese-Alpaca-2-13B-16K (full model)]
    • [Chinese-Alpaca-2-LoRA-13B-16K (LoRA model)]
  • 基础模型
    • [Chinese-LLaMA-2-7B (full model)]
    • [Chinese-LLaMA-2-LoRA-7B (LoRA model)]
    • [Chinese-LLaMA-2-13B (full model)]
    • [Chinese-LLaMA-2-LoRA-13B (LoRA model)]
  • 指令/对话模型
    • [Chinese-Alpaca-2-7B (full model)]
    • [Chinese-Alpaca-2-LoRA-7B (LoRA model)]
    • [Chinese-Alpaca-2-13B (full model)]
    • [Chinese-Alpaca-2-LoRA-13B (LoRA model)]

Chinese-LLaMA-Alpaca-2 说明

本项目基于 Meta 发布的 Llama-2,是中文 LLaMA & Alpaca 大语言模型项目的第二代。我们开源了 Chinese LLaMA-2(基础模型)和 Alpaca-2(指令跟随模型)。这些模型在原始 Llama-2 的基础上扩展并优化了中文词汇表。我们使用大规模中文数据进行增量预训练,进一步提升了对中文语言的基础语义理解能力,与第一代模型相比性能有显著提升。相关模型支持 4K 上下文长度,并可通过 NTK 方法扩展至 18K+。

本项目主要内容包括:

  • 🚀 在 Llama-2 基础上新增扩展中文词汇表,开源 Chinese LLaMA-2 和 Alpaca-2 大语言模型。
  • 🚀 开源预训练和指令微调(SFT)脚本,方便用户在自有数据上进一步调优。
  • 🚀 可在个人电脑的 CPU/GPU 上快速部署和体验量化后的大语言模型。
  • 🚀 支持 LLaMA 生态系统,如 🤗transformers、llama.cpp、text-generation-webui、LangChain、vLLM 等。

详情请参考 https://github.com/ymcui/Chinese-LLaMA-Alpaca-2/。