HuggingFace镜像/Vicuna-7B
模型介绍文件和版本分析
下载使用量0

Vicuna 模型卡片

模型详情

Vicuna 是一款聊天助手,通过在从 ShareGPT 收集的用户共享对话上对 Llama 2 进行微调训练而成。

  • 开发机构: LMSYS
  • 模型类型: 基于 Transformer 架构的自回归语言模型
  • 许可证: Llama 2 社区许可协议
  • 微调基础模型: Llama 2

模型来源

  • 代码仓库: https://github.com/lm-sys/FastChat
  • 博客: https://lmsys.org/blog/2023-03-30-vicuna/
  • 论文: https://arxiv.org/abs/2306.05685
  • 演示: https://chat.lmsys.org/

用途

Vicuna 的主要用途是用于大型语言模型和聊天机器人的相关研究。 该模型的主要目标用户是自然语言处理、机器学习和人工智能领域的研究人员与爱好者。

模型使用入门

  • 命令行界面:https://github.com/lm-sys/FastChat#vicuna-weights

训练详情

Vicuna v1.5 是在 Llama 2 的基础上,通过有监督指令微调进行训练的。 训练数据为从 ShareGPT.com 收集的约 125K 条对话。 更多详情请参见本论文附录中的“Vicuna 模型训练详情”部分。

评估

评估结果

Vicuna 通过标准基准测试、人类偏好评估和 LLM 作为评判者等方式进行评估。更多详情请参见本论文和[排行榜]。

不同版本 Vicuna 之间的差异

详见 vicuna_weights_version.md