HuggingFace镜像/llm-jp-13b-v2.0
模型介绍文件和版本分析
下载使用量0

llm-jp-13b-v2.0

所需库及其版本

  • torch>=2.3.0
  • transformers>=4.40.1
  • tokenizers>=0.19.1
  • accelerate>=0.29.3
  • flash-attn>=2.5.8

使用方法

python3 examples/inference.py --model_name_or_path=./

模型详情

  • 模型类型:基于Transformer的语言模型
  • 总可见 tokens:2560亿
模型参数规模层数隐藏层大小注意力头数上下文长度
13b model130亿405120404096

风险与局限性

此处发布的模型仍处于我们研发的早期阶段,尚未经过优化以确保输出内容符合人类意图及安全考量。

问题咨询方式

llm-jp(at)nii.ac.jp

模型卡片作者

姓名按字母顺序排列。

Namgi Han、Tatsuya Hiraoka、Hirokazu Kiyomaru、Takashi Kodama 及 Hiroshi Matsuda。