2502_90723166/GLM-5.1-w8a8
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

GLM-5.1-w8a8

这是GLM-5.1-w8a8的模型卡片。

模型详情

属性值
架构GlmMoeDsaForCausalLM
模型类型deepseek_v2
隐藏层大小6144
注意力头数64
层数78
路由专家数256
每令牌专家数8
最大位置嵌入202752
量化方式FP8(W8A8,动态,e4m3)
词汇表大小154880
库transformers

量化配置

  • 量化方法: fp8
  • 激活方案: 动态
  • 格式: e4m3

模型摘要

GLM-5.1-w8a8是一个采用FP8 W8A8量化的混合专家(MoE)因果语言模型。