o
openharmony-models
/
openPangu-R-72B-2512-Int8
like
0
添加到合集
Transformers
Safetensors
Other
模型介绍
文件和版本
Pull Requests
讨论
分析
下载
Notebook 快速开发
返回讨论列表
仅管理员可管理讨论分类。
讨论分类列表 - openPangu-R-72B-2512-Int8:openPangu-R-72B-2512-Int8 是 openPangu-R-72B-2512 的量化版本,使用动态 per-token 量化方法,能够减少约一半的显存占用,提升超20%吞吐,综合精度损失小于1%。 - AtomGit AI社区