xujiashuai/bloom-560m
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

bloom-560m 在昇腾 NPU 上的部署

1. 简介

  • 模型来源: AI-ModelScope/bloom-560m
  • 参数量: 559,214,592
  • 适配状态: 成功
  • 适配时间: 2026-05-15 03:27:33

2. 验证环境

组件版本
torch2.9.0
torch-npu2.9.0.post1
transformers4.57.6
CANN8.5.1
NPUAscend 910B4

3. 精度评测

指标数值
余弦相似度1.003129
精度误差0.3129%
是否满足要求是(< 1%)✅

精度截图

4. 性能

指标数值
平均延迟17.87 毫秒
峰值显存1.24 GB

5. 复现步骤

python3 evaluate.py --model-id AI-ModelScope/bloom-560m --device npu:0 --output report.json
python3 inference.py --model-id AI-ModelScope/bloom-560m --device npu:0

贡献者: xujiashuai | 赛道: 模型适配赛道