xujiashuai/qwen2.5-0.5b
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

qwen2.5-0.5b 在昇腾 NPU 上的适配

1. 简介

  • 模型来源:Qwen/Qwen2.5-0.5B
  • 参数量:494,032,768
  • 适配状态:成功
  • 适配时间:2026-05-15 03:21:03

2. 验证环境

组件版本
torch2.9.0
torch-npu2.9.0.post1
transformers4.57.6
CANN8.5.1
NPUAscend 910B4

3. 精度评测

指标数值
余弦相似度1.000692
精度误差0.0692%
是否满足要求是(< 1%)✅

精度截图

4. 性能

指标数值
平均延迟26.49 ms
峰值显存1.15 GB

5. 复现步骤

python3 evaluate.py --model-id Qwen/Qwen2.5-0.5B --device npu:0 --output report.json
python3 inference.py --model-id Qwen/Qwen2.5-0.5B --device npu:0

贡献者: xujiashuai | 赛道: 模型适配赛道