xujiashuai/qwen2.5-1.5b
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

qwen2.5-1.5b 在昇腾 NPU 上的适配

1. 简介

  • 模型来源:Qwen/Qwen2.5-1.5B
  • 参数量:1,543,714,304
  • 适配状态:成功(SUCCESS)
  • 适配时间:2026-05-15 03:23:00

2. 验证环境

组件版本
torch2.9.0
torch-npu2.9.0.post1
transformers4.57.6
CANN8.5.1
NPUAscend 910B4

3. 精度评测

指标数值
余弦相似度(Cosine Similarity)1.000566
精度误差0.0566%
是否满足要求是(< 1%)✅

精度截图

4. 性能

指标数值
平均延迟31.76 ms
峰值显存3.25 GB

5. 复现步骤

python3 evaluate.py --model-id Qwen/Qwen2.5-1.5B --device npu:0 --output report.json
python3 inference.py --model-id Qwen/Qwen2.5-1.5B --device npu:0

贡献者: xujiashuai | 赛道: 模型适配赛道