xujiashuai/qwen3-0.6b
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

qwen3-0.6b 在昇腾 NPU 上的适配

1. 简介

  • 模型来源:Qwen/Qwen3-0.6B
  • 参数量:596,049,920
  • 适配状态:成功
  • 适配时间:2026-05-15 03:26:11

2. 验证环境

组件版本
torch2.9.0
torch-npu2.9.0.post1
transformers4.57.6
CANN8.5.1
NPUAscend 910B4

3. 精度评测

指标数值
余弦相似度1.000810
精度误差0.0810%
是否满足要求是(< 1%)✅

精度截图

4. 性能

指标数值
平均延迟39.12 毫秒
峰值显存1.41 GB

5. 复现步骤

python3 evaluate.py --model-id Qwen/Qwen3-0.6B --device npu:0 --output report.json
python3 inference.py --model-id Qwen/Qwen3-0.6B --device npu:0

贡献者: xujiashuai | 赛道: 模型适配赛道