xujiashuai/timm-Qwen_Qwen3-1.7B
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

在昇腾NPU上部署Qwen3-1.7B

1. 简介

  • 模型来源:Qwen/Qwen3-1.7B
  • 架构:Qwen3ForCausalLM
  • 参数量:约17亿
  • 适配状态:成功

2. 验证环境

组件版本
torch2.9.0
torch-npu2.9.0.post1
CANN8.5.1
NPUAscend 910B4

3. 推理输出证据

Cosine Similarity: 0.999995
Output shape: [1, 6, 151936]
Max Abs Error: 0.156764

4. CPU 与 NPU 精度对比

指标数值
余弦相似度0.999995
最大绝对误差0.156764
输出形状[1, 6, 151936]
是否满足要求✅ 是(余弦相似度 ≈ 1.0)

5. 性能

指标数值
精度float16

贡献者: xujiashuai | 赛道: 模型适配赛道