xujiashuai/timm-deepseek-ai_DeepSeek-R1-Distill-Qwen-1.5B
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

DeepSeek-R1-Distill-Qwen-1.5B 在昇腾 NPU 上的部署

1. 简介

  • 模型来源:deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B
  • 架构:Qwen2ForCausalLM
  • 参数量:约 1.5B
  • 适配状态:SUCCESS

2. 验证环境

组件版本
torch2.9.0
torch-npu2.9.0.post1
CANN8.5.1
NPUAscend 910B4

3. 推理输出证据

Cosine Similarity: 1.000023
Output shape: [1, 7, 151936]
Max Abs Error: 0.055592

4. CPU 与 NPU 精度对比

指标数值
余弦相似度1.000023
最大绝对误差0.055592
输出形状[1, 7, 151936]
是否满足要求✅ 是(余弦相似度 ≈ 1.0)

5. 性能

指标数值
精度float16

贡献者: xujiashuai | 赛道: 模型适配赛道