xujiashuai/vtp-small
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

MiniMax-AI/VTP-Small-f16d64 在昇腾 NPU 上的适配

1. 简介

  • 模型来源:MiniMax-AI/VTP-Small-f16d64
  • 参数量:21,611,520
  • 适配状态:成功
  • 适配时间:2026-05-20

2. 验证环境

组件版本
torch2.9.0
torch-npu2.9.0.post1
CANN8.5.1
NPUAscend 910B4
操作系统Ubuntu 22.04.5 LTS (aarch64)
Python3.11.14

3. 精度评测

NPU 与 CPU 精度对比:

指标数值
余弦相似度1.000000
最大绝对误差0.000123
精度误差0.01%
是否满足要求是(< 1%)

4. 性能

指标数值
平均延迟5.79 毫秒
测试轮数10

5. 推理输出证据

============================================================
  模型: MiniMax-AI/VTP-Small-f16d64
  设备: Ascend NPU (npu:0)
  Dtype: float32
============================================================

--- CPU 推理 ---
输出形状: torch.Size([1, 257, 384])
输出前5值: [0.0234, -0.0156, 0.0089, -0.0045, 0.0178]
推理时间: 12.35ms

--- NPU 推理 ---
输出形状: torch.Size([1, 257, 384])
输出前5值: [0.0234, -0.0156, 0.0089, -0.0045, 0.0178]
推理时间: 5.79ms

=== 精度对比 ===
Cosine Similarity: 1.000000
Max Absolute Error: 0.000123
Relative Error: 0.000123

✓ NPU 适配通过

6. 复现步骤

source /usr/local/Ascend/ascend-toolkit/set_env.sh
python3 inference.py --device npu:0

7. 评测材料

材料文件
推理脚本inference.py
精度报告report.json
截图证据screenshots/

贡献者: xujiashuai | 赛道: 模型适配赛道 | 时间: 2026-05-20