| 组件 | 版本 |
|---|---|
| torch | 2.9.0 |
| torch-npu | 2.9.0.post1 |
| CANN | 8.5.1 |
| NPU | Ascend 910B4 |
| 指标 | 数值 |
|---|---|
| 余弦相似度 | 0.999952 |
| 精度误差 | 0.0048% |
| 是否满足要求 | 是(< 1%)✅ |
| 指标 | 数值 |
|---|---|
| 平均延迟 | 19.95 ms |
| 峰值显存 | 0.044 GB |
在 NPU 上运行 python3 adapter.py --model_id iic/speech_campplus_sv_zh-cn_16k-common 的实际输出:
[1/5] 加载模型: iic/speech_campplus_sv_zh-cn_16k-common
模型路径: /opt/atomgit/.cache/modelscope/hub/models/iic/speech_campplus_sv_zh-cn_16k-common
加载权重: 6,848,544 参数
[2/5] 迁移到 NPU
迁移到 npu:0, 精度: torch.float16
[3/5] 准备测试输入
[4/5] 运行推理验证
[5/5] 性能基准测试
[额外] CPU vs NPU 精度对比
运行 NPU 推理...
运行 CPU 推理...
模型路径: /opt/atomgit/.cache/modelscope/hub/models/iic/speech_campplus_sv_zh-cn_16k-common
加载权重: 6,848,544 参数
✓ 适配成功
model_id: iic/speech_campplus_sv_zh-cn_16k-common
timestamp: 2026-05-15 16:20:52
device: npu:0
dtype: torch.float16
param_count: 6848544
output_shape: [1, 192]
has_nan: False
avg_latency_ms: 19.954943656921387
peak_hbm_gb: 0.04442787170410156
n_runs: 10
cosine_similarity: 0.9999516010284424
status: SUCCESS输出形状: [1, 192],无 NaN,推理正常。
cd wave1/1d_small_audio
python3 adapter.py --model_id iic/speech_campplus_sv_zh-cn_16k-common贡献者: xujiashuai | 赛道: 模型适配赛道