| 组件 | 版本 |
|---|---|
| torch | 2.9.0 |
| torch-npu | 2.9.0.post1 |
| CANN | 8.5.1 |
| NPU | Ascend 910B4 |
| 指标 | 数值 |
|---|---|
| 余弦相似度 | 0.999987 |
| 精度误差 | 0.0013% |
| 是否满足要求 | 是(< 1%)✅ |
| 指标 | 数值 |
|---|---|
| 平均延迟 | 3.56 毫秒 |
| 峰值显存 | 0.058 GB |
在 NPU 上运行 python3 adapter.py --model_id pyannote/wespeaker-voxceleb-resnet34-LM 的实际输出:
[1/5] 加载模型: pyannote/wespeaker-voxceleb-resnet34-LM
模型路径: /opt/atomgit/.cache/modelscope/hub/models/pyannote/wespeaker-voxceleb-resnet34-LM
加载权重: 6,634,336 参数
[2/5] 迁移到 NPU
迁移到 npu:0, 精度: torch.float16
[3/5] 准备测试输入
[4/5] 运行推理验证
[5/5] 性能基准测试
[额外] CPU vs NPU 精度对比
运行 NPU 推理...
运行 CPU 推理...
模型路径: /opt/atomgit/.cache/modelscope/hub/models/pyannote/wespeaker-voxceleb-resnet34-LM
加载权重: 6,634,336 参数
✓ 适配成功
model_id: pyannote/wespeaker-voxceleb-resnet34-LM
timestamp: 2026-05-15 15:57:09
device: npu:0
dtype: torch.float16
param_count: 6634336
output_shape: [1, 256]
has_nan: False
avg_latency_ms: 3.55985164642334
peak_hbm_gb: 0.057747840881347656
n_runs: 10
cosine_similarity: 0.9999872446060181
status: SUCCESS输出形状: [1, 256],无 NaN,推理正常。
cd wave1/1d_small_audio
python3 adapter.py --model_id pyannote/wespeaker-voxceleb-resnet34-LM贡献者: xujiashuai | 赛道: 模型适配赛道