xujiashuai/wespeaker-resnet34
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

wespeaker-resnet34 在昇腾 NPU 上的适配

1. 简介

  • 模型来源:pyannote/wespeaker-voxceleb-resnet34-LM
  • 参数量:6,634,336
  • 适配状态:成功
  • 适配时间:2026-05-15 15:57:09

2. 验证环境

组件版本
torch2.9.0
torch-npu2.9.0.post1
CANN8.5.1
NPUAscend 910B4

3. 精度评测

指标数值
余弦相似度0.999987
精度误差0.0013%
是否满足要求是(< 1%)✅

4. 性能

指标数值
平均延迟3.56 毫秒
峰值显存0.058 GB

5. 复现步骤

5. 推理输出示例

在 NPU 上运行 python3 adapter.py --model_id pyannote/wespeaker-voxceleb-resnet34-LM 的实际输出:

[1/5] 加载模型: pyannote/wespeaker-voxceleb-resnet34-LM
  模型路径: /opt/atomgit/.cache/modelscope/hub/models/pyannote/wespeaker-voxceleb-resnet34-LM
  加载权重: 6,634,336 参数
[2/5] 迁移到 NPU
  迁移到 npu:0, 精度: torch.float16
[3/5] 准备测试输入
[4/5] 运行推理验证
[5/5] 性能基准测试
[额外] CPU vs NPU 精度对比
  运行 NPU 推理...
  运行 CPU 推理...
  模型路径: /opt/atomgit/.cache/modelscope/hub/models/pyannote/wespeaker-voxceleb-resnet34-LM
  加载权重: 6,634,336 参数
✓ 适配成功

  model_id: pyannote/wespeaker-voxceleb-resnet34-LM
  timestamp: 2026-05-15 15:57:09
  device: npu:0
  dtype: torch.float16
  param_count: 6634336
  output_shape: [1, 256]
  has_nan: False
  avg_latency_ms: 3.55985164642334
  peak_hbm_gb: 0.057747840881347656
  n_runs: 10
  cosine_similarity: 0.9999872446060181
  status: SUCCESS

输出形状: [1, 256],无 NaN,推理正常。

6. 复现步骤

cd wave1/1d_small_audio
python3 adapter.py --model_id pyannote/wespeaker-voxceleb-resnet34-LM

贡献者: xujiashuai | 赛道: 模型适配赛道