wespeaker-resnet34 在昇腾 NPU 上的适配

1. 简介

模型来源：pyannote/wespeaker-voxceleb-resnet34-LM
参数量：6,634,336
适配状态：成功
适配时间：2026-05-15 15:57:09

2. 验证环境

组件	版本
torch	2.9.0
torch-npu	2.9.0.post1
CANN	8.5.1
NPU	Ascend 910B4

3. 精度评测

指标	数值
余弦相似度	0.999987
精度误差	0.0013%
是否满足要求	是（< 1%）✅

4. 性能

指标	数值
平均延迟	3.56 毫秒
峰值显存	0.058 GB

5. 复现步骤

5. 推理输出示例

在 NPU 上运行 python3 adapter.py --model_id pyannote/wespeaker-voxceleb-resnet34-LM 的实际输出：

[1/5] 加载模型: pyannote/wespeaker-voxceleb-resnet34-LM
  模型路径: /opt/atomgit/.cache/modelscope/hub/models/pyannote/wespeaker-voxceleb-resnet34-LM
  加载权重: 6,634,336 参数
[2/5] 迁移到 NPU
  迁移到 npu:0, 精度: torch.float16
[3/5] 准备测试输入
[4/5] 运行推理验证
[5/5] 性能基准测试
[额外] CPU vs NPU 精度对比
  运行 NPU 推理...
  运行 CPU 推理...
  模型路径: /opt/atomgit/.cache/modelscope/hub/models/pyannote/wespeaker-voxceleb-resnet34-LM
  加载权重: 6,634,336 参数
✓ 适配成功

  model_id: pyannote/wespeaker-voxceleb-resnet34-LM
  timestamp: 2026-05-15 15:57:09
  device: npu:0
  dtype: torch.float16
  param_count: 6634336
  output_shape: [1, 256]
  has_nan: False
  avg_latency_ms: 3.55985164642334
  peak_hbm_gb: 0.057747840881347656
  n_runs: 10
  cosine_similarity: 0.9999872446060181
  status: SUCCESS

输出形状: [1, 256]，无 NaN，推理正常。

6. 复现步骤

cd wave1/1d_small_audio
python3 adapter.py --model_id pyannote/wespeaker-voxceleb-resnet34-LM

贡献者: xujiashuai | 赛道: 模型适配赛道

wespeaker-resnet34 在昇腾 NPU 上的适配

1. 简介

模型来源：pyannote/wespeaker-voxceleb-resnet34-LM
参数量：6,634,336
适配状态：成功
适配时间：2026-05-15 15:57:09

2. 验证环境

组件	版本
torch	2.9.0
torch-npu	2.9.0.post1
CANN	8.5.1
NPU	Ascend 910B4

3. 精度评测

指标	数值
余弦相似度	0.999987
精度误差	0.0013%
是否满足要求	是（< 1%）✅

4. 性能

指标	数值
平均延迟	3.56 毫秒
峰值显存	0.058 GB

5. 复现步骤

5. 推理输出示例

在 NPU 上运行 python3 adapter.py --model_id pyannote/wespeaker-voxceleb-resnet34-LM 的实际输出：

[1/5] 加载模型: pyannote/wespeaker-voxceleb-resnet34-LM
  模型路径: /opt/atomgit/.cache/modelscope/hub/models/pyannote/wespeaker-voxceleb-resnet34-LM
  加载权重: 6,634,336 参数
[2/5] 迁移到 NPU
  迁移到 npu:0, 精度: torch.float16
[3/5] 准备测试输入
[4/5] 运行推理验证
[5/5] 性能基准测试
[额外] CPU vs NPU 精度对比
  运行 NPU 推理...
  运行 CPU 推理...
  模型路径: /opt/atomgit/.cache/modelscope/hub/models/pyannote/wespeaker-voxceleb-resnet34-LM
  加载权重: 6,634,336 参数
✓ 适配成功

  model_id: pyannote/wespeaker-voxceleb-resnet34-LM
  timestamp: 2026-05-15 15:57:09
  device: npu:0
  dtype: torch.float16
  param_count: 6634336
  output_shape: [1, 256]
  has_nan: False
  avg_latency_ms: 3.55985164642334
  peak_hbm_gb: 0.057747840881347656
  n_runs: 10
  cosine_similarity: 0.9999872446060181
  status: SUCCESS

输出形状: [1, 256]，无 NaN，推理正常。

6. 复现步骤

cd wave1/1d_small_audio
python3 adapter.py --model_id pyannote/wespeaker-voxceleb-resnet34-LM

贡献者: xujiashuai | 赛道: 模型适配赛道