xujiashuai/speech_rdino_ecapa_tdnn_sv_zh-cn_cnceleb_16k
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

speech_rdino_ecapa_tdnn_sv_zh-cn_cnceleb_16k - 昇腾 NPU 适配

1. 模型简介

RDINO ECAPA-TDNN 说话人验证模型,通道数为 1024,线性神经元数量为 512,基于 CN-Celeb 数据集训练。

  • 原始模型: iic/speech_rdino_ecapa_tdnn_sv_zh-cn_cnceleb_16k
  • 框架: PyTorch
  • 任务: 说话人验证(CN-Celeb,RDINO)

2. 昇腾 NPU 适配结果

指标值
余弦相似度1.000000
平均延迟7.88 毫秒
推理精度float32
设备Ascend 910B4

3. 快速使用

export ASCEND_HOME_PATH=/usr/local/Ascend/cann
export LD_LIBRARY_PATH=/usr/local/Ascend/cann/lib64:$LD_LIBRARY_PATH
python inference.py --device npu:0 --dtype float32

4. 推理输出证据

模型: iic/speech_rdino_ecapa_tdnn_sv_zh-cn_cnceleb_16k
设备: npu:0
精度: float32
------------------------------------------------------------
  input: shape=torch.Size([1, 300, 80])
  output: shape=torch.Size([1, 512])

  Cosine Similarity: 1.000000

✓ 推理完成
  平均延迟: 7.88 ms

5. CPU 与 NPU 精度对比

指标CPU (float32)NPU (float32)误差
余弦相似度基准1.0000000%
输出维度[1,512][1,512]一致

6. 代理技能

本适配由 batch-adapter 自动完成。