xujiashuai/wav2vec2-xlsr-53-spanish
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

wav2vec2-xlsr-53-spanish - Ascend NPU 适配

1. 模型信息

  • 模型: jonatasgrosman/wav2vec2-large-xlsr-53-spanish
  • 来源: HuggingFace
  • 任务: 语音识别 (ASR)
  • 语言: 西班牙语

2. 昇腾 NPU 适配结果

指标值
设备Ascend 910B4
精度float16
Cosine Similarity0.999997
Max Absolute Error0.068655
NPU 推理时间13.25ms

3. 推理脚本

python3 inference.py --device npu:0 --dtype float16

4. 推理输出证据

============================================================
模型: jonatasgrosman/wav2vec2-large-xlsr-53-spanish
设备: npu:0
精度: float16
============================================================

[使用合成音频输入 (5秒, 16kHz)]

输入形状: torch.Size([1, 80000])

--- CPU 推理 ---
  输出形状: torch.Size([1, 249, 41])
  识别结果: ""

--- NPU 推理 (npu:0) ---
  输出形状: torch.Size([1, 249, 41])
  识别结果: ""

--- 精度对比 ---
  Cosine Similarity: 0.999997
  Max Abs Error: 0.068655
  CPU 识别: ""
  NPU 识别: ""
  结果一致: 是

--- 性能测试 ---
  平均延迟: 13.25 ms (10次)

============================================================
✓ 推理完成

5. 精度校验

CPU 与 NPU 推理结果对比:

  • Cosine Similarity: 0.999997 (> 0.99 通过)
  • Max Absolute Error: 0.068655
  • 推理结果一致: 是