s
ssclove/wav2vec2-xlsr-53-arabic
模型介绍文件和版本Pull Requests讨论分析

wav2vec2-large-xlsr-53-arabic on Ascend NPU

1. 简介

本文档记录 jonatasgrosman/wav2vec2-large-xlsr-53-arabic 在昇腾 NPU 上的适配验证结果。

  • 模型来源: jonatasgrosman/wav2vec2-large-xlsr-53-arabic
  • 适配状态: SUCCESS
  • 适配时间: 2026-05-23

2. 验证环境

组件版本
torch2.9.0
torch-npu2.9.0.post1
transformers4.57.6
CANN8.5.1
  • NPU: Ascend 910B4
  • 系统: Ubuntu 22.04.5 LTS (aarch64)

3. 推理脚本

python inference.py --model-id jonatasgrosman/wav2vec2-large-xlsr-53-arabic --device npu:0

4. Smoke 验证

指标结果
输出形状[1, 249, 51]
推理状态SUCCESS ✅

5. 推理正常输出证据

模型任务: 语音识别/处理

输出说明: 模型输出 [1, 249, 51] 的特征张量,用于语音识别或特征提取。

NPU 推理输出:

输出形状: [1, 249, 51]
数据类型: torch.float32
包含 NaN: False
包含 Inf: False

输出合理性验证:

  • 输出维度正确,符合模型架构设计
  • 无 NaN/Inf 异常值
  • NPU vs CPU Cosine Similarity = 0.9999735951423645,精度完全一致

结论: NPU 推理输出与 CPU 一致,模型在昇腾 NPU 上运行正常 ✅

6. 性能参考

指标数值
平均延迟12.63878345489502 ms

7. 精度评测

✅ NPU vs CPU 精度对比

指标数值
Cosine Similarity0.9999735951423645
精度误差0.0026%
是否满足要求是(< 1%)✅

8. 评测材料

材料文件说明
推理脚本inference.pyNPU 推理代码
精度报告report.json结构化评测数据

9. 注意事项

  • 首次运行需要从 HuggingFace 下载模型权重
  • 建议在 NPU 设备上运行以获得最佳性能

参赛赛道: 模型适配赛道 提交时间: 2026-05-23

下载使用量0