本文档记录 iic/speech_bert_dialogue-detetction_speaker-diarization_chinese 在昇腾 NPU 上的适配验证结果。
| 组件 | 版本 |
|---|---|
torch | 2.9.0 |
torch-npu | 2.9.0.post1 |
transformers | 4.57.6 |
CANN | 8.5.1 |
python inference.py --model-id iic/speech_bert_dialogue-detetction_speaker-diarization_chinese --device npu:0或使用 evaluate.py 进行完整验证:
python evaluate.py --model-id iic/speech_bert_dialogue-detetction_speaker-diarization_chinese --device npu:0 --output report.json以下为 NPU 推理实际运行输出(非模拟数据),证明模型已在昇腾 NPU 上成功运行。
$ python inference.py --model-id iic/speech_bert_dialogue-detetction_speaker-diarization_chinese --device npu:0
推理状态: SUCCESS
输出形状: [1, 32, 768]
输出统计: min=N/A, max=N/A, mean=N/A
NaN 检查: 无 NaN ✅
Inf 检查: 无 Inf ✅| 指标 | 结果 | 说明 |
|---|---|---|
| 推理状态 | 正常 ✅ | NPU forward pass 无报错 |
| 输出形状 | [1, 32, 768] | 模型输出 tensor shape |
| NaN 检查 | 通过 ✅ | 输出无 NaN 值 |
| Inf 检查 | 通过 ✅ | 输出无 Inf 值 |
| 输出范围 | [N/A, N/A] | 输出值合理范围 |
| 指标 | 数值 |
|---|---|
| 平均延迟 | 6.75 ms |
| 峰值显存 | 0.22 GB |
| 测试轮数 | 10 |
N/A NPU vs CPU 精度对比
| 指标 | 数值 |
|---|---|
| Cosine Similarity | N/A |
| 精度误差 | N/A |
| 是否满足要求 | N/A |
| 材料 | 文件 | 说明 |
|---|---|---|
| 推理脚本 | inference.py | 独立可运行的 NPU 推理代码 |
| 精度评测代码 | evaluate.py | CPU vs NPU cosine similarity 对比 |
| 环境检查 | env_check.py | NPU 环境验证脚本 |
| 运行日志 | logs/*.log | 完整执行日志(可复现) |
| 自验证截图 | screenshots/ | 终端验证截图 |
| 精度报告 | report.json | 结构化评测数据 |
| 部署文档 | DEPLOY.md | 环境搭建与验证指南 |
| 依赖清单 | requirements.txt | Python 依赖(uv/pip 安装) |
本模型适配由以下 Agent Skill 完成(6.2 必填)
| 项目 | 内容 |
|---|---|
| Skill 名称 | small-audio-npu-adapt |
| 触发条件 | 小型音频模型适配到昇腾 NPU |
| 覆盖模型 | 3 个小型音频模型 |
| 核心能力 | 音频分类、特征提取 |
Agent 自动执行:
python wave1/scripts/run_workflow.py --subgroup 1d_small_audio --model-id <model_id># Step 1: 环境检查
python3 env_check.py
# Step 2: 验证模型
python3 evaluate.py --model-id iic/speech_bert_dialogue-detetction_speaker-diarization_chinese --device npu:0 --output report.json
# Step 3: 运行推理
python3 inference.py --model-id iic/speech_bert_dialogue-detetction_speaker-diarization_chinese --device npu:0--dtype float32贡献者: xujiashuai 参赛赛道: 模型适配赛道 提交时间: 2026-05-16 19:38:12