本文档记录 iic/nlp_mt5_dialogue-rewriting_chinese-base 在昇腾 NPU 上的适配验证结果。
| 组件 | 版本 |
|---|---|
torch | 2.9.0 |
torch-npu | 2.9.0.post1 |
transformers | 4.57.6 |
CANN | 8.5.1 |
python inference.py --model-id iic/nlp_mt5_dialogue-rewriting_chinese-base --device npu:0 --dtype float32功能验证结果:
| 指标 | 结果 |
|---|---|
| Encoder 输出形状 | [1, 128, 768] |
| 是否有 NaN | 否 |
| 推理状态 | 正常 |
推理输出示例:
用户: 你好\n助手: 你好,请问有什么可以帮助您的吗?\n用户: 我想查一下明天的天气我想查一下明天的天气| 指标 | 数值 |
|---|---|
| Encoder 平均延迟 | 10.46 ms |
| 测试轮数 | 10 |
NPU vs CPU 精度对比 (float32, Encoder Hidden States)
| 指标 | 数值 |
|---|---|
| Cosine Similarity | 1.000001 |
| Max Abs Error | 0.000002 |
| 精度误差 | < 0.0001% |
| 是否满足要求 | 是(< 1%) |
| 材料 | 文件 | 说明 |
|---|---|---|
| 推理脚本 | inference.py | 独立可运行的 NPU 推理代码 |
贡献者: xujiashuai 参赛赛道: 模型适配赛道 提交时间: 2026-05-17