| 项目 | 值 |
|---|---|
| NPU 型号 | Ascend910B4 |
| CANN 版本 | 8.5.1 |
| torch 版本 | 2.9.0+cpu |
| torch_npu 版本 | 2.9.0.post1 |
| transformers 版本 | 4.57.6 |
| Python 版本 | 3.11.14 |
| 模型来源 | Hugging Face (hf-mirror.com) |
| 测试图片 | assets/test.jpg(从公开 URL 下载,400x300 JPEG) |
| 运行设备 | npu:0 |
| 详细日志 | logs/env_check.log |
pip install torch torchvision transformers pillow requests numpy huggingface_hub accelerate注意:torch_npu 通常由官方昇腾容器提供,不建议单独安装。
export HF_ENDPOINT=https://hf-mirror.com
python inference.py| 项目 | 结果 |
|---|---|
| torch.npu.is_available() | True |
| device | npu:0 (Ascend910B4) |
| Top-1 | barn (id=425) - 73.52% |
| Top-2 | sliding door (id=799) - 6.75% |
| Top-3 | picket fence, paling (id=716) - 4.04% |
| Top-4 | lumbermill, sawmill (id=634) - 2.94% |
| Top-5 | worm fence, snake fence, snake-rail fence, Virginia fence (id=912) - 1.70% |
| 推理成功 | 是 |
python benchmark.py| 项目 | 值 |
|---|---|
| 预热次数 | 2 次 |
| 正式测试次数 | 5 次 |
| 平均延迟 | 80.73 ms |
| 最小延迟 | 71.21 ms |
| 最大延迟 | 92.45 ms |
| p50 | 80.95 ms |
| p90 | 92.45 ms |
| p95 | 92.45 ms |
| 吞吐 | 12.39 images/s |
注:由于本模型参数量非常大(644.8M),benchmark 使用 2 次预热 + 5 次正式测试,少于小模型的测试次数。
python eval_accuracy.pyCPU vs NPU 对比方法:使用同一张测试图片、同一官方 AutoImageProcessor 预处理,在 CPU 和 NPU 上分别运行同一模型,对比 logits 输出。
| 项目 | 值 |
|---|---|
| max_abs_diff | 0.003792 |
| mean_abs_diff | 0.000800 |
| prob_max_diff | 0.000289 |
| Top-1 match | True(均为 id=425) |
| Top-5 match | True(均为 [425, 634, 716, 799, 912]) |
| prob_max_diff < 1% | 是(0.03%) |
| 结论 | PASS |
明确说明:这是 smoke accuracy / CPU-NPU 一致性验证,不是官方 ImageNet 数据集精度。
截图由真实 logs 生成,不是伪造。
| 文件 | 说明 |
|---|---|
| logs/env_check.log | 环境检查日志 |
| logs/inference.log | 推理运行日志 |
| logs/accuracy.log | CPU/NPU 精度对比日志 |
| logs/benchmark.log | 性能测试日志 |
| logs/prediction.txt | 预测结果 |
#NPU