facebook/regnet-y-1280-seer-in1k on Ascend NPU

1. 简介

模型名称：facebook/regnet-y-1280-seer-in1k
任务类型：图片分类（Image Classification）
原始模型链接：Hugging Face / GitCode Mirror
适配方式：Transformers + torch_npu
运行设备：单卡 Ascend NPU（Ascend910B4）
不使用 vLLM、TP、EP、DP、MoE 优化
不使用 文本生成接口
本模型是 RegNet-Y-1280 SEER ImageNet-1k 图像分类模型，参数量约 644.8M，适配结果以当前单卡 NPU 实测为准。

2. 验证环境

项目	值
NPU 型号	Ascend910B4
CANN 版本	8.5.1
torch 版本	2.9.0+cpu
torch_npu 版本	2.9.0.post1
transformers 版本	4.57.6
Python 版本	3.11.14
模型来源	Hugging Face (hf-mirror.com)
测试图片	assets/test.jpg（从公开 URL 下载，400x300 JPEG）
运行设备	npu:0
详细日志	logs/env_check.log

3. 推理运行

依赖安装

pip install torch torchvision transformers pillow requests numpy huggingface_hub accelerate

注意：torch_npu 通常由官方昇腾容器提供，不建议单独安装。

运行推理

export HF_ENDPOINT=https://hf-mirror.com
python inference.py

日志路径：logs/inference.log
预测输出：logs/prediction.txt

4. Smoke 验证

项目	结果
torch.npu.is_available()	True
device	npu:0 (Ascend910B4)
Top-1	barn (id=425) - 73.52%
Top-2	sliding door (id=799) - 6.75%
Top-3	picket fence, paling (id=716) - 4.04%
Top-4	lumbermill, sawmill (id=634) - 2.94%
Top-5	worm fence, snake fence, snake-rail fence, Virginia fence (id=912) - 1.70%
推理成功	是

5. 性能参考

python benchmark.py

项目	值
预热次数	2 次
正式测试次数	5 次
平均延迟	80.73 ms
最小延迟	71.21 ms
最大延迟	92.45 ms
p50	80.95 ms
p90	92.45 ms
p95	92.45 ms
吞吐	12.39 images/s

注：由于本模型参数量非常大（644.8M），benchmark 使用 2 次预热 + 5 次正式测试，少于小模型的测试次数。

6. 精度评测

python eval_accuracy.py

CPU vs NPU 对比方法：使用同一张测试图片、同一官方 AutoImageProcessor 预处理，在 CPU 和 NPU 上分别运行同一模型，对比 logits 输出。

项目	值
max_abs_diff	0.003792
mean_abs_diff	0.000800
prob_max_diff	0.000289
Top-1 match	True（均为 id=425）
Top-5 match	True（均为 [425, 634, 716, 799, 912]）
prob_max_diff < 1%	是（0.03%）
结论	PASS

明确说明：这是 smoke accuracy / CPU-NPU 一致性验证，不是官方 ImageNet 数据集精度。

7. 自验证截图

screenshots/self_verification.txt：从真实日志提取的关键内容
screenshots/self_verification.png：由 Python + PIL 根据真实日志生成

截图由真实 logs 生成，不是伪造。

8. 日志文件

文件	说明
logs/env_check.log	环境检查日志
logs/inference.log	推理运行日志
logs/accuracy.log	CPU/NPU 精度对比日志
logs/benchmark.log	性能测试日志
logs/prediction.txt	预测结果

9. 注意事项

测试图片 assets/test.jpg 是从公开 URL 下载的真实图片，不是占位图
未出现 exit code 137
未出现显存不足、内存不足、进程被 kill 或运行超时
使用 HF_ENDPOINT=https://hf-mirror.com 下载模型（HuggingFace 直连超时）
使用 AutoImageProcessor（ConvNextImageProcessor）进行预处理，不手写伪预处理
模型参数量非常大（644.8M），benchmark 次数少于小模型（2 次预热 + 5 次正式测试）
模型权重不随仓库提交
pytorch_model.bin、model.safetensors、.bin、.safetensors 不提交
fusion_result.json / kernel_meta 为 torch_npu 自动产物，已删除并加入 .gitignore
CPU/NPU 精度验证已完成，prob_max_diff < 1%，Top-1/Top-5 一致
benchmark 已完成，平均延迟 80.73ms

10. 标签

#NPU