g
gyccc/facebook-regnet-y-1280-seer-in1k-NPU
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

facebook/regnet-y-1280-seer-in1k on Ascend NPU

1. 简介

  • 模型名称:facebook/regnet-y-1280-seer-in1k
  • 任务类型:图片分类(Image Classification)
  • 原始模型链接:Hugging Face / GitCode Mirror
  • 适配方式:Transformers + torch_npu
  • 运行设备:单卡 Ascend NPU(Ascend910B4)
  • 不使用 vLLM、TP、EP、DP、MoE 优化
  • 不使用 文本生成接口
  • 本模型是 RegNet-Y-1280 SEER ImageNet-1k 图像分类模型,参数量约 644.8M,适配结果以当前单卡 NPU 实测为准。

2. 验证环境

项目值
NPU 型号Ascend910B4
CANN 版本8.5.1
torch 版本2.9.0+cpu
torch_npu 版本2.9.0.post1
transformers 版本4.57.6
Python 版本3.11.14
模型来源Hugging Face (hf-mirror.com)
测试图片assets/test.jpg(从公开 URL 下载,400x300 JPEG)
运行设备npu:0
详细日志logs/env_check.log

3. 推理运行

依赖安装

pip install torch torchvision transformers pillow requests numpy huggingface_hub accelerate

注意:torch_npu 通常由官方昇腾容器提供,不建议单独安装。

运行推理

export HF_ENDPOINT=https://hf-mirror.com
python inference.py
  • 日志路径:logs/inference.log
  • 预测输出:logs/prediction.txt

4. Smoke 验证

项目结果
torch.npu.is_available()True
devicenpu:0 (Ascend910B4)
Top-1barn (id=425) - 73.52%
Top-2sliding door (id=799) - 6.75%
Top-3picket fence, paling (id=716) - 4.04%
Top-4lumbermill, sawmill (id=634) - 2.94%
Top-5worm fence, snake fence, snake-rail fence, Virginia fence (id=912) - 1.70%
推理成功是

5. 性能参考

python benchmark.py
项目值
预热次数2 次
正式测试次数5 次
平均延迟80.73 ms
最小延迟71.21 ms
最大延迟92.45 ms
p5080.95 ms
p9092.45 ms
p9592.45 ms
吞吐12.39 images/s

注:由于本模型参数量非常大(644.8M),benchmark 使用 2 次预热 + 5 次正式测试,少于小模型的测试次数。

6. 精度评测

python eval_accuracy.py

CPU vs NPU 对比方法:使用同一张测试图片、同一官方 AutoImageProcessor 预处理,在 CPU 和 NPU 上分别运行同一模型,对比 logits 输出。

项目值
max_abs_diff0.003792
mean_abs_diff0.000800
prob_max_diff0.000289
Top-1 matchTrue(均为 id=425)
Top-5 matchTrue(均为 [425, 634, 716, 799, 912])
prob_max_diff < 1%是(0.03%)
结论PASS

明确说明:这是 smoke accuracy / CPU-NPU 一致性验证,不是官方 ImageNet 数据集精度。

7. 自验证截图

  • screenshots/self_verification.txt:从真实日志提取的关键内容
  • screenshots/self_verification.png:由 Python + PIL 根据真实日志生成

截图由真实 logs 生成,不是伪造。

8. 日志文件

文件说明
logs/env_check.log环境检查日志
logs/inference.log推理运行日志
logs/accuracy.logCPU/NPU 精度对比日志
logs/benchmark.log性能测试日志
logs/prediction.txt预测结果

9. 注意事项

  • 测试图片 assets/test.jpg 是从公开 URL 下载的真实图片,不是占位图
  • 未出现 exit code 137
  • 未出现显存不足、内存不足、进程被 kill 或运行超时
  • 使用 HF_ENDPOINT=https://hf-mirror.com 下载模型(HuggingFace 直连超时)
  • 使用 AutoImageProcessor(ConvNextImageProcessor)进行预处理,不手写伪预处理
  • 模型参数量非常大(644.8M),benchmark 次数少于小模型(2 次预热 + 5 次正式测试)
  • 模型权重不随仓库提交
  • pytorch_model.bin、model.safetensors、.bin、.safetensors 不提交
  • fusion_result.json / kernel_meta 为 torch_npu 自动产物,已删除并加入 .gitignore
  • CPU/NPU 精度验证已完成,prob_max_diff < 1%,Top-1/Top-5 一致
  • benchmark 已完成,平均延迟 80.73ms

10. 标签

#NPU