facebook/convnext-small-224 on Ascend NPU

1. 简介

模型名称: facebook/convnext-small-224
任务类型: Image Classification（图片识别）
原始模型链接: https://huggingface.co/facebook/convnext-small-224
GitCode 镜像: https://ai.gitcode.com/hf_mirrors/facebook/convnext-small-224
适配方式: Transformers + torch_npu，单卡 Ascend NPU 推理
运行方式: 使用 AutoImageProcessor 进行图片预处理，AutoModelForImageClassification 加载模型权重并迁移到 npu:0 执行推理
不使用: vLLM、TP、EP、DP、MoE 等大模型并行优化
模型参数量: 50,223,688（约 50M）

2. 验证环境

项目	值
NPU 型号	Ascend 910B4
CANN 版本	8.5.1
torch 版本	2.9.0+cpu
torch_npu 版本	2.9.0.post1
transformers 版本	4.57.6
Python 版本	3.11.14
模型来源	HuggingFace (hf-mirror.com)
测试图片	assets/test.jpg（占位图，因网络下载超时）
运行设备	npu:0
环境日志	logs/env_check.log

3. 推理运行

依赖安装

pip install -r requirements.txt

运行推理

python inference.py

日志路径

推理日志: logs/inference.log
预测输出: logs/prediction.txt

预测结果

Top-1: hook, claw (id=600, confidence=0.0028)
Top-2: kite (id=21, confidence=0.0027)
Top-3: matchstick (id=644, confidence=0.0026)
Top-4: parachute, chute (id=701, confidence=0.0024)
Top-5: corkscrew, bottle screw (id=512, confidence=0.0024)

4. Smoke 验证

torch.npu.is_available(): True
device: npu:0 (Ascend910B4)
Top-1: hook, claw (id=600)
Top-5: hook, claw / kite / matchstick / parachute, chute / corkscrew, bottle screw
推理成功: 是（exit code 0）

5. 性能参考

python benchmark.py

预热次数: 5
正式测试次数: 20
平均延迟: 48.34 ms
最小延迟: 30.90 ms
最大延迟: 99.64 ms
P50: 44.18 ms
P90: 70.33 ms
P95: 99.64 ms
Throughput: 20.69 images/s

6. 精度评测

python eval_accuracy.py

CPU vs NPU 对比方法: 使用同一张测试图片（assets/test.jpg），分别在 CPU 和 NPU 上运行推理，对比 logits 输出。

指标	值
max_abs_diff	0.005180
mean_abs_diff	0.001229
prob_max_diff	0.000009
Top-1 match	True
Top-5 match	True
prob_max_diff < 1%	True

结果: CPU/NPU 一致性验证 PASSED（prob_max_diff < 1%，Top-1/Top-5 完全一致）

注意: 这是 smoke accuracy / CPU-NPU 一致性验证，不是官方 ImageNet 数据集精度。

7. 自验证截图

screenshots/self_verification.png
screenshots/self_verification.txt

截图从真实日志中提取关键内容生成，不是伪造。

8. 日志文件

文件	说明
logs/env_check.log	NPU 环境检查
logs/inference.log	推理运行日志
logs/accuracy.log	CPU/NPU 精度对比日志
logs/benchmark.log	性能测试日志
logs/prediction.txt	预测结果

9. 注意事项

测试图片: assets/test.jpg 为程序生成的占位图（224x224 纯灰色），因网络下载超时无法获取真实图片。推理结果仅验证模型能正常运行，不代表真实图片的分类效果。
exit code 137: 未出现。
hf-mirror: 推理脚本中使用 HF_ENDPOINT=https://hf-mirror.com 环境变量，模型从 hf-mirror.com 下载。
本地缓存: 模型首次下载后缓存在 ~/.cache/huggingface/hub/ 中。
ConvNextForImageClassification: 使用 AutoModelForImageClassification 自动加载为 ConvNextForImageClassification。
模型权重不随仓库提交: pytorch_model.bin、model.safetensors、.bin、.safetensors 等权重文件已加入 .gitignore，不提交。
torch_npu 自动产物: fusion_result.json、kernel_meta/ 等为 torch_npu 自动生成产物，已删除并加入 .gitignore。
精度验证: CPU/NPU 精度验证已完整完成，结果 PASSED。
Benchmark: 性能测试已完整完成。

10. 标签

#NPU