g
gyccc/facebook-convnext-small-224-NPU
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

facebook/convnext-small-224 on Ascend NPU

1. 简介

  • 模型名称: facebook/convnext-small-224
  • 任务类型: Image Classification(图片识别)
  • 原始模型链接: https://huggingface.co/facebook/convnext-small-224
  • GitCode 镜像: https://ai.gitcode.com/hf_mirrors/facebook/convnext-small-224
  • 适配方式: Transformers + torch_npu,单卡 Ascend NPU 推理
  • 运行方式: 使用 AutoImageProcessor 进行图片预处理,AutoModelForImageClassification 加载模型权重并迁移到 npu:0 执行推理
  • 不使用: vLLM、TP、EP、DP、MoE 等大模型并行优化
  • 模型参数量: 50,223,688(约 50M)

2. 验证环境

项目值
NPU 型号Ascend 910B4
CANN 版本8.5.1
torch 版本2.9.0+cpu
torch_npu 版本2.9.0.post1
transformers 版本4.57.6
Python 版本3.11.14
模型来源HuggingFace (hf-mirror.com)
测试图片assets/test.jpg(占位图,因网络下载超时)
运行设备npu:0
环境日志logs/env_check.log

3. 推理运行

依赖安装

pip install -r requirements.txt

运行推理

python inference.py

日志路径

  • 推理日志: logs/inference.log
  • 预测输出: logs/prediction.txt

预测结果

Top-1: hook, claw (id=600, confidence=0.0028)
Top-2: kite (id=21, confidence=0.0027)
Top-3: matchstick (id=644, confidence=0.0026)
Top-4: parachute, chute (id=701, confidence=0.0024)
Top-5: corkscrew, bottle screw (id=512, confidence=0.0024)

4. Smoke 验证

  • torch.npu.is_available(): True
  • device: npu:0 (Ascend910B4)
  • Top-1: hook, claw (id=600)
  • Top-5: hook, claw / kite / matchstick / parachute, chute / corkscrew, bottle screw
  • 推理成功: 是(exit code 0)

5. 性能参考

python benchmark.py
  • 预热次数: 5
  • 正式测试次数: 20
  • 平均延迟: 48.34 ms
  • 最小延迟: 30.90 ms
  • 最大延迟: 99.64 ms
  • P50: 44.18 ms
  • P90: 70.33 ms
  • P95: 99.64 ms
  • Throughput: 20.69 images/s

6. 精度评测

python eval_accuracy.py

CPU vs NPU 对比方法: 使用同一张测试图片(assets/test.jpg),分别在 CPU 和 NPU 上运行推理,对比 logits 输出。

指标值
max_abs_diff0.005180
mean_abs_diff0.001229
prob_max_diff0.000009
Top-1 matchTrue
Top-5 matchTrue
prob_max_diff < 1%True

结果: CPU/NPU 一致性验证 PASSED(prob_max_diff < 1%,Top-1/Top-5 完全一致)

注意: 这是 smoke accuracy / CPU-NPU 一致性验证,不是官方 ImageNet 数据集精度。

7. 自验证截图

  • screenshots/self_verification.png
  • screenshots/self_verification.txt

截图从真实日志中提取关键内容生成,不是伪造。

8. 日志文件

文件说明
logs/env_check.logNPU 环境检查
logs/inference.log推理运行日志
logs/accuracy.logCPU/NPU 精度对比日志
logs/benchmark.log性能测试日志
logs/prediction.txt预测结果

9. 注意事项

  • 测试图片: assets/test.jpg 为程序生成的占位图(224x224 纯灰色),因网络下载超时无法获取真实图片。推理结果仅验证模型能正常运行,不代表真实图片的分类效果。
  • exit code 137: 未出现。
  • hf-mirror: 推理脚本中使用 HF_ENDPOINT=https://hf-mirror.com 环境变量,模型从 hf-mirror.com 下载。
  • 本地缓存: 模型首次下载后缓存在 ~/.cache/huggingface/hub/ 中。
  • ConvNextForImageClassification: 使用 AutoModelForImageClassification 自动加载为 ConvNextForImageClassification。
  • 模型权重不随仓库提交: pytorch_model.bin、model.safetensors、.bin、.safetensors 等权重文件已加入 .gitignore,不提交。
  • torch_npu 自动产物: fusion_result.json、kernel_meta/ 等为 torch_npu 自动生成产物,已删除并加入 .gitignore。
  • 精度验证: CPU/NPU 精度验证已完整完成,结果 PASSED。
  • Benchmark: 性能测试已完整完成。

10. 标签

#NPU