g
gyccc/facebook-convnext-xlarge-224-22k-1k-NPU
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

facebook/convnext-xlarge-224-22k-1k on Ascend NPU

1. 简介

facebook/convnext-xlarge-224-22k-1k 是 Meta 提出的 ConvNeXt-XLarge 图像分类模型,在 ImageNet-22K 上预训练后微调到 ImageNet-1K,输入分辨率 224x224,包含 1000 个类别。本项目将其适配到华为昇腾 NPU (Ascend910) 上运行。

2. 验证环境

  • 硬件:华为昇腾 910 NPU
  • 软件:PyTorch + torch_npu
  • 模型来源:ModelScope (facebook/convnext-xlarge-224-22k-1k)
  • 框架:transformers (ConvNextForImageClassification)

3. 推理运行

pip install -r requirements.txt
python inference.py

推理结果 (NPU Top-5):

  • Top-1: nipple (0.0073)
  • Top-2: paper towel (0.0051)
  • Top-3: envelope (0.0050)
  • Top-4: face powder (0.0046)
  • Top-5: airship, dirigible (0.0046)

日志保存在 logs/inference.log。

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证:

指标数值
relative_error0.6983%
cosine_similarity0.999987
threshold1.0%
结果PASS

5. 性能参考

指标数值
avg_latency24.95 ms
min_latency24.87 ms
max_latency25.08 ms
p50_latency24.93 ms
p90_latency25.02 ms
p95_latency25.05 ms
images_per_sec40.08

6. 精度评测说明

本项目包含单图 smoke consistency 验证,非官方 ImageNet 完整验证集评测。

7. 自验证截图

见 screenshots/self_verification.png。

8. 日志文件

  • logs/inference.log — 推理输出日志
  • logs/accuracy.log — 精度验证日志
  • logs/benchmark.log — 性能基准日志

9. 注意事项

  • 使用 ModelScope snapshot_download 下载权重,不通过 HuggingFace 自动下载
  • 使用 transformers ConvNextForImageClassification 加载本地权重
  • 单图 smoke test 结果,非完整 ImageNet 评测

10. 标签 #NPU