timm/resnet34.tv_in1k on Ascend NPU

1. 简介

将 timm/resnet34.tv_in1k 图片分类模型适配到华为昇腾 NPU（Ascend910）。使用 ModelScope snapshot_download 下载权重，timm.create_model(pretrained=False) 创建结构并加载本地权重。

模型：ResNet-34，ImageNet-1K 分类（1000 类）
参数量：约 21.8M
输入：3×224×224 RGB 图像

2. 验证环境

硬件：华为昇腾 910 NPU
框架：PyTorch + torch_npu
权重来源：ModelScope snapshot_download（timm/resnet34.tv_in1k）
加载方式：timm.create_model(pretrained=False) + safetensors 本地加载

3. 推理运行

python inference.py

输出示例：

=== NPU Inference: resnet34.tv_in1k ===
Output shape: torch.Size([1, 1000])
Top-1: class_623 (prob=0.0287)
  Top-1: class_623 (prob=0.0287)
  Top-2: class_892 (prob=0.0154)
  Top-3: class_534 (prob=0.0139)
  Top-4: class_111 (prob=0.0126)
  Top-5: class_813 (prob=0.0120)

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证：

指标	数值
max_abs_error	0.002411
mean_abs_error	0.000415
relative_error	0.0389%
cosine_similarity	1.000000
threshold	1.0%
结果	PASS

CPU Top-1: class_623
NPU Top-1: class_623
Top-1 match: True
CPU Top-5: class_623, class_892, class_534, class_111, class_813
NPU Top-5: class_623, class_892, class_534, class_111, class_813
Top-5 match: True

5. 性能参考

指标	数值
平均延迟	4.15 ms
最小延迟	4.13 ms
最大延迟	4.17 ms
P50 延迟	4.14 ms
P90 延迟	4.17 ms
P95 延迟	4.17 ms
吞吐量	241.22 images/sec

6. 精度评测说明

本项目包含单图 smoke consistency 验证，非官方 ImageNet 完整验证集评测。详细指标见第 4 节。

7. 自验证截图

见 screenshots/self_verification.png。

8. 日志文件

logs/inference.log - 推理结果日志
logs/accuracy.log - CPU-NPU 精度一致性验证日志
logs/benchmark.log - 性能基准测试日志
logs/env_check.log - NPU 环境检查日志

9. 注意事项

使用 ModelScope snapshot_download 下载权重，未使用 HuggingFace 直连
使用 timm.create_model(pretrained=False) 创建模型结构，手动加载本地权重
未提交任何权重文件（*.safetensors, *.bin, *.pth 等已 gitignore）
单图 smoke 验证，非完整 ImageNet 验证集评测

10. 标签

#NPU #Ascend #ResNet34 #ImageClassification #timm

1. 简介

模型：ResNet-34，ImageNet-1K 分类（1000 类）

参数量：约 21.8M

输入：3×224×224 RGB 图像

3. 推理运行

python inference.py

输出示例：

=== NPU Inference: resnet34.tv_in1k ===
Output shape: torch.Size([1, 1000])
Top-1: class_623 (prob=0.0287)
  Top-1: class_623 (prob=0.0287)
  Top-2: class_892 (prob=0.0154)
  Top-3: class_534 (prob=0.0139)
  Top-4: class_111 (prob=0.0126)
  Top-5: class_813 (prob=0.0120)

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证：

指标	数值
max_abs_error	0.002411
mean_abs_error	0.000415
relative_error	0.0389%
cosine_similarity	1.000000
threshold	1.0%
结果	PASS

CPU Top-1: class_623

NPU Top-1: class_623

Top-1 match: True

CPU Top-5: class_623, class_892, class_534, class_111, class_813

NPU Top-5: class_623, class_892, class_534, class_111, class_813

Top-5 match: True

指标

数值

平均延迟

4.15 ms

最小延迟

4.13 ms

最大延迟

4.17 ms

P50 延迟

4.14 ms

P90 延迟

4.17 ms

P95 延迟

4.17 ms

吞吐量

241.22 images/sec

9. 注意事项

使用 ModelScope snapshot_download 下载权重，未使用 HuggingFace 直连

使用 timm.create_model(pretrained=False) 创建模型结构，手动加载本地权重

未提交任何权重文件（*.safetensors, *.bin, *.pth 等已 gitignore）

单图 smoke 验证，非完整 ImageNet 验证集评测