timm/vgg13.tv_in1k on Ascend NPU

1. 简介

本项目将 timm/vgg13.tv_in1k 图片分类模型适配到华为昇腾 NPU (Ascend910) 上运行。使用 ModelScope snapshot_download 下载权重，timm.create_model(pretrained=False) 创建模型结构并加载本地权重，不依赖 HuggingFace 直连下载。

2. 验证环境

项目	信息
芯片	Ascend910
OS	Linux 5.10.0-182.0.0.95.r2220_156.hce2.aarch64
PyTorch	2.x
torch_npu	支持
npu-smi	Ascend910, Health OK, 65536MB HBM

3. 推理运行

# 安装依赖
pip install -r requirements.txt

# 运行推理
python inference.py

推理输出：

项目	值
模型	timm/vgg13.tv_in1k
设备	npu:0
输入 shape	[1, 3, 224, 224]
输出 shape	[1, 1000]

Top-5 预测：

class_813 (confidence: 0.0176)
class_623 (confidence: 0.0164)
class_846 (confidence: 0.0124)
class_499 (confidence: 0.0123)
class_534 (confidence: 0.0109)

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证：

指标	数值
max_abs_error	0.000715
mean_abs_error	0.000144
relative_error	0.0164%
cosine_similarity	1.000000
threshold	1.0%
结果	PASS

CPU Top-1: class_813
NPU Top-1: class_813
CPU Top-5: class_813, class_623, class_846, class_499, class_534
NPU Top-5: class_813, class_623, class_846, class_499, class_534
Top-1 match: True
Top-5 match: True

5. 性能参考

指标	数值
平均延迟	2.08 ms
最小延迟	2.06 ms
最大延迟	2.10 ms
P50	2.07 ms
P90	2.09 ms
P95	2.09 ms
吞吐量	481.72 images/sec

测试条件：batch=1, 单次推理, Warmup 2 次, 正式 10 次。

6. 精度评测说明

本项目包含单图 smoke consistency 验证，非官方 ImageNet 完整验证集评测。详细指标见第 4 节。

7. 自验证截图

详见 screenshots/self_verification.png。

8. 日志文件

文件	说明
logs/inference.log	推理结果日志
logs/accuracy.log	CPU-NPU 精度一致性检查日志
logs/benchmark.log	性能基准测试日志
logs/env_check.log	NPU 环境检查日志

9. 注意事项

本项目使用 ModelScope snapshot_download 下载权重，不使用 HuggingFace 直连
模型权重未提交到 Git 仓库（已在 .gitignore 中排除）
精度验证为单图 smoke test，非完整 ImageNet 评测
CPU-NPU 精度相对误差 0.0164%，远低于 1.0% 阈值

10. 标签 #NPU

项目

信息

芯片

Ascend910

Linux 5.10.0-182.0.0.95.r2220_156.hce2.aarch64

PyTorch

2.x

torch_npu

支持

npu-smi

Ascend910, Health OK, 65536MB HBM

3. 推理运行

# 安装依赖
pip install -r requirements.txt

# 运行推理
python inference.py

推理输出：

项目	值
模型	timm/vgg13.tv_in1k
设备	npu:0
输入 shape	[1, 3, 224, 224]
输出 shape	[1, 1000]

Top-5 预测：

class_813 (confidence: 0.0176)

class_623 (confidence: 0.0164)

class_846 (confidence: 0.0124)

class_499 (confidence: 0.0123)

class_534 (confidence: 0.0109)

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证：

指标	数值
max_abs_error	0.000715
mean_abs_error	0.000144
relative_error	0.0164%
cosine_similarity	1.000000
threshold	1.0%
结果	PASS

CPU Top-1: class_813

NPU Top-1: class_813

CPU Top-5: class_813, class_623, class_846, class_499, class_534

NPU Top-5: class_813, class_623, class_846, class_499, class_534

Top-1 match: True

Top-5 match: True

指标

数值

平均延迟

2.08 ms

最小延迟

2.06 ms

最大延迟

2.10 ms

P50

2.07 ms

P90

2.09 ms

P95

2.09 ms

吞吐量

481.72 images/sec

文件

说明

logs/inference.log

推理结果日志

logs/accuracy.log

CPU-NPU 精度一致性检查日志

logs/benchmark.log

性能基准测试日志

logs/env_check.log

NPU 环境检查日志