timm/mvitv2_small.fb_in1k on Ascend NPU

1. 简介

本项目将 timm/mvitv2_small.fb_in1k（Multiscale Vision Transformer V2 Small）适配到华为昇腾 NPU（Ascend910），包含推理验证、CPU-NPU 精度一致性检查和性能基准测试。

模型来源：ModelScope（timm/mvitv2_small.fb_in1k）
权重加载方式：timm.create_model(pretrained=False) + ModelScope 本地权重
适配设备：Ascend910 NPU（单卡）

2. 验证环境

设备：Ascend910_9362
框架：PyTorch + torch_npu
Python 依赖见 requirements.txt

3. 推理运行

pip install -r requirements.txt
python inference.py

推理输出：

输出 shape：[1, 1000]
Top-1：class_150（80.37%）
Top-2：class_39（0.42%）
Top-3：class_385（0.22%）
Top-4：class_268（0.15%）
Top-5：class_48（0.14%）

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证：

指标	数值
max_abs_error	0.019335
mean_abs_error	0.001221
relative_error	0.3986%
cosine_similarity	0.999994
threshold	1.0%
结果	PASS

CPU Top-1: class_150
NPU Top-1: class_150
CPU Top-5: class_150, class_39, class_385, class_268, class_48
NPU Top-5: class_150, class_39, class_385, class_268, class_48
Top-1 match: True
Top-5 match: True

5. 性能参考

指标	数值
Avg latency	22.32 ms
Min latency	21.96 ms
Max latency	23.14 ms
P50 latency	22.10 ms
P90 latency	22.83 ms
P95 latency	22.98 ms
Throughput	44.81 images/sec

设备：Ascend910_9362
Batch size：1
Warmup runs：2
Benchmark runs：10

6. 精度评测说明

本项目包含单图 smoke consistency 验证，非官方 ImageNet 完整验证集评测。详细指标见第 4 节。

7. 自验证截图

见 screenshots/self_verification.png。

8. 日志文件

文件	说明
`logs/inference.log`	推理输出结果
`logs/accuracy.log`	CPU-NPU 精度一致性检查
`logs/benchmark.log`	性能基准测试

9. 注意事项

使用 pretrained=False + ModelScope 本地权重加载，不依赖 HuggingFace 直连下载
权重文件（.safetensors、.bin 等）不提交到仓库
本项目为单卡 Ascend910 适配，不涉及分布式推理

10. 标签

#NPU

1. 简介

本项目将 timm/mvitv2_small.fb_in1k（Multiscale Vision Transformer V2 Small）适配到华为昇腾 NPU（Ascend910），包含推理验证、CPU-NPU 精度一致性检查和性能基准测试。

模型来源：ModelScope（timm/mvitv2_small.fb_in1k）

权重加载方式：timm.create_model(pretrained=False) + ModelScope 本地权重

适配设备：Ascend910 NPU（单卡）

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证：

指标	数值
max_abs_error	0.019335
mean_abs_error	0.001221
relative_error	0.3986%
cosine_similarity	0.999994
threshold	1.0%
结果	PASS

CPU Top-1: class_150

NPU Top-1: class_150

CPU Top-5: class_150, class_39, class_385, class_268, class_48

NPU Top-5: class_150, class_39, class_385, class_268, class_48

Top-1 match: True

Top-5 match: True

指标

数值

Avg latency

22.32 ms

Min latency

21.96 ms

Max latency

23.14 ms

P50 latency

22.10 ms

P90 latency

22.83 ms

P95 latency

22.98 ms

Throughput

44.81 images/sec

文件

说明

logs/inference.log

推理输出结果

logs/accuracy.log

CPU-NPU 精度一致性检查

logs/benchmark.log

性能基准测试