timm/tf_efficientnet_lite3.in1k on Ascend NPU

1. 简介

本项目将 ModelScope 上的 timm/tf_efficientnet_lite3.in1k 图片分类模型适配到单卡昇腾 NPU（Ascend910）。

模型来源：https://modelscope.cn/models/timm/tf_efficientnet_lite3.in1k
适配方式：使用 ModelScope snapshot_download 下载本地权重，通过 timm.create_model(pretrained=False) 构建模型结构并加载权重，无需 HuggingFace 直连下载。
输入尺寸：300x300（由模型 data_config 自动解析）
输出维度：1000 类 ImageNet 分类 logits

2. 验证环境

项目	版本/型号
NPU	Ascend910
CANN	8.0.RC2
PyTorch	2.1.0
torch_npu	2.1.0
timm	1.0.x
modelscope	1.x

3. 推理运行

pip install -r requirements.txt
python inference.py

model_utils.py 封装了统一的模型加载与预处理逻辑，供 inference.py、eval_accuracy.py、benchmark.py 复用。

4. 精度验证

python eval_accuracy.py

对单张测试图片进行 CPU 与 NPU 一致性验证：

指标	数值
max_abs_error	0.003634
mean_abs_error	0.000834
relative_error	0.1525%
cosine_similarity	0.999999
threshold	1.0%
结果	PASS

CPU Top-1 与 NPU Top-1 类别一致
CPU Top-5 与 NPU Top-5 类别一致

5. 性能参考

运行 python benchmark.py（batch=1，预热 2 轮，正式 10 轮）：

指标	数值
Avg latency	8.62 ms
Min latency	8.57 ms
Max latency	8.66 ms
P50 latency	8.62 ms
P90 latency	8.66 ms
P95 latency	8.66 ms
Throughput	116.07 images/sec

6. 精度评测

本项目未在完整 ImageNet 验证集上运行，仅提供单图 smoke consistency 检查。如需完整精度，请使用 ImageNet-val 数据集配合批量评测脚本。

7. 自验证截图

见 screenshots/self_verification.png 与 screenshots/self_verification.txt。

8. 日志文件

日志	说明
`logs/inference.log`	单图推理输出与 Top-5 预测
`logs/accuracy.log`	CPU-NPU 精度一致性对比
`logs/benchmark.log`	性能基准测试结果

9. 注意事项

权重文件（.safetensors / .bin / .pth 等）已通过 .gitignore 排除，不会提交到仓库。
首次运行时会通过 ModelScope 自动下载模型权重到本地缓存目录。
若 NPU 设备不可用，脚本会在迁移到 npu:0 时报错，请确保驱动和 CANN 环境已正确安装。

10. 标签

#NPU

1. 简介

本项目将 ModelScope 上的 timm/tf_efficientnet_lite3.in1k 图片分类模型适配到单卡昇腾 NPU（Ascend910）。

模型来源：https://modelscope.cn/models/timm/tf_efficientnet_lite3.in1k

适配方式：使用 ModelScope snapshot_download 下载本地权重，通过 timm.create_model(pretrained=False) 构建模型结构并加载权重，无需 HuggingFace 直连下载。

输入尺寸：300x300（由模型 data_config 自动解析）

输出维度：1000 类 ImageNet 分类 logits

项目

版本/型号

NPU

Ascend910

CANN

8.0.RC2

PyTorch

2.1.0

torch_npu

2.1.0

timm

1.0.x

modelscope

1.x

指标

数值

max_abs_error

0.003634

mean_abs_error

0.000834

relative_error

0.1525%

cosine_similarity

0.999999

threshold

1.0%

结果

PASS

指标

数值

Avg latency

8.62 ms

Min latency

8.57 ms

Max latency

8.66 ms

P50 latency

8.62 ms

P90 latency

8.66 ms

P95 latency

8.66 ms

Throughput

116.07 images/sec

日志

说明

logs/inference.log

单图推理输出与 Top-5 预测

logs/accuracy.log

CPU-NPU 精度一致性对比

logs/benchmark.log

性能基准测试结果

9. 注意事项

权重文件（.safetensors / .bin / .pth 等）已通过 .gitignore 排除，不会提交到仓库。

首次运行时会通过 ModelScope 自动下载模型权重到本地缓存目录。