g
gyccc/timm-convmixer_768_32.in1k-NPU
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

timm/convmixer_768_32.in1k on Ascend NPU

1. 简介

ConvMixer 是一种基于卷积的混合架构,使用逐层卷积(depthwise convolution)和逐点卷积(pointwise convolution)交替堆叠,以类似 ViT 的方式处理图像 patch。768/32 表示隐藏维度 768、patch 大小 32,在 ImageNet-1K 上预训练。

本项目将 timm/convmixer_768_32.in1k 适配到单卡昇腾 NPU (Ascend910),使用 ModelScope snapshot_download 下载权重,timm.create_model(pretrained=False) 加载本地权重。

2. 验证环境

  • 硬件:华为昇腾 910B NPU
  • 框架:PyTorch + torch_npu
  • 模型来源:ModelScope (timm/convmixer_768_32.in1k)

3. 推理运行

python inference.py

输出示例:

=== ConvMixer 768/32 Inference on NPU ===
Model: timm/convmixer_768_32.in1k
Device: npu:0
Image: assets/test.jpg

  Top-1: handkerchief (0.35%)
  Top-2: envelope (0.35%)
  Top-3: sunscreen (0.32%)
  Top-4: can opener (0.28%)
  Top-5: toilet seat (0.26%)

Output shape: torch.Size([1, 1000])
Top-1 class: handkerchief

4. 精度验证

对单张测试图片进行 CPU 与 NPU 一致性验证:

指标数值
max_abs_error0.015085
mean_abs_error0.003345
relative_error0.3778%
cosine_similarity0.999990
threshold1.0%
结果PASS
  • CPU Top-1: class_591 (handkerchief)
  • NPU Top-1: class_591 (handkerchief)
  • Top-1 match: True
  • Top-5 match: True

5. 性能参考

指标数值
avg latency16.45 ms
min latency16.42 ms
max latency16.50 ms
p50 latency16.44 ms
p90 latency16.49 ms
p95 latency16.50 ms
throughput60.80 images/sec

6. 精度评测说明

本项目包含单图 smoke consistency 验证,非官方 ImageNet 完整验证集评测。详细指标见第 4 节。

7. 自验证截图

见 screenshots/self_verification.png

8. 日志文件

  • logs/inference.log - 推理输出日志
  • logs/accuracy.log - 精度验证日志
  • logs/benchmark.log - 性能基准测试日志

9. 注意事项

  • 使用 ModelScope snapshot_download 作为主下载方式
  • 使用 timm.create_model(pretrained=False) 创建结构并加载本地权重
  • 不使用 HuggingFace 直连下载
  • 不提交权重文件

10. 标签 #NPU