XiaYuanOwO/ascend-levit-192-fb-dist-in1k-model
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

LeViT-192 图像分类模型

#+NPU

Ascend NPU Model Pretrained

模型概述

  • 模型名称:levit_192.fb_dist_in1k
  • 网络结构:LeViT-192(混合Transformer)
  • 预训练数据集:ImageNet-1k
  • 来源:Facebook DeiT通过timm预训练
  • 任务:图像分类

模型描述

LeViT是一种混合Transformer架构,它融合了卷积神经网络的高效性与视觉Transformer的注意力机制。LeViT-192变体在精度和计算效率之间实现了优化平衡,使其适合在Ascend NPU上部署。

性能表现

推理性能(Ascend NPU)

设备平均时间最小时间最大时间
CPU45.23 ms42.15 ms48.67 ms
NPU12.45 ms11.23 ms13.89 ms

加速比:在Ascend NPU上相比CPU提升3.63倍

精度

该模型在ImageNet-1k验证集上达到82.4%的top-1准确率,与Facebook DeiT预训练基线水平相当。

环境要求

pip install -r requirements.txt

使用方法

运行推理

python inference.py

示例代码

import timm
import torch

# Load model
model = timm.create_model("levit_192.fb_dist_in1k", pretrained=True)
model = model.npu()  # Move to NPU
model.eval()

# Run inference
with torch.no_grad():
    output = model(input_tensor.npu())
    predicted_class = output.argmax(dim=1)

仓库结构

.
├── inference.py       # Main inference script with CPU/NPU comparison
├── requirements.txt   # Python dependencies
├── README.md          # This file
├── .gitignore         # Git ignore rules
└── logs/              # Inference logs
    ├── run_npu.log
    ├── accuracy_compare.log
    └── summary.json

模型适配摘要

指标数值
状态SUCCESS
是否使用预训练true
是否使用本地权重true
1% 内匹配true

许可证

本模型遵循原始 Facebook DeiT 预训练权重和 timm 库的许可证。