HuggingFace镜像/senet
模型介绍文件和版本分析
下载使用量0

SENet 模型卡片

Squeeze-and-Excitation Networks

简介

在这项研究中,作者转而聚焦于通道间的关系,并提出了一种新颖的架构单元,作者将其命名为“Squeeze-and-Excitation”(SE)模块。该模块通过显式地建模通道间的相互依赖关系,自适应地重新校准通道维度的特征响应。结果表明,这些模块可以堆叠在一起,形成在不同数据集上都能极其有效地泛化的 SENet 架构。作者进一步证明,SE 模块能以略微增加的计算成本为现有的最先进 CNN 带来显著的性能提升。[1]

图 1. SENet 架构 [1]

结果

我们复现的模型在 ImageNet-1K 上的性能如下表所示。

模型训练环境Top-1 (%)Top-5 (%)参数 (M)下载链接
seresnet18D910x8-G71.8190.4911.80weights
seresnet34D910x8-G75.3892.5021.98weights
seresnet50D910x8-G78.3294.0728.14weights
seresnext26_32x4dD910x8-G77.1793.4216.83weights
seresnext50_32x4dD910x8-G78.7194.3627.63weights

说明

  • 训练环境:训练环境表示为 {设备}x{数量}-{MS 模式},其中 mindspore 模式可以是 G(图模式)或 F(带 ms function 的动态图模式)。例如,D910x8-G 表示使用 8 块 Ascend 910 NPU 以图模式进行训练。
  • Top-1 和 Top-5:在 ImageNet-1K 验证集上报告的准确率。

如何开始使用模型

有关模型训练和推理的信息,请查看 MindCV GitHub 仓库。

参考文献

[1] Hu J, Shen L, Sun G. Squeeze-and-excitation networks[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2018: 7132-7141.