SENet 模型卡片

Squeeze-and-Excitation Networks

简介

在这项研究中，作者转而聚焦于通道间的关系，并提出了一种新颖的架构单元，作者将其命名为“Squeeze-and-Excitation”（SE）模块。该模块通过显式地建模通道间的相互依赖关系，自适应地重新校准通道维度的特征响应。结果表明，这些模块可以堆叠在一起，形成在不同数据集上都能极其有效地泛化的 SENet 架构。作者进一步证明，SE 模块能以略微增加的计算成本为现有的最先进 CNN 带来显著的性能提升。[1]

图 1. SENet 架构 [1]

结果

我们复现的模型在 ImageNet-1K 上的性能如下表所示。

模型	训练环境	Top-1 (%)	Top-5 (%)	参数 (M)	下载链接
seresnet18	D910x8-G	71.81	90.49	11.80	weights
seresnet34	D910x8-G	75.38	92.50	21.98	weights
seresnet50	D910x8-G	78.32	94.07	28.14	weights
seresnext26_32x4d	D910x8-G	77.17	93.42	16.83	weights
seresnext50_32x4d	D910x8-G	78.71	94.36	27.63	weights

说明

训练环境：训练环境表示为 {设备}x{数量}-{MS 模式}，其中 mindspore 模式可以是 G（图模式）或 F（带 ms function 的动态图模式）。例如，D910x8-G 表示使用 8 块 Ascend 910 NPU 以图模式进行训练。
Top-1 和 Top-5：在 ImageNet-1K 验证集上报告的准确率。

如何开始使用模型

有关模型训练和推理的信息，请查看 MindCV GitHub 仓库。

参考文献

[1] Hu J, Shen L, Sun G. Squeeze-and-excitation networks[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2018: 7132-7141.