SENet 模型卡片
Squeeze-and-Excitation Networks
简介
在这项研究中,作者转而聚焦于通道间的关系,并提出了一种新颖的架构单元,作者将其命名为“Squeeze-and-Excitation”(SE)模块。该模块通过显式地建模通道间的相互依赖关系,自适应地重新校准通道维度的特征响应。结果表明,这些模块可以堆叠在一起,形成在不同数据集上都能极其有效地泛化的 SENet 架构。作者进一步证明,SE 模块能以略微增加的计算成本为现有的最先进 CNN 带来显著的性能提升。[1]
图 1. SENet 架构 [1]
结果
我们复现的模型在 ImageNet-1K 上的性能如下表所示。
| 模型 | 训练环境 | Top-1 (%) | Top-5 (%) | 参数 (M) | 下载链接 |
|---|
| seresnet18 | D910x8-G | 71.81 | 90.49 | 11.80 | weights |
| seresnet34 | D910x8-G | 75.38 | 92.50 | 21.98 | weights |
| seresnet50 | D910x8-G | 78.32 | 94.07 | 28.14 | weights |
| seresnext26_32x4d | D910x8-G | 77.17 | 93.42 | 16.83 | weights |
| seresnext50_32x4d | D910x8-G | 78.71 | 94.36 | 27.63 | weights |
说明
- 训练环境:训练环境表示为 {设备}x{数量}-{MS 模式},其中 mindspore 模式可以是 G(图模式)或 F(带 ms function 的动态图模式)。例如,D910x8-G 表示使用 8 块 Ascend 910 NPU 以图模式进行训练。
- Top-1 和 Top-5:在 ImageNet-1K 验证集上报告的准确率。
如何开始使用模型
有关模型训练和推理的信息,请查看 MindCV GitHub 仓库。
参考文献
[1] Hu J, Shen L, Sun G. Squeeze-and-excitation networks[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2018: 7132-7141.