この論文では、反転残差構造を利用する畳み込みニューラルネットワークの表現能力を高めることに興味があります。 Inverted Residual structure [Sandler et al。の成功に基づいて2018]およびInterleaved Low-Rank Group Convolutions [Sun et al。 2018]、NAS(Neural architecture search)方式ではなく、この2つのパターンのニューラルネットワーク構造を再考します[Zoph and Le 2017; Pham et al。 2018;リュー他2018b]、不均等な点単位のグループ畳み込みを導入します。これにより、基本ブロックを設計するための新しい検索スペースが提供され、表現能力と計算コストのトレードオフが向上します。一方、チャネル置換/シャッフル操作の有無にかかわらず、複数のグループ畳み込み層のグループ間情報フローを可能にする2つの新しい情報フローパターンを提案します。画像分類タスクの高密度実験により、Seesaw-Netという名前の提案モデルが、限られた計算とメモリコストで最先端の(SOTA)パフォーマンスを達成することがわかります。コードはオープンソースであり、事前にトレーニングされたモデルと一緒に利用できます。
In this paper, we are interested in boosting the representation capability of convolution neural networks which utilizing the inverted residual structure. Based on the success of Inverted Residual structure[Sandler et al. 2018] and Interleaved Low-Rank Group Convolutions[Sun et al. 2018], we rethink this two pattern of neural network structure, rather than NAS(Neural architecture search) method[Zoph and Le 2017; Pham et al. 2018; Liu et al. 2018b], we introduce uneven point-wise group convolution, which provide a novel search space for designing basic blocks to obtain better trade-off between representation capability and computational cost. Meanwhile, we propose two novel information flow patterns that will enable cross-group information flow for multiple group convolution layers with and without any channel permute/shuffle operation. Dense experiments on image classification task show that our proposed model, named Seesaw-Net, achieves state-of-the-art(SOTA) performance with limited computation and memory cost. Our code will be open-source and available together with pre-trained models.