Two at Once:IBN-Netを介した学習機能と一般化機能の強化
Two at Once: Enhancing Learning and Generalization Capacities via IBN-Net
 畳み込みニューラルネットワーク(CNN)は、多くのコンピュータービジョンの問題で大きな成功を収めています。単一ドメインの単一タスクのパフォーマンスを改善し、一般化できないようにCNNアーキテクチャを設計した既存の作品とは異なり、1つのドメイン(Cityscapesなど)でのCNNのモデリング機能を大幅に強化する新しい畳み込みアーキテクチャであるIBN-Netを紹介します他のドメイン(GTA5など)での微調整なしの一般化容量。 IBN-Netは、インスタンスの正規化(IN)とバッチの正規化(BN)をビルディングブロックとして慎重に統合し、パフォーマンスを向上させるために多くの高度なディープネットワークにラップできます。この作品には3つの重要な貢献があります。 (1)INとBNを掘り下げることにより、INは色、スタイル、仮想性/現実性などの外観の変化に不変の機能を学習しますが、BNはコンテンツ関連情報を保存するために不可欠です。 (2)IBN-Netは、DenseNet、ResNet、ResNeXt、SENetなどの多くの高度なディープアーキテクチャに適用でき、計算コストを増加させることなく一貫してパフォーマンスを向上させます。 (3)訓練されたネットワークを新しいドメインに適用する場合、例えばGTA5からCityscapesまで、IBN-Netは、ターゲットドメインのデータを使用しなくても、ドメイン適応方法と同等の改善を達成します。 IBN-Netにより、私たちはWAD 2018 Challenge Drivable Areaトラックで86.18%のmIoUで1位を獲得しました。
Convolutional neural networks (CNNs) have achieved great successes in many computer vision problems. Unlike existing works that designed CNN architectures to improve performance on a single task of a single domain and not generalizable, we present IBN-Net, a novel convolutional architecture, which remarkably enhances a CNN's modeling ability on one domain (e.g. Cityscapes) as well as its generalization capacity on another domain (e.g. GTA5) without finetuning. IBN-Net carefully integrates Instance Normalization (IN) and Batch Normalization (BN) as building blocks, and can be wrapped into many advanced deep networks to improve their performances. This work has three key contributions. (1) By delving into IN and BN, we disclose that IN learns features that are invariant to appearance changes, such as colors, styles, and virtuality/reality, while BN is essential for preserving content related information. (2) IBN-Net can be applied to many advanced deep architectures, such as DenseNet, ResNet, ResNeXt, and SENet, and consistently improve their performance without increasing computational cost. (3) When applying the trained networks to new domains, e.g. from GTA5 to Cityscapes, IBN-Net achieves comparable improvements as domain adaptation methods, even without using data from the target domain. With IBN-Net, we won the 1st place on the WAD 2018 Challenge Drivable Area track, with an mIoU of 86.18%.
updated: Mon Mar 23 2020 03:31:11 GMT+0000 (UTC)
published: Wed Jul 25 2018 05:51:15 GMT+0000 (UTC)
