実行時に適応型の精度と効率のトレードオフを実現するために、動的リソース制約で実行可能なネットワークをトレーニングする幅分解相互学習法(MutualNet)を提案します。私たちの方法は、各サブネットワークのマルチスケール表現を相互に学習するために、異なる入力解像度を使用して、幅の異なるサブネットワークのコホートをトレーニングします。さまざまな計算制約の下で、最先端の適応型ネットワークUS-Netよりも一貫して優れたImageNetトップ1の精度を達成し、EfficientNetの最高の複合スケーリングMobileNetより1.5%優れています。私たちの方法の優位性は、COCOオブジェクトの検出とインスタンスのセグメンテーション、転移学習についても検証されています。驚くべきことに、MutualNetのトレーニング戦略は単一ネットワークのパフォーマンスも向上させることができ、効率(GPU検索時間:15000対0)と精度(ImageNet:77.6%対78.6%)の両方で強力なAutoAugmentationを大幅に上回ります。コードはhttps://github.com/taoyang1122/MutualNetで入手できます。
We propose the width-resolution mutual learning method (MutualNet) to train a network that is executable at dynamic resource constraints to achieve adaptive accuracy-efficiency trade-offs at runtime. Our method trains a cohort of sub-networks with different widths using different input resolutions to mutually learn multi-scale representations for each sub-network. It achieves consistently better ImageNet top-1 accuracy over the state-of-the-art adaptive network US-Net under different computation constraints, and outperforms the best compound scaled MobileNet in EfficientNet by 1.5%. The superiority of our method is also validated on COCO object detection and instance segmentation as well as transfer learning. Surprisingly, the training strategy of MutualNet can also boost the performance of a single network, which substantially outperforms the powerful AutoAugmentation in both efficiency (GPU search hours: 15000 vs. 0) and accuracy (ImageNet: 77.6% vs. 78.6%). Code is available at https://github.com/taoyang1122/MutualNet.