ニューラルネットワークを効率的にアンサンブルするための最近のアプローチは、元のネットワークよりもパラメータの増加が無視できる程度で、強力な堅牢性と不確実性のパフォーマンスを達成できることを示しています。ただし、これらの方法では、予測のために複数のフォワードパスが必要であり、かなりの計算コストが発生します。この作業では、驚くべき結果を示します。複数の予測を使用する利点は、単一のモデルのフォワードパスの下で「無料」で達成できます。特に、多入力多出力(MIMO)構成を使用すると、単一のモデルの容量を利用して、目前のタスクを独立して学習する複数のサブネットワークをトレーニングできることを示します。サブネットワークによって行われた予測をアンサンブルすることにより、計算を増やすことなくモデルの堅牢性を向上させます。以前の方法と比較して、CIFAR10、CIFAR100、ImageNet、およびそれらの分布外バリアントで、負の対数尤度、精度、およびキャリブレーションエラーの大幅な改善が見られます。
Recent approaches to efficiently ensemble neural networks have shown that strong robustness and uncertainty performance can be achieved with a negligible gain in parameters over the original network. However, these methods still require multiple forward passes for prediction, leading to a significant computational cost. In this work, we show a surprising result: the benefits of using multiple predictions can be achieved `for free' under a single model's forward pass. In particular, we show that, using a multi-input multi-output (MIMO) configuration, one can utilize a single model's capacity to train multiple subnetworks that independently learn the task at hand. By ensembling the predictions made by the subnetworks, we improve model robustness without increasing compute. We observe a significant improvement in negative log-likelihood, accuracy, and calibration error on CIFAR10, CIFAR100, ImageNet, and their out-of-distribution variants compared to previous methods.