arXiv reaDer
DICE:条件付き冗長性の敵対的推定によるディープアンサンブルの多様性
DICE: Diversity in Deep Ensembles via Conditional Redundancy Adversarial Estimation
ディープアンサンブルは、メンバー間の多様性のおかげで、単一のネットワークよりも優れたパフォーマンスを発揮します。最近のアプローチは、多様性を高めるために予測を正規化します。ただし、個々のメンバーのパフォーマンスも大幅に低下します。この論文では、深いアンサンブルの学習戦略は、アンサンブルの多様性と個々の精度の間のトレードオフに取り組む必要があると主張します。情報理論からの議論に動機付けられ、条件付き相互情報量の神経推定における最近の進歩を活用して、DICEと呼ばれる新しいトレーニング基準を導入します。これは、特徴間の疑似相関を減らすことによって多様性を高めます。主なアイデアは、メンバーのペアから抽出された特徴は、条件付きで冗長になることなく、ターゲットクラスの予測に役立つ情報のみを共有する必要があるということです。したがって、情報のボトルネックによる分類の損失に加えて、特徴が相互に条件付きで予測可能になるのを逆に防ぎます。クラス情報を保護しながら、同時エラーを減らすことができます。 CIFAR-10 / 100で最先端の精度の結果が得られます。たとえば、DICEでトレーニングされた5つのネットワークのアンサンブルは、独立してトレーニングされた7つのネットワークのアンサンブルと一致します。さらに、キャリブレーション、不確実性の推定、分布外の検出、およびオンライン共蒸留への影響を分析します。
Deep ensembles perform better than a single network thanks to the diversity among their members. Recent approaches regularize predictions to increase diversity; however, they also drastically decrease individual members' performances. In this paper, we argue that learning strategies for deep ensembles need to tackle the trade-off between ensemble diversity and individual accuracies. Motivated by arguments from information theory and leveraging recent advances in neural estimation of conditional mutual information, we introduce a novel training criterion called DICE: it increases diversity by reducing spurious correlations among features. The main idea is that features extracted from pairs of members should only share information useful for target class prediction without being conditionally redundant. Therefore, besides the classification loss with information bottleneck, we adversarially prevent features from being conditionally predictable from each other. We manage to reduce simultaneous errors while protecting class information. We obtain state-of-the-art accuracy results on CIFAR-10/100: for example, an ensemble of 5 networks trained with DICE matches an ensemble of 7 networks trained independently. We further analyze the consequences on calibration, uncertainty estimation, out-of-distribution detection and online co-distillation.
updated: Thu Jan 14 2021 10:53:26 GMT+0000 (UTC)
published: Thu Jan 14 2021 10:53:26 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト