情報ボトルネック(IB)は、冗長性を最小限に抑えながら、ラベルの予測に関連するすべての情報を保持することにより、表現学習の情報理論の原則を提供します。 IBの原則は幅広いアプリケーションに適用されてきましたが、その最適化は依然として困難な問題であり、相互情報量の正確な推定に大きく依存しています。このホワイトペーパーでは、新しい戦略であるVariational Self-Distillation(VSD)を紹介します。これは、相互情報量を明示的に推定することなく、本質的に相互情報量を適合させるためのスケーラブルで柔軟な分析ソリューションを提供します。厳密な理論的保証の下で、VSDにより、IBは教師ありトレーニングの表現とラベルの間の本質的な相関関係を把握できます。さらに、VSDをマルチビュー学習に拡張することにより、他の2つの戦略、Variational Cross-Distillation(VCD)とVariational Mutual-Learning(VML)を導入します。これらの戦略は、ビュー固有のタスクに関係のない情報。理論的に根拠のある戦略を検証するために、クロスモーダルな人物のRe-IDにアプローチを適用し、最先端の方法に対する優れたパフォーマンスが実証される広範な実験を実施します。私たちの興味深い発見は、相互を推定する方法を再考する必要性を浮き彫りにしています
The Information Bottleneck (IB) provides an information theoretic principle for representation learning, by retaining all information relevant for predicting label while minimizing the redundancy. Though IB principle has been applied to a wide range of applications, its optimization remains a challenging problem which heavily relies on the accurate estimation of mutual information. In this paper, we present a new strategy, Variational Self-Distillation (VSD), which provides a scalable, flexible and analytic solution to essentially fitting the mutual information but without explicitly estimating it. Under rigorously theoretical guarantee, VSD enables the IB to grasp the intrinsic correlation between representation and label for supervised training. Furthermore, by extending VSD to multi-view learning, we introduce two other strategies, Variational Cross-Distillation (VCD) and Variational Mutual-Learning (VML), which significantly improve the robustness of representation to view-changes by eliminating view-specific and task-irrelevant information. To verify our theoretically grounded strategies, we apply our approaches to cross-modal person Re-ID, and conduct extensive experiments, where the superior performance against state-of-the-art methods are demonstrated. Our intriguing findings highlight the need to rethink the way to estimate mutual