arXiv reaDer
新しい方法の探索: 表現上の相違を強制して新しい機能を学習し、エラーの一貫性を減らす
Exploring new ways: Enforcing representational dissimilarity to learn new features and reduce error consistency
独立してトレーニングされた機械学習モデルは、同様の機能を学習する傾向があります。独立してトレーニングされたモデルのアンサンブルを考慮すると、相関のある予測と共通の故障モードが得られます。出力予測またはロジットの無相関化に焦点を当てた以前の試みでは、特に最適化目標の競合によって引き起こされるモデルの精度の低下により、さまざまな結果が得られました。この論文では、トレーニングされたモデルの類似性を測定するのではなく、トレーニング中に非類似性を促進するために表現類似性フィールドの方法を利用するという新しいアイデアを提案します。この目的のために、我々は、素の故障モードを持つ堅牢なアンサンブルを学習することを目的として、アーキテクチャ間の異なる深さで中間表現が類似しないように促進します。類似性が非常に高い中間表現では、出力予測の相関が低くなり、誤差の一貫性がわずかに低くなり、結果としてアンサンブル精度が高くなることがわかります。これにより、中間表現間の関係と、それらが出力予測に及ぼす影響に最初の光を当てます。
Independently trained machine learning models tend to learn similar features. Given an ensemble of independently trained models, this results in correlated predictions and common failure modes. Previous attempts focusing on decorrelation of output predictions or logits yielded mixed results, particularly due to their reduction in model accuracy caused by conflicting optimization objectives. In this paper, we propose the novel idea of utilizing methods of the representational similarity field to promote dissimilarity during training instead of measuring similarity of trained models. To this end, we promote intermediate representations to be dissimilar at different depths between architectures, with the goal of learning robust ensembles with disjoint failure modes. We show that highly dissimilar intermediate representations result in less correlated output predictions and slightly lower error consistency, resulting in higher ensemble accuracy. With this, we shine first light on the connection between intermediate representations and their impact on the output predictions.
updated: Wed Jul 05 2023 14:28:46 GMT+0000 (UTC)
published: Wed Jul 05 2023 14:28:46 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト