arXiv reaDer
事後的な概念的説明が特定できるのはいつですか?
When are Post-hoc Conceptual Explanations Identifiable?
概念的な説明を通じて学習された埋め込み空間を理解して因数分解することへの関心は着実に高まっています。人間の概念ラベルが利用できない場合、概念発見メソッドは、訓練された埋め込み空間を検索して、意思決定の事後説明を提供できるオブジェクトの形状や色などの解釈可能な概念を探します。これまでの研究とは異なり、我々は、概念の発見は識別可能であるべきだと主張します。これは、説明の信頼性を保証するために、多くの既知の概念を証明可能に復元できることを意味します。開始点として、非ガウス分布の下で独立した概念を回復できることを示すことにより、概念発見と主成分分析や独立成分分析などの古典的な手法との関係を明示的に示します。依存概念については、画像生成プロセスの機能的構成特性を利用する 2 つの新しいアプローチを提案します。当社の実証的に識別可能なコンセプト発見メソッドは、数百のトレーニング済みモデルや依存コンセプトを含む一連の実験において競合他社よりも大幅に優れたパフォーマンスを発揮し、グランド トゥルースとの整合性が最大 29 % 優れています。私たちの結果は、人間によるラベルなしで信頼できるコンセプト発見が保証され、ドメインの正式な基盤となる厳しい条件を浮き彫りにしています。私たちのコードはオンラインで入手できます。
Interest in understanding and factorizing learned embedding spaces through conceptual explanations is steadily growing. When no human concept labels are available, concept discovery methods search trained embedding spaces for interpretable concepts like object shape or color that can provide post-hoc explanations for decisions. Unlike previous work, we argue that concept discovery should be identifiable, meaning that a number of known concepts can be provably recovered to guarantee reliability of the explanations. As a starting point, we explicitly make the connection between concept discovery and classical methods like Principal Component Analysis and Independent Component Analysis by showing that they can recover independent concepts under non-Gaussian distributions. For dependent concepts, we propose two novel approaches that exploit functional compositionality properties of image-generating processes. Our provably identifiable concept discovery methods substantially outperform competitors on a battery of experiments including hundreds of trained models and dependent concepts, where they exhibit up to 29 % better alignment with the ground truth. Our results highlight the strict conditions under which reliable concept discovery without human labels can be guaranteed and provide a formal foundation for the domain. Our code is available online.
updated: Tue Jun 06 2023 07:01:53 GMT+0000 (UTC)
published: Tue Jun 28 2022 10:21:17 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト