arXiv reaDer
階層的セマンティックツリーの概念 解釈可能な画像分類のためのホワイトニング
Hierarchical Semantic Tree Concept Whitening for Interpretable Image Classification
ディープ ニューラル ネットワーク (DNN) の人気に伴い、モデルの解釈可能性が重大な懸念事項になっています。予測がどのように行われるかを説明したり、中間層のニューロンの意味を理解したりするなど、事後分析を通じて問題に取り組むための多くのアプローチが開発されています。それにもかかわらず、これらの方法では、モデルに自然に存在するパターンや規則しか発見できません。この研究では、事後的なスキームに依存するのではなく、隠れ層で人間が理解できる概念の表現を変更するための知識を積極的に注入します。具体的には、意味論的概念の階層ツリーを使用して知識を保存し、深いモデルをトレーニングする際に画像データ インスタンスの表現を正規化するために利用されます。潜在空間の軸は意味概念と一致しており、概念間の階層関係も保存されます。実世界の画像データセットでの実験では、私たちの方法がモデルの解釈可能性を向上させ、モデル分類のパフォーマンスに悪影響を与えることなく、意味概念のより良い解きほぐしを示すことが示されました。
With the popularity of deep neural networks (DNNs), model interpretability is becoming a critical concern. Many approaches have been developed to tackle the problem through post-hoc analysis, such as explaining how predictions are made or understanding the meaning of neurons in middle layers. Nevertheless, these methods can only discover the patterns or rules that naturally exist in models. In this work, rather than relying on post-hoc schemes, we proactively instill knowledge to alter the representation of human-understandable concepts in hidden layers. Specifically, we use a hierarchical tree of semantic concepts to store the knowledge, which is leveraged to regularize the representations of image data instances while training deep models. The axes of the latent space are aligned with the semantic concepts, where the hierarchical relations between concepts are also preserved. Experiments on real-world image datasets show that our method improves model interpretability, showing better disentanglement of semantic concepts, without negatively affecting model classification performance.
updated: Mon Jul 10 2023 04:54:05 GMT+0000 (UTC)
published: Mon Jul 10 2023 04:54:05 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト