arXiv reaDer
TAX: マルチアノテーターを使用したセマンティック セグメンテーションの傾向と割り当ての説明
TAX: Tendency-and-Assignment Explainer for Semantic Segmentation with Multi-Annotators
ディープ ニューラル ネットワークが分類予測を実行する方法を理解するために、最近の研究の注目は、望ましい説明を提供する技術の開発に集中しています。ただし、ほとんどの既存の方法は、セマンティック セグメンテーションに簡単に適用できません。さらに、それらはマルチアノテーター設定で解釈可能性を提供するようには設計されていません。一貫したラベリング傾向を持つ単一のアノテーターによってアノテートされたグラウンド トゥルース ピクセル レベルのラベルを表示する代わりに、解釈可能なセマンティック セグメンテーションを提供し、「誰が」結果のセグメンテーションに貢献し、「なぜ」そのような担当が決定。このホワイト ペーパーでは、アノテーターと割り当てレベルで解釈可能性を提供するように設計された、Tendency-and-Assignment Explainer (TAX) の学習フレームワークを紹介します。より具体的には、各タイプのアノテーションのラベリング傾向をモデル化するための畳み込みカーネル サブセットを学習する一方で、上記のカーネルを学習するための視覚的なガイダンスを提供するためにプロトタイプ バンクを共同で観察します。評価のために、マルチアノテーターを使用した合成データセットと実世界のデータセットの両方を検討します。私たちの TAX は、同等のパフォーマンスを備えた最先端のネットワーク アーキテクチャに適用できることを示していますが、両方のレベルでのセグメンテーションの解釈可能性はそれに応じて提供できます。
To understand how deep neural networks perform classification predictions, recent research attention has been focusing on developing techniques to offer desirable explanations. However, most existing methods cannot be easily applied for semantic segmentation; moreover, they are not designed to offer interpretability under the multi-annotator setting. Instead of viewing ground-truth pixel-level labels annotated by a single annotator with consistent labeling tendency, we aim at providing interpretable semantic segmentation and answer two critical yet practical questions: "who" contributes to the resulting segmentation, and "why" such an assignment is determined. In this paper, we present a learning framework of Tendency-and-Assignment Explainer (TAX), designed to offer interpretability at the annotator and assignment levels. More specifically, we learn convolution kernel subsets for modeling labeling tendencies of each type of annotation, while a prototype bank is jointly observed to offer visual guidance for learning the above kernels. For evaluation, we consider both synthetic and real-world datasets with multi-annotators. We show that our TAX can be applied to state-of-the-art network architectures with comparable performances, while segmentation interpretability at both levels can be offered accordingly.
updated: Sun Feb 19 2023 12:40:22 GMT+0000 (UTC)
published: Sun Feb 19 2023 12:40:22 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト