arXiv reaDer
ショックグラフ埋め込みによる形状バイアスドメインの一般化
Shape-Biased Domain Generalization via Shock Graph Embeddings
画像畳み込みニューラルネットワーク(CNN)の脆弱性、つまり画像の破損、摂動、および敵対的攻撃に対する感度がテクスチャバイアスに関連しているという新たな感覚があります。この形状バイアスの相対的な欠如は、ドメイン一般化(DG)のパフォーマンス低下の原因でもあります。形状の役割を含めることでこれらの脆弱性が軽減され、一部のアプローチでは、ネガティブイメージ、エッジマップが付与されたイメージ、または形状とテクスチャの情報が競合するイメージをトレーニングすることでこれを実現しています。この論文では、古典的なコンピュータビジョンアプローチを使用した形状の明示的かつ完全な表現、つまり、等高線図のショックグラフを使用して画像の形状コンテンツを表現することを提唱しています。結果のグラフとその記述子は、輪郭の内容を完全に表したものであり、最近のGraph Neural Network(GNN)メソッドを使用して分類されます。 3つのドメインシフトデータセット、Colored MNIST、PACS、およびVLCSの実験結果は、外観を使用しなくても、形状ベースのアプローチがドメインの一般化において従来のImageCNNベースの方法を超えることを示しています。
There is an emerging sense that the vulnerability of Image Convolutional Neural Networks (CNN), i.e., sensitivity to image corruptions, perturbations, and adversarial attacks, is connected with Texture Bias. This relative lack of Shape Bias is also responsible for poor performance in Domain Generalization (DG). The inclusion of a role of shape alleviates these vulnerabilities and some approaches have achieved this by training on negative images, images endowed with edge maps, or images with conflicting shape and texture information. This paper advocates an explicit and complete representation of shape using a classical computer vision approach, namely, representing the shape content of an image with the shock graph of its contour map. The resulting graph and its descriptor is a complete representation of contour content and is classified using recent Graph Neural Network (GNN) methods. The experimental results on three domain shift datasets, Colored MNIST, PACS, and VLCS demonstrate that even without using appearance the shape-based approach exceeds classical Image CNN based methods in domain generalization.
updated: Mon Sep 13 2021 02:10:40 GMT+0000 (UTC)
published: Mon Sep 13 2021 02:10:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト