arXiv reaDer
DiagViB-6:ショートカットと一般化の機会が存在する場合のビジョンモデルの診断ベンチマークスイート
DiagViB-6: A Diagnostic Benchmark Suite for Vision Models in the Presence of Shortcut and Generalization Opportunities
画像分類のための一般的なディープニューラルネットワーク(DNN)は、予測的で表現しやすい視覚的要因の形でショートカット機会(SO)に依存することが示されています。これはショートカット学習として知られており、一般化の障害につながります。この作業では、形状、色、テクスチャなどの基本的な視覚オブジェクトの変化要因(FoV)のみを予測する場合、一般的なDNNもショートカット学習に苦しむことを示します。ショートカットの機会に加えて、一般化の機会(GO)も実世界のビジョンデータの固有の部分であり、予測されたクラスとFoVの間の部分的な独立性から生じると主張します。また、DNNがショートカット学習を克服するためにGOを活用する必要があることも主張します。私たちの主な貢献は、診断ビジョンベンチマークスイートDiagViB-6を導入することです。これには、6つの独立したFoVに対するネットワークのショートカットの脆弱性と一般化機能を研究するためのデータセットとメトリックが含まれています。特に、DiagViB-6では、データセット内のSOとGOのタイプと程度を制御できます。さまざまな人気のあるビジョンアーキテクチャのベンチマークを行い、GOを限られた範囲でしか活用できないことを示しています。
Common deep neural networks (DNNs) for image classification have been shown to rely on shortcut opportunities (SO) in the form of predictive and easy-to-represent visual factors. This is known as shortcut learning and leads to impaired generalization. In this work, we show that common DNNs also suffer from shortcut learning when predicting only basic visual object factors of variation (FoV) such as shape, color, or texture. We argue that besides shortcut opportunities, generalization opportunities (GO) are also an inherent part of real-world vision data and arise from partial independence between predicted classes and FoVs. We also argue that it is necessary for DNNs to exploit GO to overcome shortcut learning. Our core contribution is to introduce the Diagnostic Vision Benchmark suite DiagViB-6, which includes datasets and metrics to study a network's shortcut vulnerability and generalization capability for six independent FoV. In particular, DiagViB-6 allows controlling the type and degree of SO and GO in a dataset. We benchmark a wide range of popular vision architectures and show that they can exploit GO only to a limited extent.
updated: Fri Oct 08 2021 12:07:01 GMT+0000 (UTC)
published: Thu Aug 12 2021 14:43:24 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト