arXiv reaDer
DNNはどのショートカットキューを選択しますか?パラメータ空間の観点からの研究
Which Shortcut Cues Will DNNs Choose? A Study from the Parameter-Space Perspective
ディープニューラルネットワーク(DNN)は、多くの場合、目前の問題に必ずしも不可欠ではない、学習しやすい識別機能または手がかりに依存しています。たとえば、画像内のアヒルは、湖や小川などの典型的な背景の風景に基づいて認識される場合があります。ショートカット学習とも呼ばれるこの現象は、現世代の機械学習モデルの重要な制限として浮上しています。この作業では、ショートカット学習とその影響についての理解を深めるための一連の実験を紹介します。 WCST-MLという名前のいくつかのショートカットキューを使用してトレーニングセットアップを設計します。各キューは、目前の視覚認識の問題を等しく助長します。機会均等の下でも、(1)特定の手がかりが他の手がかりよりも好まれ、(2)習得しやすい手がかりに偏った解は、損失面で比較的平坦な最小値に収束する傾向があり、(3)解決策は焦点を合わせていることがわかります。それらの好ましい手がかりについては、パラメータ空間ではるかに豊富です。コルモゴロフ(記述)の複雑さを介して特定の手がかりの豊富さを説明します。コルモゴロフに対応するソリューション-単純な手がかりはパラメーター空間に豊富であり、したがってDNNによって好まれます。私たちの研究は、合成データセットDSpritesと顔データセットUTKFaceに基づいています。私たちのWCST-MLでは、モデルの先天的なバイアスが色や民族性などの単純な手がかりに傾いていることがわかります。私たちの調査結果は、負の社会的影響を引き起こす可能性のある先天的なモデルのバイアスを取り除くための積極的な人間の介入の重要性を強調しています。
Deep neural networks (DNNs) often rely on easy-to-learn discriminatory features, or cues, that are not necessarily essential to the problem at hand. For example, ducks in an image may be recognized based on their typical background scenery, such as lakes or streams. This phenomenon, also known as shortcut learning, is emerging as a key limitation of the current generation of machine learning models. In this work, we introduce a set of experiments to deepen our understanding of shortcut learning and its implications. We design a training setup with several shortcut cues, named WCST-ML, where each cue is equally conducive to the visual recognition problem at hand. Even under equal opportunities, we observe that (1) certain cues are preferred to others, (2) solutions biased to the easy-to-learn cues tend to converge to relatively flat minima on the loss surface, and (3) the solutions focusing on those preferred cues are far more abundant in the parameter space. We explain the abundance of certain cues via their Kolmogorov (descriptional) complexity: solutions corresponding to Kolmogorov-simple cues are abundant in the parameter space and are thus preferred by DNNs. Our studies are based on the synthetic dataset DSprites and the face dataset UTKFace. In our WCST-ML, we observe that the inborn bias of models leans toward simple cues, such as color and ethnicity. Our findings emphasize the importance of active human intervention to remove the inborn model biases that may cause negative societal impacts.
updated: Thu Feb 10 2022 16:27:51 GMT+0000 (UTC)
published: Wed Oct 06 2021 22:51:26 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト