arXiv reaDer
UDIS:深い視覚認識モデルにおけるバイアスの教師なし発見
UDIS: Unsupervised Discovery of Bias in Deep Visual Recognition Models
深層学習モデルは、特定のサブポピュレーションの体系的な失敗につながることがあるデータから疑似相関を学習することが示されています。以前の作業では、通常、さまざまな保護された属性のアノテーションをクラウドソーシングし、パフォーマンスを測定することでこれを診断していました。これは、取得に費用がかかり、スケーリングが困難です。この作業では、このような故障モードを表面化して分析するための教師なしアルゴリズムであるUDISを提案します。 UDISは、データセット埋め込みの階層的クラスタリングを介してサブポピュレーションを識別し、勾配加重クラスアクティベーションマップとともにパフォーマンスの低いクラスターを視覚化することにより、体系的な障害モードを表面化します。 CelebAおよびMSCOCOデータセットの画像分類用にトレーニングされたモデルの故障モードを特定する際のUDISの有効性を示します。
Deep learning models have been shown to learn spurious correlations from data that sometimes lead to systematic failures for certain subpopulations. Prior work has typically diagnosed this by crowdsourcing annotations for various protected attributes and measuring performance, which is both expensive to acquire and difficult to scale. In this work, we propose UDIS, an unsupervised algorithm for surfacing and analyzing such failure modes. UDIS identifies subpopulations via hierarchical clustering of dataset embeddings and surfaces systematic failure modes by visualizing low performing clusters along with their gradient-weighted class-activation maps. We show the effectiveness of UDIS in identifying failure modes in models trained for image classification on the CelebA and MSCOCO datasets.
updated: Fri Oct 29 2021 02:36:37 GMT+0000 (UTC)
published: Fri Oct 29 2021 02:36:37 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト