arXiv reaDer
反事実を使用した DNN の体系的な弱点の評価
Assessing Systematic Weaknesses of DNNs using Counterfactuals
DNN がセーフティクリティカルなアプリケーションに進出するにつれて、そのようなモデルのテスト手法がより注目されるようになりました。現在の方向性は、平均性能値に基づく安全性の仮定を危険にさらす体系的な弱点を探索し、特定することです。このような弱点は、DNN が予想される平均より体系的に悪いパフォーマンスを示す入力空間内の (意味的に一貫した) サブセットまたは領域の形をとる可能性があります。ただし、このように観測されたパフォーマンスの低下の理由を、サブセットを記述する特定の意味論的特徴に帰することは自明ではありません。たとえば、他の (考慮されていない) 属性に関するデータ内の不均一性により、結果が歪む可能性があります。ただし、すべての (利用可能な) 属性とその相互作用を考慮すると、多くの場合、計算コストが非常に高くなります。反事実の説明に触発されて、既存のサブセットの意味的属性を検証する、つまり、特定された属性がパフォーマンス低下の原因である可能性が高いかどうかを確認する、効果的で計算コストの低いアルゴリズムを提案します。このアプローチを、高度に注釈が付けられたシミュレーション データを使用した自動運転ドメインの例で実証します。このアプローチでは、セマンティック セグメンテーション モデルについて、(i) さまざまな歩行者資産間にパフォーマンスの違いが存在するが、(ii) 一部の場合にのみ資産が異なることを示します。このパフォーマンス低下の原因は、それ自体にあります。
With the advancement of DNNs into safety-critical applications, testing approaches for such models have gained more attention. A current direction is the search for and identification of systematic weaknesses that put safety assumptions based on average performance values at risk. Such weaknesses can take on the form of (semantically coherent) subsets or areas in the input space where a DNN performs systematically worse than its expected average. However, it is non-trivial to attribute the reason for such observed low performances to the specific semantic features that describe the subset. For instance, inhomogeneities within the data w.r.t. other (non-considered) attributes might distort results. However, taking into account all (available) attributes and their interaction is often computationally highly expensive. Inspired by counterfactual explanations, we propose an effective and computationally cheap algorithm to validate the semantic attribution of existing subsets, i.e., to check whether the identified attribute is likely to have caused the degraded performance. We demonstrate this approach on an example from the autonomous driving domain using highly annotated simulated data, where we show for a semantic segmentation model that (i) performance differences among the different pedestrian assets exist, but (ii) only in some cases is the asset type itself the reason for this reduction in the performance.
updated: Thu Aug 03 2023 08:41:39 GMT+0000 (UTC)
published: Thu Aug 03 2023 08:41:39 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト