パーツプロトタイプネットワーク(ProtoPNets)は、透明性を損なうことなくブラックボックスモデルと同じパフォーマンスを実現するように設計された概念ベースの分類器です。 ProtoPNetsは、トレーニング例の一部を認識するために学習したクラス固有の部分プロトタイプとの類似性に基づいて予測を計算します。これにより、どの例がターゲット予測の原因であるか、およびその理由を忠実に判断できます。ただし、他のモデルと同様に、データから混乱やショートカットを取得する傾向があるため、予測精度が低下し、一般化が制限されます。 ProtoPNetsの効果的なコンセプトレベルのデバッガーであるProtoPDebugを提案します。このデバッガーでは、モデルの説明に基づいて人間のスーパーバイザーが、どの部分のプロトタイプを忘れたり保持したりする必要があるかという形でフィードバックを提供し、モデルを微調整して調整します。この監督。合成データと実世界のデータに関する広範な経験的評価は、ProtoPDebugが最先端のデバッガーよりもわずかな注釈コストで優れていることを示しています。
Part-prototype Networks (ProtoPNets) are concept-based classifiers designed to achieve the same performance as black-box models without compromising transparency. ProtoPNets compute predictions based on similarity to class-specific part-prototypes learned to recognize parts of training examples, making it easy to faithfully determine what examples are responsible for any target prediction and why. However, like other models, they are prone to picking up confounds and shortcuts from the data, thus suffering from compromised prediction accuracy and limited generalization. We propose ProtoPDebug, an effective concept-level debugger for ProtoPNets in which a human supervisor, guided by the model's explanations, supplies feedback in the form of what part-prototypes must be forgotten or kept, and the model is fine-tuned to align with this supervision. An extensive empirical evaluation on synthetic and real-world data shows that ProtoPDebug outperforms state-of-the-art debuggers for a fraction of the annotation cost.