顕著性マップを抽出するために現在利用可能なメソッドは、特定の固定分類器にとって最も重要な入力の部分を識別します。この特定の分類子への強い依存がパフォーマンスを妨げることを示します。この問題に対処するために、分類子にとらわれない顕著性マップの抽出を提案します。これは、事前に指定された1つだけでなく、分類子が使用できる画像のすべての部分を検出します。提案されたアプローチは、概念的にシンプルで実装しやすい一方で、以前の作業よりも高品質の顕著性マップを抽出することがわかります。この方法は、ImageNetデータのローカリゼーションタスクに新しい最先端の結果を設定し、推論時にグラウンドトゥルースラベルを使用していなくても、既存のすべての弱監視ローカリゼーション手法よりも優れています。結果を再現するコードはhttps://github.com/kondiz/casmeで入手できます。この原稿の最終版は、コンピュータビジョンと画像理解で公開されており、https://doi.org/10.1016/j.cviu.2020.102969からオンラインで入手できます。
Currently available methods for extracting saliency maps identify parts of the input which are the most important to a specific fixed classifier. We show that this strong dependence on a given classifier hinders their performance. To address this problem, we propose classifier-agnostic saliency map extraction, which finds all parts of the image that any classifier could use, not just one given in advance. We observe that the proposed approach extracts higher quality saliency maps than prior work while being conceptually simple and easy to implement. The method sets the new state of the art result for localization task on the ImageNet data, outperforming all existing weakly-supervised localization techniques, despite not using the ground truth labels at the inference time. The code reproducing the results is available at https://github.com/kondiz/casme . The final version of this manuscript is published in Computer Vision and Image Understanding and is available online at https://doi.org/10.1016/j.cviu.2020.102969 .