arXiv reaDer
異常クラスタリング:画像を異常タイプのコヒーレントクラスターにグループ化する
Anomaly Clustering: Grouping Images into Coherent Clusters of Anomaly Types
異常クラスタリングを紹介します。その目標は、データを異常タイプの意味的にコヒーレントなクラスターにグループ化することです。これは、異常を通常のデータから分割することを目的とする異常検出とは異なります。オブジェクト中心の画像クラスタリングアプリケーションとは異なり、異常なパターンは微妙で局所的であるため、異常なクラスタリングは特に困難です。パッチベースの事前トレーニング済みのディープ埋め込みと既成のクラスタリング手法を使用した、シンプルでありながら効果的なクラスタリングフレームワークを紹介します。画像間の距離関数を定義します。各画像は埋め込みのバッグとして表され、加重平均埋め込み間のユークリッド距離によって定義されます。重みは、バッグ内のインスタンス(つまり、パッチの埋め込み)の重要性を定義し、欠陥のある領域を強調する場合があります。ラベル付けされた正規データが利用可能な場合は、教師なし方法または半教師あり方法で重みを計算します。広範な実験的研究は、既存の複数インスタンスまたはディープクラスタリングフレームワークに対する新しい距離関数とともに、提案されたクラスタリングフレームワークの有効性を示しています。全体として、私たちのフレームワークは、MVTecオブジェクトおよびテクスチャカテゴリで0.451および0.674の正規化された相互情報量スコアを達成し、ベースライン(0.244、0.273)または最先端をはるかに超えるいくつかのラベル付き正規データ(0.577、0.669)でさらに改善しますディープクラスタリング手法(0.176、0.277)。
We introduce anomaly clustering, whose goal is to group data into semantically coherent clusters of anomaly types. This is different from anomaly detection, whose goal is to divide anomalies from normal data. Unlike object-centered image clustering applications, anomaly clustering is particularly challenging as anomalous patterns are subtle and local. We present a simple yet effective clustering framework using a patch-based pretrained deep embeddings and off-the-shelf clustering methods. We define a distance function between images, each of which is represented as a bag of embeddings, by the Euclidean distance between weighted averaged embeddings. The weight defines the importance of instances (i.e., patch embeddings) in the bag, which may highlight defective regions. We compute weights in an unsupervised way or in a semi-supervised way if labeled normal data is available. Extensive experimental studies show the effectiveness of the proposed clustering framework along with a novel distance function upon existing multiple instance or deep clustering frameworks. Overall, our framework achieves 0.451 and 0.674 normalized mutual information scores on MVTec object and texture categories and further improve with a few labeled normal data (0.577, 0.669), far exceeding the baselines (0.244, 0.273) or state-of-the-art deep clustering methods (0.176, 0.277).
updated: Tue Dec 21 2021 23:11:33 GMT+0000 (UTC)
published: Tue Dec 21 2021 23:11:33 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト