arXiv reaDer
パズル-AE:パズルを解くことによる画像のノベルティ検出
Puzzle-AE: Novelty Detection in Images through Solving Puzzles
オートエンコーダは、多くの異常検出方法の重要な部分として、複雑なデータセットの通常のデータに対する柔軟性に欠けています。 U-Netはこの目的に効果的であることが証明されていますが、他のAEベースのフレームワークと同様に再構成エラーを使用してトレーニングした場合、トレーニングデータに適合しません。自己教師あり学習(SSL)メソッドの口実タスクとしてのパズル解決は、意味的に意味のある機能を学習する能力を以前に証明しました。このタスクに基づいてU-Netをトレーニングすることは、過剰適合を防ぎ、ピクセルレベルの機能を超えた学習を容易にする効果的な救済策であることを示します。ただし、ショートカットソリューションは、ジグソーパズルを含むSSLタスクの大きな課題です。効果的な自動ショートカット削除として、敵対的なロバストトレーニングを提案します。さまざまなおもちゃや実世界のデータセットで、最先端(SOTA)の異常検出方法と比較して、競争力のある、または優れた結果を達成します。多くの競合他社とは異なり、提案されたフレームワークは安定していて、高速で、データ効率が高く、無原則の早期停止を必要としません。
Autoencoder, as an essential part of many anomaly detection methods, is lacking flexibility on normal data in complex datasets. U-Net is proved to be effective for this purpose but overfits on the training data if trained by just using reconstruction error similar to other AE-based frameworks. Puzzle-solving, as a pretext task of self-supervised learning (SSL) methods, has earlier proved its ability in learning semantically meaningful features. We show that training U-Nets based on this task is an effective remedy that prevents overfitting and facilitates learning beyond pixel-level features. Shortcut solutions, however, are a big challenge in SSL tasks, including jigsaw puzzles. We propose adversarial robust training as an effective automatic shortcut removal. We achieve competitive or superior results compared to the State of the Art (SOTA) anomaly detection methods on various toy and real-world datasets. Unlike many competitors, the proposed framework is stable, fast, data-efficient, and does not require unprincipled early stopping.
updated: Wed Nov 18 2020 16:48:00 GMT+0000 (UTC)
published: Sat Aug 29 2020 10:53:55 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト