arXiv reaDer
ノイズの多いX線画像で禁止されているアイテムを検出するためのオーバーサンプリングデオクルージョンアテンションネットワーク
Over-sampling De-occlusion Attention Network for Prohibited Items Detection in Noisy X-ray Images
セキュリティ検査は、スーツケースの中の私物のX線スキャンです。これは、公安にとっては非常に重要ですが、人間の検査官にとっては非常に時間がかかります。幸いなことに、ディープラーニングはコンピュータービジョンの開発を大いに促進し、自動セキュリティ検査の可能な方法を提供しています。ただし、荷物内のアイテムはランダムに重なり合っているため、オクルージョンが大きく、ノイズの多いX線画像が生成されます。したがって、一般的な画像認識データセットを介してトレーニングされた従来のCNNベースのモデルは、このシナリオでは満足のいくパフォーマンスを達成できません。これらの問題に対処するために、広く発生している禁止アイテム「カッター」の5つのカテゴリからの8885X線画像を含むOPIXrayという名前の最初の高品質禁止X線オブジェクト検出データセットを提供します。画像は空港から収集され、これらの禁止されたアイテムは専門の検査官によって手動で注釈が付けられます。これはモデルトレーニングのベンチマークとして使用でき、将来の研究をさらに容易にします。閉塞X線物体検出をより良く改善するために、新しいオーバーオクルージョン注意モジュールと新しいオーバーサンプリングトレーニング戦略で構成されるオーバーサンプリングデオクルージョン注意ネットワーク(DOAM-O)をさらに提案します。具体的には、オクルージョン解除モジュール、つまりDOAMは、禁止されているアイテムのさまざまな外観情報を同時に活用します。オーバーサンプリングトレーニング戦略により、モデルは、このシナリオにより適した、高いオクルージョンレベルのこれらのアイテムで構成されるこれらのハードサンプルにさらに重点を置くようになります。 OPIXrayデータセットでDOAM-Oを包括的に評価しました。これは、このモデルがSSD、YOLOv3、FCOSなどの有名な検出モデルのパフォーマンスを安定して向上させ、広く使用されている多くの注意メカニズムよりも優れていることを証明しています。
Security inspection is X-ray scanning for personal belongings in suitcases, which is significantly important for the public security but highly time-consuming for human inspectors. Fortunately, deep learning has greatly promoted the development of computer vision, offering a possible way of automatic security inspection. However, items within a luggage are randomly overlapped resulting in noisy X-ray images with heavy occlusions. Thus, traditional CNN-based models trained through common image recognition datasets fail to achieve satisfactory performance in this scenario. To address these problems, we contribute the first high-quality prohibited X-ray object detection dataset named OPIXray, which contains 8885 X-ray images from 5 categories of the widely-occurred prohibited item ``cutters''. The images are gathered from an airport and these prohibited items are annotated manually by professional inspectors, which can be used as a benchmark for model training and further facilitate future research. To better improve occluded X-ray object detection, we further propose an over-sampling de-occlusion attention network (DOAM-O), which consists of a novel de-occlusion attention module and a new over-sampling training strategy. Specifically, our de-occlusion module, namely DOAM, simultaneously leverages the different appearance information of the prohibited items; the over-sampling training strategy forces the model to put more emphasis on these hard samples consisting these items of high occlusion levels, which is more suitable for this scenario. We comprehensively evaluated DOAM-O on the OPIXray dataset, which proves that our model can stably improve the performance of the famous detection models such as SSD, YOLOv3, and FCOS, and outperform many extensively-used attention mechanisms.
updated: Mon Mar 01 2021 07:17:37 GMT+0000 (UTC)
published: Mon Mar 01 2021 07:17:37 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト