X線セキュリティ画像で禁止されているアイテムを検出することは、さまざまな脅威プロファイルに対する境界と輸送のセキュリティを維持する上で極めて重要です。大量のデータをサポートする畳み込みニューラルネットワーク(CNN)は、そのような自動化された禁止オブジェクトの検出と分類に進歩をもたらしました。ただし、このような大量のX線セキュリティイメージの照合は、依然として大きな課題です。この作業により、合成的に合成された画像を使用する可能性が開かれ、手作業で注釈付けされたこのような大量の現実世界の画像を照合する必要がなくなります。ここでは、散らばった複雑なX線セキュリティ手荷物画像内の3つの典型的な禁止アイテム{銃器、銃器部品、ナイフ、を検出するCNNアーキテクチャの実際のX線トレーニング画像を使用して達成された検出性能の違いを調査します。実際のX線画像を使用したこの3クラスのオブジェクト検出では、高速R-CNNおよびResNet-101 CNNアーキテクチャを使用して0.88の平均平均精度(mAP)を実現しています。パフォーマンスは合成合成X線画像(0.78 mAP)に匹敵しますが、拡張評価では、合成合成画像を使用して自動検出アルゴリズムトレーニング用のX線セキュリティトレーニング画像を多様化するという課題と約束の両方を示しています。
Detecting prohibited items in X-ray security imagery is pivotal in maintaining border and transport security against a wide range of threat profiles. Convolutional Neural Networks (CNN) with the support of a significant volume of data have brought advancement in such automated prohibited object detection and classification. However, collating such large volumes of X-ray security imagery remains a significant challenge. This work opens up the possibility of using synthetically composed imagery, avoiding the need to collate such large volumes of hand-annotated real-world imagery. Here we investigate the difference in detection performance achieved using real and synthetic X-ray training imagery for CNN architecture detecting three exemplar prohibited items, {Firearm, Firearm Parts, Knives, within cluttered and complex X-ray security baggage imagery. We achieve 0.88 of mean average precision (mAP) with a Faster R-CNN and ResNet-101 CNN architecture for this 3-class object detection using real X-ray imagery. While the performance is comparable with synthetically composited X-ray imagery (0.78 mAP), our extended evaluation demonstrates both challenge and promise of using synthetically composed images to diversify the X-ray security training imagery for automated detection algorithm training.