Leveraging Orientation for Weakly Supervised Object Detection with Application to Firearm Localization
銃の自動検出は、人々の安全と安全を高めるために重要ですが、銃の形状、サイズ、外観にはさまざまなバリエーションがあるため、困難な作業です。また、一般的なオブジェクト検出器のほとんどは、軸に沿った長方形の領域を処理しますが、薄くて長いライフルは実際にはその領域のごく一部しかカバーせず、残りは必要なオブジェクトの署名を抑制する無関係な詳細を含む場合があります。これらの課題を処理するために、トレーニングにAxisAligned Bounding Box(AABB)を使用しながら、方向付けられたオブジェクト境界ボックス(OBB)を検出することを学習する弱教師ありOrientation Aware Object Detection(OAOD)アルゴリズムを提案します。提案されたOAODは、常に存在するとは限らないトレーニング中にOBBを厳密に必要とする既存の指向性オブジェクト検出器とは異なります。 AABBとOBBの検出に関するトレーニングの目標は、ステージ1がAABBを予測し、ステージ2がOBBを予測する多段階スキームを採用することによって達成されます。 2つの段階の間に、方向付けされた提案生成モジュールとオブジェクト整列RoIプーリングは、予測された方向性に基づいて特徴を抽出し、これらの特徴の方向性を不変にするように設計されています。 11,000枚の画像で構成される多様でやりがいのあるデータセットも、銃の分類と位置特定のために手動で注釈が付けられた銃の検出用に提案されています。提案されているITU銃器データセット(ITUF)には、さまざまな銃やライフルが含まれています。 OAODアルゴリズムは、ITUFデータセットで評価され、完全に監視された指向性オブジェクト検出器を含む、現在の最先端のオブジェクト検出器と比較されます。 OAODは、両方のタイプのオブジェクト検出器を大幅に上回っています。実験結果(AABBでmAP:88.3およびOBBでmAP:77.5)は、銃器検出のために提案されたアルゴリズムの有効性を示しています。
Automatic detection of firearms is important for enhancing the security and safety of people, however, it is a challenging task owing to the wide variations in shape, size, and appearance of firearms. Also, most of the generic object detectors process axis-aligned rectangular areas though, a thin and long rifle may actually cover only a small percentage of that area and the rest may contain irrelevant details suppressing the required object signatures. To handle these challenges, we propose a weakly supervised Orientation Aware Object Detection (OAOD) algorithm which learns to detect oriented object bounding boxes (OBB) while using AxisAligned Bounding Boxes (AABB) for training. The proposed OAOD is different from the existing oriented object detectors which strictly require OBB during training which may not always be present. The goal of training on AABB and detection of OBB is achieved by employing a multistage scheme, with Stage-1 predicting the AABB and Stage-2 predicting OBB. In-between the two stages, the oriented proposal generation module along with the object aligned RoI pooling is designed to extract features based on the predicted orientation and to make these features orientation invariant. A diverse and challenging dataset consisting of eleven thousand images is also proposed for firearm detection which is manually annotated for firearm classification and localization. The proposed ITU Firearm dataset (ITUF) contains a wide range of guns and rifles. The OAOD algorithm is evaluated on the ITUF dataset and compared with current state-of-the-art object detectors, including fully supervised oriented object detectors. OAOD has outperformed both types of object detectors with a significant margin. The experimental results (mAP: 88.3 on AABB & mAP: 77.5 on OBB) demonstrate the effectiveness of the proposed algorithm for firearm detection.
updated: Fri Jan 29 2021 19:40:10 GMT+0000 (UTC)
published: Mon Apr 22 2019 18:56:43 GMT+0000 (UTC)
