arXiv reaDer
航空写真での指向性物体検出のための知識蒸留
Knowledge Distillation for Oriented Object Detection on Aerial Images
パラメータの数が増えた深い畳み込みニューラルネットワークにより、対象のオブジェクトに水平方向の境界ボックスで注釈が付けられた自然画像でのオブジェクト検出のタスクの精度が向上しました。鳥の視点からキャプチャされた航空写真では、モデルアーキテクチャとより深い畳み込み層のこれらの改善により、指向性オブジェクト検出タスクのパフォーマンスも向上します。ただし、計算リソースが限られているデバイスにこれらの最先端のオブジェクト検出器を直接適用することは困難であるため、モデルの圧縮による軽量モデルが必要になります。この問題に対処するために、知識蒸留による航空画像上の回転物体検出のためのモデル圧縮方法、すなわちKD-RNetを提示します。多数のパラメータを備えた十分に訓練された教師指向のオブジェクト検出器を使用して、取得されたオブジェクトカテゴリと位置情報の両方が、共同トレーニング戦略によってKD-RNetのコンパクトな学生ネットワークに転送されます。カテゴリ情報の転送は、予測確率分布に関する知識の蒸留によって実現され、位置情報転送の変位を処理するためにソフト回帰損失が採用されます。大規模な空中物体検出データセット(DOTA)での実験結果は、提案されたKD-RNetモデルが、パラメーターの数を減らして平均精度(mAP)を向上させると同時に、KD-RNetがパフォーマンスを向上させることを示しています。グラウンドトゥルースアノテーションとのオーバーラップが高い高品質の検出を提供することについて。
Deep convolutional neural network with increased number of parameters has achieved improved precision in task of object detection on natural images, where objects of interests are annotated with horizontal boundary boxes. On aerial images captured from the bird-view perspective, these improvements on model architecture and deeper convolutional layers can also boost the performance on oriented object detection task. However, it is hard to directly apply those state-of-the-art object detectors on the devices with limited computation resources, which necessitates lightweight models through model compression. In order to address this issue, we present a model compression method for rotated object detection on aerial images by knowledge distillation, namely KD-RNet. With a well-trained teacher oriented object detector with a large number of parameters, the obtained object category and location information are both transferred to a compact student network in KD-RNet by collaborative training strategy. Transferring the category information is achieved by knowledge distillation on predicted probability distribution, and a soft regression loss is adopted for handling displacement in location information transfer. The experimental result on a large-scale aerial object detection dataset (DOTA) demonstrates that the proposed KD-RNet model can achieve improved mean-average precision (mAP) with reduced number of parameters, at the same time, KD-RNet boost the performance on providing high quality detections with higher overlap with groundtruth annotations.
updated: Mon Jun 20 2022 14:24:16 GMT+0000 (UTC)
published: Mon Jun 20 2022 14:24:16 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト