arXiv reaDer
不確実性を考慮したグラフ ネットワークを使用した航空画像のオブジェクト検出
Object Detection in Aerial Images with Uncertainty-Aware Graph Network
この作業では、構造化グラフを使用した新しい不確実性を認識するオブジェクト検出フレームワークを提案します。ノードとエッジは、それぞれオブジェクトとそれらの空間的意味的類似性によって示されます。具体的には、オブジェクトを効果的に文脈化するために、オブジェクト間の関係を考慮することを目指しています。これを実現するために、まずオブジェクトを検出し、それらのセマンティック距離と空間距離を測定してオブジェクト グラフを作成します。オブジェクト グラフは、オブジェクトのビジュアル CNN 機能を改良するためのグラフ ニューラル ネットワーク (GNN) によって表されます。ただし、CNN の特徴とすべてのオブジェクトの検出結果を絞り込むことは非効率的であり、不確実性の低い正しい予測が含まれるため、必要ではない場合があります。したがって、有向グラフ上で特定のオブジェクト (ソース) から不確実なオブジェクト (ターゲット) に表現を転送するだけでなく、GNN からの表現出力で不確実と見なされるオブジェクトのみの CNN 機能を改善することによって、不確実なオブジェクトを処理することを提案します。さらに、不確実なオブジェクトに大きな重みを与えることでトレーニング損失を計算し、特定のオブジェクトで高いパフォーマンスを維持しながら、不確実なオブジェクトの予測を改善することに集中します。このモデルをオブジェクト検出用の不確実性認識グラフ ネットワーク (UAGDet) と呼びます。次に、挑戦的な大規模な航空画像データセット、つまり DOTA で実験的に検証します。DOTA は、画像内のサイズが小さいものから大きいものまで多数のオブジェクトで構成されており、既存のオブジェクト検出ネットワークのパフォーマンスが向上します。
In this work, we propose a novel uncertainty-aware object detection framework with a structured-graph, where nodes and edges are denoted by objects and their spatial-semantic similarities, respectively. Specifically, we aim to consider relationships among objects for effectively contextualizing them. To achieve this, we first detect objects and then measure their semantic and spatial distances to construct an object graph, which is then represented by a graph neural network (GNN) for refining visual CNN features for objects. However, refining CNN features and detection results of every object are inefficient and may not be necessary, as that include correct predictions with low uncertainties. Therefore, we propose to handle uncertain objects by not only transferring the representation from certain objects (sources) to uncertain objects (targets) over the directed graph, but also improving CNN features only on objects regarded as uncertain with their representational outputs from the GNN. Furthermore, we calculate a training loss by giving larger weights on uncertain objects, to concentrate on improving uncertain object predictions while maintaining high performances on certain objects. We refer to our model as Uncertainty-Aware Graph network for object DETection (UAGDet). We then experimentally validate ours on the challenging large-scale aerial image dataset, namely DOTA, that consists of lots of objects with small to large sizes in an image, on which ours improves the performance of the existing object detection network.
updated: Tue Aug 23 2022 07:29:03 GMT+0000 (UTC)
published: Tue Aug 23 2022 07:29:03 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト