arXiv reaDer
マルチラベル空中画像分類のための関係ネットワーク
Relation Network for Multi-label Aerial Image Classification
 マルチラベル分類は、航空写真の複雑な内容を認識する上で重要な役割を果たし、過去数年にわたっていくつかの関連研究をトリガーします。ただし、それらのほとんどは、ラベル関係を活用するための努力をほとんど展開していませんが、そのような依存関係は正確な予測を行うために重要です。このようなラベルの依存関係をチェーン伝播方式でモデリングするためにLSTMレイヤーを導入できますが、特定のラベルが不適切に推論されると効率が疑問視される場合があります。これに対処するために、新規の空中画像マルチラベル分類ネットワーク、注意を意識したラベル関係推論ネットワークを提案します。特に、ネットワークは3つの要素モジュールで構成されています。1)ラベル単位のフィーチャパーセル学習モジュール、2)注意領域抽出モジュール、3)ラベル関係推論モジュール。具体的には、ラベル単位のフィーチャパーセル学習モジュールは、ラベル固有の高レベルのフィーチャを抽出するように設計されています。注意領域抽出モジュールは、これらの機能の識別領域をローカライズし、注意ラベル固有の機能を生成することを目的としています。ラベル関係推論モジュールは、前のモジュールの出力から推論されたラベル関係を使用して、ラベルの存在を最終的に予測します。提案されたネットワークは、差別的なラベルごとの特徴を提案なしで抽出し、ラベル関係について自然かつ解釈可能に推論する能力によって特徴付けられます。実験では、UCMマルチラベルデータセットおよび新しく作成されたデータセットであるAIDマルチラベルデータセットで提案されたモデルを評価します。これら2つのデータセットの定量的および定性的な結果は、モデルの有効性を示しています。マルチラベル空中画像分類の進捗を促進するために、AIDマルチラベルデータセットが公開されます。
Multi-label classification plays a momentous role in perceiving intricate contents of an aerial image and triggers several related studies over the last years. However, most of them deploy few efforts in exploiting label relations, while such dependencies are crucial for making accurate predictions. Although an LSTM layer can be introduced to modeling such label dependencies in a chain propagation manner, the efficiency might be questioned when certain labels are improperly inferred. To address this, we propose a novel aerial image multi-label classification network, attention-aware label relational reasoning network. Particularly, our network consists of three elemental modules: 1) a label-wise feature parcel learning module, 2) an attentional region extraction module, and 3) a label relational inference module. To be more specific, the label-wise feature parcel learning module is designed for extracting high-level label-specific features. The attentional region extraction module aims at localizing discriminative regions in these features and yielding attentional label-specific features. The label relational inference module finally predicts label existences using label relations reasoned from outputs of the previous module. The proposed network is characterized by its capacities of extracting discriminative label-wise features in a proposal-free way and reasoning about label relations naturally and interpretably. In our experiments, we evaluate the proposed model on the UCM multi-label dataset and a newly produced dataset, AID multi-label dataset. Quantitative and qualitative results on these two datasets demonstrate the effectiveness of our model. To facilitate progress in the multi-label aerial image classification, the AID multi-label dataset will be made publicly available.
updated: Mon Feb 10 2020 03:44:21 GMT+0000 (UTC)
published: Tue Jul 16 2019 22:00:47 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト