ターゲットに関する情報が豊富ではないため、航空画像を使用したオブジェクトの検出と分類は困難な作業です。合成開口レーダー (SAR) 画像は、自動ターゲット認識 (ATR) システムに使用できます。これは、全天候条件および低照度環境で動作できるためです。しかし、SAR 画像にはごま塩ノイズ (スペックル ノイズ) が含まれており、深層学習モデルが意味のある特徴を抽出するのを妨げています。 ATR システムに航空写真の電気光学 (EO) 画像のみを使用しても、これらの画像は解像度が低く、極端な気象条件では十分な情報が得られないため、高い精度が得られない場合があります。したがって、複数のセンサーからの情報を使用して、自動ターゲット認識 (ATR) システムのパフォーマンスを向上させることができます。このホワイト ペーパーでは、EO と SAR センサーの両方の情報を使用して、各センサーの欠点を処理することにより、ATR システムのパフォーマンスを効果的に改善する方法について説明します。新しいマルチモーダル ドメイン フュージョン (MDF) ネットワークは、マルチモーダル データからドメイン不変の特徴を学習し、それを使用して航空写真オブジェクトを正確に分類するために提案されています。提案された MDF ネットワークは、PBVS MAVOC チャレンジ データセットのテスト フェーズで、トラック 1 で 25.3 % の精度でトップ 10 のパフォーマンスを達成し、トラック 2 で 34.26 % の精度でトップ 5 のパフォーマンスを達成します [18]。
Object detection and classification using aerial images is a challenging task as the information regarding targets are not abundant. Synthetic Aperture Radar(SAR) images can be used for Automatic Target Recognition(ATR) systems as it can operate in all-weather conditions and in low light settings. But, SAR images contain salt and pepper noise(speckle noise) that cause hindrance for the deep learning models to extract meaningful features. Using just aerial view Electro-optical(EO) images for ATR systems may also not result in high accuracy as these images are of low resolution and also do not provide ample information in extreme weather conditions. Therefore, information from multiple sensors can be used to enhance the performance of Automatic Target Recognition(ATR) systems. In this paper, we explore a methodology to use both EO and SAR sensor information to effectively improve the performance of the ATR systems by handling the shortcomings of each of the sensors. A novel Multi-Modal Domain Fusion(MDF) network is proposed to learn the domain invariant features from multi-modal data and use it to accurately classify the aerial view objects. The proposed MDF network achieves top-10 performance in the Track-1 with an accuracy of 25.3 % and top-5 performance in Track-2 with an accuracy of 34.26 % in the test phase on the PBVS MAVOC Challenge dataset [18].