畳み込みニューラルネットワーク(CNN)は、偏光合成開口レーダー(PolSAR)画像分類の精度を向上させるために広く使用されています。ただし、ほとんどの研究では、PolSAR画像と光学画像の違いはほとんど考慮されていません。既存のCNNのほとんどは、PolSAR画像分類のタスクに合わせて調整されていません。PolSAR画像分類では、光学画像処理アーキテクチャに適合し、複素数値演算を回避するために、複素数値のPolSARデータを実数値データと単純に同等化しています。これが、CNNがPolSAR分類ですべての機能を実行できない理由の1つです。上記の問題を解決するために、このペーパーの目的は、PolSAR画像分類用に調整されたCNNフレームワークを開発することです。これは、CNNの入力としてのより良い形式のPolSARデータの探索と、提案された入力フォーム。この論文では、複素数値の特性を考慮して、未熟な複素数値演算を回避しながら元の情報の整合性を維持するために、複素数値のPolSARデータの振幅と位相を初めて入力として抽出します。次に、マルチタスクCNN(MCNN)アーキテクチャを提案して、改善された入力フォームに一致させ、より良い分類結果を達成します。さらに、位相情報から情報をより適切に抽出するために、深さ方向に分離可能な畳み込みが提案されたアーキテクチャに導入されます。 3つのPolSARベンチマークデータセットの実験は、入力として振幅と位相を使用することでPolSAR分類の改善に寄与することを証明するだけでなく、改善された入力フォームと適切に設計されたアーキテクチャ間の適応性を検証します。
Convolutional neural networks (CNNs) have been widely used to improve the accuracy of polarimetric synthetic aperture radar (PolSAR) image classification. However, in most studies, the difference between PolSAR images and optical images is rarely considered. Most of the existing CNNs are not tailored for the task of PolSAR image classification, in which complex-valued PolSAR data have been simply equated to real-valued data to fit the optical image processing architectures and avoid complex-valued operations. This is one of the reasons CNNs unable to perform their full capabilities in PolSAR classification. To solve the above problem, the objective of this paper is to develop a tailored CNN framework for PolSAR image classification, which can be implemented from two aspects: Seeking a better form of PolSAR data as the input of CNNs and building matched CNN architectures based on the proposed input form. In this paper, considering the properties of complex-valued numbers, amplitude and phase of complex-valued PolSAR data are extracted as the input for the first time to maintain the integrity of original information while avoiding immature complex-valued operations. Then, a multi-task CNN (MCNN) architecture is proposed to match the improved input form and achieve better classification results. Furthermore, depthwise separable convolution is introduced to the proposed architecture in order to better extract information from the phase information. Experiments on three PolSAR benchmark datasets not only prove that using amplitude and phase as the input do contribute to the improvement of PolSAR classification, but also verify the adaptability between the improved input form and the well-designed architectures.