Deep Hashing Learning for Visual and Semantic Retrieval of Remote Sensing Images
  リモートセンシングビッグデータの管理に対する緊急の需要に牽引されて、リモートセンシングの分野で大規模なリモートセンシング画像検索(RSIR)が注目を集めています。一般に、既存の検索方法は、データベースから特定のクエリ画像に一連の類似画像を検索して返す視覚ベースの検索アプローチと見なすことができます。検索方法は大成功を収めましたが、まだ回答が必要な質問があります:返された類似画像の正確な意味ラベルを取得して、画像の分析と処理をさらに支援できますか?上記の質問に触発されて、本論文では、画像検索の問題を画像の視覚的および意味的検索として再定義します。具体的には、類似の画像を同時に取得し、それらのセマンティックラベルを統一されたフレームワークで分類するための新しいディープハッシュ畳み込みニューラルネットワーク(DHCNN)を提案します。より詳細には、畳み込みニューラルネットワーク(CNN)を使用して、高次元の深い特徴を抽出します。次に、ハッシュレイヤーをネットワークに完全に挿入して、深い機能をコンパクトなハッシュコードに転送します。さらに、ハッシュレイヤーでsoftmax関数を使用して完全に接続されたレイヤーが実行され、クラス分布が生成されます。最後に、損失関数は、各画像のラベル損失と画像ペアの類似性損失を同時に考慮するように精巧に設計されています。 2つのリモートセンシングデータセットの実験結果は、提案された方法が最先端の検索と分類のパフォーマンスを達成することを示しています。
Driven by the urgent demand for managing remote sensing big data, large-scale remote sensing image retrieval (RSIR) attracts increasing attention in the remote sensing field. In general, existing retrieval methods can be regarded as visual-based retrieval approaches which search and return a set of similar images from a database to a given query image. Although retrieval methods have achieved great success, there is still a question that needs to be responded to: Can we obtain the accurate semantic labels of the returned similar images to further help analyzing and processing imagery? Inspired by the above question, in this paper, we redefine the image retrieval problem as visual and semantic retrieval of images. Specifically, we propose a novel deep hashing convolutional neural network (DHCNN) to simultaneously retrieve the similar images and classify their semantic labels in a unified framework. In more detail, a convolutional neural network (CNN) is used to extract high-dimensional deep features. Then, a hash layer is perfectly inserted into the network to transfer the deep features into compact hash codes. In addition, a fully connected layer with a softmax function is performed on hash layer to generate class distribution. Finally, a loss function is elaborately designed to simultaneously consider the label loss of each image and similarity loss of pairs of images. Experimental results on two remote sensing datasets demonstrate that the proposed method achieves the state-of-art retrieval and classification performance.
updated: Tue Sep 10 2019 16:45:02 GMT+0000 (UTC)
published: Tue Sep 10 2019 16:45:02 GMT+0000 (UTC)
