arXiv reaDer
リモートセンシング画像検索のための非対称ハッシュコード学習
Asymmetric Hash Code Learning for Remote Sensing Image Retrieval
リモートセンシング画像検索(RSIR)は、特定のクエリ画像に類似したアイテムのセットを検索することを目的としており、リモートセンシングアプリケーションでは非常に重要なタスクです。現在の主流の方法としてのディープハッシュ学習は、満足のいく検索パフォーマンスを達成しています。一方では、リモートセンシング画像の意味的特徴を抽出するために、さまざまなディープニューラルネットワークが使用されます。一方、ハッシュ手法は、高次元の深い特徴を低次元のバイナリコードにマッピングするためにその後採用されます。この種のメソッドは、クエリサンプルとデータベースサンプルの両方に対して対称的な方法で1つのハッシュ関数を学習しようとします。ただし、データベースサンプルの数が増えると、通常、大規模なデータベースイメージのハッシュコードを生成するのに時間がかかります。本論文では、RSIRのための非対称ハッシュコード学習(AHCL)と呼ばれる新しいディープハッシュ法を提案する。提案されたAHCLは、非対称的な方法でクエリとデータベースの画像のハッシュコードを生成します。より詳細には、クエリ画像のハッシュコードはネットワークの出力を2値化することによって取得され、データベース画像のハッシュコードは設計された目的関数を解くことによって直接学習されます。さらに、各画像のセマンティック情報と画像のペアの類似性情報を監視情報として組み合わせて、ディープハッシュネットワークをトレーニングします。これにより、ディープフィーチャとハッシュコードの表現能力が向上します。 3つの公開データセットでの実験結果は、提案された方法が検索の精度と効率の点で対称的な方法よりも優れていることを示しています。ソースコードは、https://github.com/weiweisong415/Demo AHCL forTGRS2022で入手できます。
Remote sensing image retrieval (RSIR), aiming at searching for a set of similar items to a given query image, is a very important task in remote sensing applications. Deep hashing learning as the current mainstream method has achieved satisfactory retrieval performance. On one hand, various deep neural networks are used to extract semantic features of remote sensing images. On the other hand, the hashing techniques are subsequently adopted to map the high-dimensional deep features to the low-dimensional binary codes. This kind of methods attempts to learn one hash function for both the query and database samples in a symmetric way. However, with the number of database samples increasing, it is typically time-consuming to generate the hash codes of large-scale database images. In this paper, we propose a novel deep hashing method, named asymmetric hash code learning (AHCL), for RSIR. The proposed AHCL generates the hash codes of query and database images in an asymmetric way. In more detail, the hash codes of query images are obtained by binarizing the output of the network, while the hash codes of database images are directly learned by solving the designed objective function. In addition, we combine the semantic information of each image and the similarity information of pairs of images as supervised information to train a deep hashing network, which improves the representation ability of deep features and hash codes. The experimental results on three public datasets demonstrate that the proposed method outperforms symmetric methods in terms of retrieval accuracy and efficiency. The source code is available at https://github.com/weiweisong415/Demo AHCL for TGRS2022.
updated: Sat Jan 15 2022 07:00:38 GMT+0000 (UTC)
published: Sat Jan 15 2022 07:00:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト