arXiv reaDer
ディープ ライフロング クロスモーダル ハッシング
Deep Lifelong Cross-modal Hashing
ハッシュ手法は、高速なクエリ速度と低いストレージ コストにより、クロスモーダル検索タスクで大きな進歩を遂げました。その中でも、深層学習ベースのハッシングは、非線形の異種特徴の優れた抽出および表現能力により、大規模データでより優れたパフォーマンスを実現します。ただし、新しいカテゴリのデータが継続的に到着したときの壊滅的な忘却には、まだ 2 つの主な課題があります。この目的のために、この論文では、新しいデータが到着したときにハッシュ関数を繰り返し再トレーニングする代わりに、生涯にわたるハッシュ検索を実現するための、新しい深い生涯にわたるクロスモーダルハッシュを提案します。具体的には、蓄積されたすべてのデータを使用して新しいハッシュ関数を再トレーニングするのではなく、増分データを直接トレーニングすることによってハッシュ関数を更新する生涯学習戦略を設計します。これにより、トレーニング時間が大幅に短縮されます。次に、元のハッシュコードが生涯学習に参加するが不変のままであり、元のハッシュコードとインクリメンタルハッシュコード間の類似性と非類似性をさらに維持してパフォーマンスを維持できるようにする生涯ハッシュ損失を提案します。さらに、新しいデータが連続して到着する場合の分布の不均一性を考慮して、マルチラベルの意味的類似性を導入してハッシュ学習を監督し、詳細な分析により類似性がパフォーマンスを向上させることを証明しました。ベンチマーク データセットの実験結果は、提案された方法が最近の最先端のクロスモーダル ハッシュ方法と比較して同等のパフォーマンスを達成することを示しています。新しいデータが継続的に到着します。
Hashing methods have made significant progress in cross-modal retrieval tasks with fast query speed and low storage cost. Among them, deep learning-based hashing achieves better performance on large-scale data due to its excellent extraction and representation ability for nonlinear heterogeneous features. However, there are still two main challenges in catastrophic forgetting when data with new categories arrive continuously, and time-consuming for non-continuous hashing retrieval to retrain for updating. To this end, we, in this paper, propose a novel deep lifelong cross-modal hashing to achieve lifelong hashing retrieval instead of re-training hash function repeatedly when new data arrive. Specifically, we design lifelong learning strategy to update hash functions by directly training the incremental data instead of retraining new hash functions using all the accumulated data, which significantly reduce training time. Then, we propose lifelong hashing loss to enable original hash codes participate in lifelong learning but remain invariant, and further preserve the similarity and dis-similarity among original and incremental hash codes to maintain performance. Additionally, considering distribution heterogeneity when new data arriving continuously, we introduce multi-label semantic similarity to supervise hash learning, and it has been proven that the similarity improves performance with detailed analysis. Experimental results on benchmark datasets show that the proposed methods achieves comparative performance comparing with recent state-of-the-art cross-modal hashing methods, and it yields substantial average increments over 20% in retrieval accuracy and almost reduces over 80% training time when new data arrives continuously.
updated: Wed Apr 26 2023 07:56:22 GMT+0000 (UTC)
published: Wed Apr 26 2023 07:56:22 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト