arXiv reaDer
歴史的データセットのライター検索に向けて
Towards Writer Retrieval for Historical Datasets
この論文では、擬似クラスタ ラベルを生成するキーポイント位置で検出された SIFT 記述子のクラスタリングに基づくライター検索の教師なしアプローチを紹介します。これらのクラスター ラベルを使用して、私たちが提案する NetRVLAD (NetVLAD と比較して複雑さが軽減されたエンコード層) が後に続く残差ネットワークは、キーポイントの位置にある 32x32 パッチでトレーニングされます。さらに、ページ埋め込みの類似性を利用して検索パフォーマンスを向上させる、SGR と呼ばれるグラフベースの再ランキング アルゴリズムを提案します。私たちのアプローチは 2 つの過去のデータセット (Historical-WI と HisIR19) で評価されます。さまざまなバックボーンと NetRVLAD の評価が含まれています。明示的なエンコーディングを使用せずに、過去のデータセットに関する関連作業と競合します。再ランキング スキームを適用することで両方のデータセットに新しい最先端技術を設定し、私たちのアプローチが最新のデータセットでも同等のパフォーマンスを達成できることを示します。
This paper presents an unsupervised approach for writer retrieval based on clustering SIFT descriptors detected at keypoint locations resulting in pseudo-cluster labels. With those cluster labels, a residual network followed by our proposed NetRVLAD, an encoding layer with reduced complexity compared to NetVLAD, is trained on 32x32 patches at keypoint locations. Additionally, we suggest a graph-based reranking algorithm called SGR to exploit similarities of the page embeddings to boost the retrieval performance. Our approach is evaluated on two historical datasets (Historical-WI and HisIR19). We include an evaluation of different backbones and NetRVLAD. It competes with related work on historical datasets without using explicit encodings. We set a new State-of-the-art on both datasets by applying our reranking scheme and show that our approach achieves comparable performance on a modern dataset as well.
updated: Wed Jun 14 2023 07:04:39 GMT+0000 (UTC)
published: Tue May 09 2023 11:44:44 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト