arXiv reaDer
再ランク付けを伴うNetVLADに基づくライターの識別とライターの取得
Writer Identification and Writer Retrieval Based on NetVLAD with Re-ranking
この論文は、文書分析と認識の分野で挑戦的な問題と考えられている作家の識別と作家の検索に取り組んでいます。この作業では、特徴抽出器としてのResNet-20と、ローカルに集約された記述子(VLAD)のベクトルに触発された、統合されたNetVLADレイヤーで構成される統合ニューラルネットワークアーキテクチャを採用することにより、目前の問題に対して新しいパイプラインを提案します。後半の頭。このアーキテクチャを定義すると、トリプレットセミハードロス関数を使用して、個々の入力画像パッチの埋め込みを直接学習します。続いて、一般化された最大プーリング技術が、各手書き画像の埋め込まれた記述子の集約に採用されます。また、kの逆数の最近傍に基づく識別と検索のタスクのために、新しい再ランク付け戦略が導入され、パイプラインがこのステップから多大な利益を得ることができることが示されています。実験的評価は、ICDAR 2013、CVL、およびKHATTデータセットの3つの公開されているデータセットで行われました。結果は、KHATTで最先端のパフォーマンスを実現する一方で、ライターの識別とライターの取得パイプラインは、mAPの観点からICDAR2013およびCVLデータセットで優れたパフォーマンスを実現することを示しています。
This paper addresses writer identification and writer retrieval which is considered as a challenging problem in the document analysis and recognition field. In this work, a novel pipeline is proposed for the problem at hand by employing a unified neural network architecture consisting of the ResNet-20 as a feature extractor and an integrated NetVLAD layer, inspired by the vector of locally aggregated descriptors (VLAD), in the head of the latter part. Having defined this architecture, the triplet semi-hard loss function is used to directly learn an embedding for individual input image patches. Subsequently, generalized max-pooling technique is employed for the aggregation of embedded descriptors of each handwritten image. Also, a novel re-ranking strategy is introduced for the task of identification and retrieval based on k-reciprocal nearest neighbors, and it is shown that the pipeline can benefit tremendously from this step. Experimental evaluation has been done on the three publicly available datasets: the ICDAR 2013, CVL, and KHATT datasets. Results indicate that while we perform comparably to the state-of-the-art on the KHATT, our writer identification and writer retrieval pipeline achieves superior performance on the ICDAR 2013 and CVL datasets in terms of mAP.
updated: Mon Feb 22 2021 18:27:50 GMT+0000 (UTC)
published: Fri Dec 11 2020 08:22:28 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト