arXiv reaDer
大規模な歴史的透かし認識:データセットと新しい一貫性ベースのアプローチ
Large-Scale Historical Watermark Recognition: dataset and a new consistency-based approach
  歴史的透かし認識は、アーキビストと歴史家にとって非常に実用的でありながら未解決の課題です。多数の明確に定義されたクラス、乱雑でノイズの多いサンプル、さまざまなタイプの表現、クラス間の微妙な違いとクラス内の高いバリエーションの両方により、歴史的な透かしもパターン認識にとって困難です。この論文では、データ収集の難しさを克服し、6000万枚以上の新しい写真を含む大規模なパブリックデータセットを提示します。これにより、学者にとって実用的なシナリオであるワンショットインスタンス認識とクロスドメインに初めて取り組むことができます。 16k以上のきめ細かいクラス間でのワンショットインスタンス認識。この新しいデータセットは、最新のディープラーニングアプローチをトレーニングするのに十分な大きさであることを実証し、中間レベルのディープフィーチャを使用することで標準的な方法を大幅に改善できることを示します。より正確には、空間整合性を使用したローカル一致のフィルタリングに基づいて、一致スコアと特徴の微調整戦略の両方を設計します。この一貫性ベースのアプローチにより、強力なベースラインと比較して、重要なパフォーマンスが向上します。このモデルは、非常に難しい16,753クラスのワンショットクロスドメイン認識タスクで55%のトップ1精度を達成します。各クラスは、従来のBriquetカタログの1つの図面で記述されます。透かしの分類に加えて、私たちのアプローチがきめ細かいスケッチベースの画像検索で有望な結果を提供することを示します。
Historical watermark recognition is a highly practical, yet unsolved challenge for archivists and historians. With a large number of well-defined classes, cluttered and noisy samples, different types of representations, both subtle differences between classes and high intra-class variation, historical watermarks are also challenging for pattern recognition. In this paper, overcoming the difficulty of data collection, we present a large public dataset with more than 6k new photographs, allowing for the first time to tackle at scale the scenarios of practical interest for scholars: one-shot instance recognition and cross-domain one-shot instance recognition amongst more than 16k fine-grained classes. We demonstrate that this new dataset is large enough to train modern deep learning approaches, and show that standard methods can be improved considerably by using mid-level deep features. More precisely, we design both a matching score and a feature fine-tuning strategy based on filtering local matches using spatial consistency. This consistency-based approach provides important performance boost compared to strong baselines. Our model achieves 55% top-1 accuracy on our very challenging 16,753-class one-shot cross-domain recognition task, each class described by a single drawing from the classic Briquet catalog. In addition to watermark classification, we show our approach provides promising results on fine-grained sketch-based image retrieval.
updated: Tue Aug 27 2019 15:00:32 GMT+0000 (UTC)
published: Tue Aug 27 2019 15:00:32 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト