arXiv reaDer
Oracle文字認識のための教師なし構造-テクスチャ分離ネットワーク
Unsupervised Structure-Texture Separation Network for Oracle Character Recognition
甲骨文字は、殷王朝の最も初期に知られている中国語の書記体系であり、考古学と文献学にとって貴重です。ただし、実際にスキャンされたOracleデータはまれであり、スキャンされたOracle文字の自動認識を困難な作業にする注釈に利用できる専門家はほとんどいません。したがって、教師なしドメインの適応を調査して、取得が容易な手書きのオラクルデータからスキャンされたドメインに知識を転送することを目指しています。構造-テクスチャ分離ネットワーク(STSN)を提案します。これは、関節の解きほぐし、変換、適応、認識のためのエンドツーエンドの学習フレームワークです。まず、STSNは、生成モデルによって特徴を構造(グリフ)コンポーネントとテクスチャ(ノイズ)コンポーネントに解きほぐし、次に、手形でスキャンしたデータを構造特徴空間に配置して、適応時に深刻なノイズによって引き起こされる悪影響を回避できるようにします。第二に、変換はドメイン間で学習されたテクスチャを交換することによって達成され、最終的な分類のための分類器は、変換されたスキャンされた文字のラベルを予測するように訓練されます。これにより、絶対的な分離が保証されるだけでなく、学習した機能の識別能力も向上します。 Oracle-241データセットでの広範な実験は、STSNが他の適応方法よりも優れており、スキャンされたデータが長時間の埋没や不注意な掘削によって汚染されている場合でも、認識パフォーマンスを向上させることに成功していることを示しています。
Oracle bone script is the earliest-known Chinese writing system of the Shang dynasty and is precious to archeology and philology. However, real-world scanned oracle data are rare and few experts are available for annotation which make the automatic recognition of scanned oracle characters become a challenging task. Therefore, we aim to explore unsupervised domain adaptation to transfer knowledge from handprinted oracle data, which are easy to acquire, to scanned domain. We propose a structure-texture separation network (STSN), which is an end-to-end learning framework for joint disentanglement, transformation, adaptation and recognition. First, STSN disentangles features into structure (glyph) and texture (noise) components by generative models, and then aligns handprinted and scanned data in structure feature space such that the negative influence caused by serious noises can be avoided when adapting. Second, transformation is achieved via swapping the learned textures across domains and a classifier for final classification is trained to predict the labels of the transformed scanned characters. This not only guarantees the absolute separation, but also enhances the discriminative ability of the learned features. Extensive experiments on Oracle-241 dataset show that STSN outperforms other adaptation methods and successfully improves recognition performance on scanned data even when they are contaminated by long burial and careless excavation.
updated: Fri May 13 2022 10:27:02 GMT+0000 (UTC)
published: Fri May 13 2022 10:27:02 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト