arXiv reaDer
埋め込みネットワークを使用した韓国文字の画像認識
Recognition of Images of Korean Characters Using Embedded Networks
 テキスト認識の分野で大きな成功を収めているにもかかわらず、この分野には複雑で未解決の問題が依然として存在します。近年、英語の認識精度は大幅に向上しましたが、象形文字の認識の問題はあまり注目されていません。韓国語、日本語、または中国語の文字による象形文字認識または画像認識は、従来のテキスト認識タスクとは異なります。この記事では、画像認識の文脈における象形文字言語とラテンアルファベットの主な違いについて説明します。象形文字の画像を認識するための軽量な方法が提案され、韓国の象形文字画像の公開データセットでテストされています。既存のソリューションにもかかわらず、提案された方法はモバイル機器に適しています。その認識精度は、オープンソースOCRフレームワークの精度よりも優れています。認識データの類似性に基づいた埋め込みネットのトレーニングの提示された方法。
Despite the significant success in the field of text recognition, complex and unsolved problems still exist in this field. In recent years, the recognition accuracy of the English language has greatly increased, while the problem of recognition of hieroglyphs has received much less attention. Hieroglyph recognition or image recognition with Korean, Japanese or Chinese characters have differences from the traditional text recognition task. This article discusses the main differences between hieroglyph languages and the Latin alphabet in the context of image recognition. A light-weight method for recognizing images of the hieroglyphs is proposed and tested on a public dataset of Korean hieroglyph images. Despite the existing solutions, the proposed method is suitable for mobile devices. Its recognition accuracy is better than the accuracy of the open-source OCR framework. The presented method of training embedded net bases on the similarities in the recognition data.
updated: Tue Dec 03 2019 11:31:28 GMT+0000 (UTC)
published: Mon Nov 11 2019 13:21:02 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト