Handwritten Bangla Basic and Compound character recognition using MLP and SVM classifier
 バングラアルファベットの基本文字とともに、手書きの複合バングラ文字を認識するための新しいアプローチをここに示します。ローマ字のような英語と比較して、手書きバングラスクリプトの光学文字認識(OCR)の主要な障害の1つは、バングラアルファベットの複雑な形状の多数の文字クラスです。 50の基本的な文字クラスに加えて、バングラアルファベットには160近くの複雑な形状の複合文字クラスがあります。適切に設計された機能セットを使用して、このような多種多様な手書き文字を処理することは困難な問題です。不確実性と不正確さは、手書きのスクリプトに固有のものです。さらに、そのようないくつかの類似した複雑な形状の文字は、手書きのバングラ文字のOCRの問題をより困難にします。問題の複雑さを考慮して、現在のアプローチは、複合文字クラスを最も頻繁に発生するものからそれほど頻繁に発生しないものまで、すなわち重要度の高いものから特定しようとします。これは、複合キャラクターの学習クラスの数を、基本キャラクターとともに、より頻繁に発生するクラスからより頻繁に発生しないクラスに段階的に増やすためのフレームワークを開発することです。実験では、将来の改善と拡張の範囲でデータの3倍の相互検証を行った後、この手法により平均認識率79.25が得られることが観察されています。
A novel approach for recognition of handwritten compound Bangla characters, along with the Basic characters of Bangla alphabet, is presented here. Compared to English like Roman script, one of the major stumbling blocks in Optical Character Recognition (OCR) of handwritten Bangla script is the large number of complex shaped character classes of Bangla alphabet. In addition to 50 basic character classes, there are nearly 160 complex shaped compound character classes in Bangla alphabet. Dealing with such a large varieties of handwritten characters with a suitably designed feature set is a challenging problem. Uncertainty and imprecision are inherent in handwritten script. Moreover, such a large varieties of complex shaped characters, some of which have close resemblance, makes the problem of OCR of handwritten Bangla characters more difficult. Considering the complexity of the problem, the present approach makes an attempt to identify compound character classes from most frequently to less frequently occurred ones, i.e., in order of importance. This is to develop a frame work for incrementally increasing the number of learned classes of compound characters from more frequently occurred ones to less frequently occurred ones along with Basic characters. On experimentation, the technique is observed produce an average recognition rate of 79.25 after three fold cross validation of data with future scope of improvement and extension.
