スキャンされた手書き文書の「安価な」高速ライター識別タスクに「視覚的に」、斬新で古典的なオーディオおよびテキスト信号処理およびその他の手法を使用することを提案します。 「安価な」とは、CPUサイクルの観点からの識別プロセスの効率性を指し、予備識別の精度を維持します。これは、オーディオをはるかに超えるオープンソースのモジュラー音声認識フレームワーク(MARF)を中心にJavaで実装されたパターン認識パイプラインの複数のアルゴリズムの組み合わせの比較研究です。このような識別タスクでの予備的な実験結果を示します。手書きの文書全体を「見る」ことにより、「分類」前にきめの細かい特徴を抽出するのではなく、「視覚的」識別をシミュレートします。
We propose to use novel and classical audio and text signal-processing and otherwise techniques for "inexpensive" fast writer identification tasks of scanned hand-written documents "visually". The "inexpensive" refers to the efficiency of the identification process in terms of CPU cycles while preserving decent accuracy for preliminary identification. This is a comparative study of multiple algorithm combinations in a pattern recognition pipeline implemented in Java around an open-source Modular Audio Recognition Framework (MARF) that can do a lot more beyond audio. We present our preliminary experimental findings in such an identification task. We simulate "visual" identification by "looking" at the hand-written document as a whole rather than trying to extract fine-grained features out of it prior classification.