arXiv reaDer
文字ごとの選択肢を持つ結果モデルを使用して、ビデオ内のテキストフィールド認識プロセスを停止するための次の統合結果モデリング
Next integrated result modelling for stopping the text field recognition process in a video using a result model with per-character alternatives
  キャプチャ用のモバイルデバイスを使用したドキュメント分析と認識の分野、およびビデオストリーム内のオブジェクト認識の分野では、キャプチャプロセスを停止する時間を決定することが重要な問題です。効率的な停止は、認識およびデータ入力の実行に費やされる合計時間だけでなく、結果の予想される精度にも影響します。この論文は、文字ごとの代替を伴う文字列結果認識モデル内で使用するために、次の統合認識結果モデリングに基づいて停止方法を拡張することを対象としています。停止方法とその拡張に関する注意事項を説明し、オープンデータセットMIDV-500で実験的評価を実行します。この方法は、入力観測クラスタリングに基づいて以前に公開された方法と比較されました。得られた結果は、次の統合された結果モデリングに基づく停止方法は、競合する方法の達成可能な最良の構成と比較した場合でも、より高い精度を達成できることを示しています。
In the field of document analysis and recognition using mobile devices for capturing, and the field of object recognition in a video stream, an important problem is determining the time when the capturing process should be stopped. Efficient stopping influences not only the total time spent for performing recognition and data entry, but the expected accuracy of the result as well. This paper is directed on extending the stopping method based on next integrated recognition result modelling, in order for it to be used within a string result recognition model with per-character alternatives. The stopping method and notes on its extension are described, and experimental evaluation is performed on an open dataset MIDV-500. The method was compares with previously published methods based on input observations clustering. The obtained results indicate that the stopping method based on the next integrated result modelling allows to achieve higher accuracy, even when compared with the best achievable configuration of the competing methods.
updated: Wed Oct 09 2019 16:43:42 GMT+0000 (UTC)
published: Wed Oct 09 2019 16:43:42 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト