arXiv reaDer
堅牢なバングラ文書レイアウトのセグメンテーションのためのアンカーフリー モデルのアンサンブル
Ensemble of Anchor-Free Models for Robust Bangla Document Layout Segmentation
この研究論文では、バングラ文書のレイアウトをセグメント化する目的で設計された革新的なシステムを紹介します。私たちの方法論には、バングラ語ドキュメント レイアウト セグメンテーションを中心とした DL Sprint 2.0 - BUET CSE Fest 2023 コンペティションに細心の注意を払って適応された、YOLOv8 モデルの洗練されたコレクションの利用が含まれます。私たちの主な焦点は、画像拡張、モデル アーキテクチャ、モデル アンサンブルの使用などのテクニックを含む、タスクのさまざまな要素を向上させることにあります。文書画像のサブセットの品質を意図的に下げてモデルトレーニングの回復力を高め、その結果、相互検証スコアの向上につながりました。ベイジアン最適化を使用して、モデル アンサンブルの最適な信頼性と IoU しきい値を決定します。私たちのアプローチを通じて、バングラ語文書で堅牢なレイアウト セグメンテーションを実現するためのアンカーフリー モデルの統合の有効性を示すことに成功しました。
In this research paper, we present an innovative system designed for the purpose of segmenting the layout of Bangla documents. Our methodology involves utilizing a sophisticated collection of YOLOv8 models, meticulously adapted for the DL Sprint 2.0 - BUET CSE Fest 2023 Competition that centers around Bangla document layout segmentation. Our primary focus lies in elevating various elements of the task, including techniques like image augmentation, model architecture, and the use of model ensembles. We intentionally lower the quality of a subset of document images to enhance the resilience of model training, consequently leading to an improvement in our cross-validation score. Employing Bayesian optimization, we determine the optimal confidence and IoU thresholds for our model ensemble. Through our approach, we successfully showcase the effectiveness of amalgamating anchor-free models to achieve robust layout segmentation in Bangla documents.
updated: Mon Aug 28 2023 08:24:25 GMT+0000 (UTC)
published: Mon Aug 28 2023 08:24:25 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト