arXiv reaDer
数式検出に関するICDAR2021コンペティションの1位ソリューション
1st Place Solution for ICDAR 2021 Competition on Mathematical Formula Detection
このテクニカルレポートでは、数式検出(MFD)に関するICDAR2021コンペティションの1位のソリューションを紹介します。 MFDタスクには、大規模なスパン、高さと幅の比率の大きな変動、豊富な文字セットと数式など、3つの重要な課題があります。これらの課題を考慮して、アンカーベースの方法の代わりにアンカーフリーの方法であるGeneralized Focal Loss(GFL)を使用し、適応トレーニングサンプリング戦略(ATSS)と適切な特徴ピラミッドネットワーク(FPN)が重要な問題を十分に解決できることを証明しましたスケール変動の問題。一方、MFDタスクでは、Deformable Convolution Network(DCN)、SyncBN、Weighted Box Fusion(WBF)などのいくつかのトリックが効果的であることがわかりました。私たちの提案した方法は、最後の15チームで1位にランクされました。
In this technical report, we present our 1st place solution for the ICDAR 2021 competition on mathematical formula detection (MFD). The MFD task has three key challenges including a large scale span, large variation of the ratio between height and width, and rich character set and mathematical expressions. Considering these challenges, we used Generalized Focal Loss (GFL), an anchor-free method, instead of the anchor-based method, and prove the Adaptive Training Sampling Strategy (ATSS) and proper Feature Pyramid Network (FPN) can well solve the important issue of scale variation. Meanwhile, we also found some tricks, e.g., Deformable Convolution Network (DCN), SyncBN, and Weighted Box Fusion (WBF), were effective in MFD task. Our proposed method ranked 1st in the final 15 teams.
updated: Mon Jul 12 2021 16:03:16 GMT+0000 (UTC)
published: Mon Jul 12 2021 16:03:16 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト