arXiv reaDer
データ不均衡を伴う大規模階層オブジェクト検出のための効率的なネットワークの学習:Open Images Challenge 2019の3位のソリューション
Learning an Efficient Network for Large-Scale Hierarchical Object Detection with Data Imbalance: 3rd Place Solution to Open Images Challenge 2019
  このレポートでは、Google AI Open Images Challenge 2019 Object Detection Trackのソリューションについて詳しく説明します。 Open Imagesデータセットの詳細な分析に基づいて、大規模な階層タグシステム、重大な注釈の不完全性、データの不均衡という4つの典型的な機能があることがわかりました。これらの特性を考慮して、より大きなバックボーン、分散ソフトマックス損失、クラス対応サンプリング、エキスパートモデル、より重い分類器など、多くの戦略が採用されています。これらの効果的な戦略のおかげで、我々の最良の単一モデルは61.90のmAPを達成できました。アンサンブルの後、最終的なmAPはパブリックリーダーボードで67.17、プライベートリーダーボードで64.21にブーストされ、オープンイメージチャレンジ2019で3位になります。
This report details our solution to the Google AI Open Images Challenge 2019 Object Detection Track. Based on our detailed analysis on the Open Images dataset, it is found that there are four typical features: large-scale, hierarchical tag system, severe annotation incompleteness and data imbalance. Considering these characteristics, many strategies are employed, including larger backbone, distributed softmax loss, class-aware sampling, expert model, and heavier classifier. In virtue of these effective strategies, our best single model could achieve a mAP of 61.90. After ensemble, the final mAP is boosted to 67.17 in the public leaderboard and 64.21 in the private leaderboard, which earns 3rd place in the Open Images Challenge 2019.
updated: Sat Oct 26 2019 10:31:35 GMT+0000 (UTC)
published: Sat Oct 26 2019 10:31:35 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト