このレポートでは、Google AI Open Images Challenge 2019 Object Detection Trackのソリューションについて詳しく説明します。 Open Imagesデータセットの詳細な分析に基づいて、大規模な階層タグシステム、重大な注釈の不完全性、データの不均衡という4つの典型的な機能があることがわかりました。これらの特性を考慮して、より大きなバックボーン、分散ソフトマックス損失、クラス対応サンプリング、エキスパートモデル、より重い分類器など、多くの戦略が採用されています。これらの効果的な戦略のおかげで、我々の最良の単一モデルは61.90のmAPを達成できました。アンサンブルの後、最終的なmAPはパブリックリーダーボードで67.17、プライベートリーダーボードで64.21にブーストされ、オープンイメージチャレンジ2019で3位になります。
This report details our solution to the Google AI Open Images Challenge 2019 Object Detection Track. Based on our detailed analysis on the Open Images dataset, it is found that there are four typical features: large-scale, hierarchical tag system, severe annotation incompleteness and data imbalance. Considering these characteristics, many strategies are employed, including larger backbone, distributed softmax loss, class-aware sampling, expert model, and heavier classifier. In virtue of these effective strategies, our best single model could achieve a mAP of 61.90. After ensemble, the final mAP is boosted to 67.17 in the public leaderboard and 64.21 in the private leaderboard, which earns 3rd place in the Open Images Challenge 2019.