PaddlePaddleに基づくオブジェクト検出フレームワークを提示します。 ResNet200-vdバックボーンに基づいて、すべての戦略(マルチスケールトレーニング、FPN、カスケード、Dcnv2、非ローカル、天秤座損失)をまとめます。パブリックリーダーボードのモデルスコアは、単一スケールテストで0.6269になります。 SoftNMSの検出結果に基づいて、top-k voting-nmsと呼ばれる新しい投票方法を提案しました。投票方法は、すべてのモデルの結果をより簡単にマージし、Google AI Open Images Object Detection Track 2019で2位を獲得するのに役立ちます。
We present an object detection framework based on PaddlePaddle. We put all the strategies together (multi-scale training, FPN, Cascade, Dcnv2, Non-local, libra loss) based on ResNet200-vd backbone. Our model score on public leaderboard comes to 0.6269 with single scale test. We proposed a new voting method called top-k voting-nms, based on the SoftNMS detection results. The voting method helps us merge all the models' results more easily and achieve 2nd place in the Google AI Open Images Object Detection Track 2019.