このテクニカルレポートでは、SODA10Mチャレンジの継続的なオブジェクト検出トラックに対するアプローチを紹介します。 ResNet50-FPNをベースラインとして採用し、最終的な提出モデルのためにいくつかの改善を試みます。タスク固有の再生スキーム、学習率のスケジューリング、モデルのキャリブレーション、および元の画像スケールの使用は、画像内の大きなオブジェクトと小さなオブジェクトの両方のパフォーマンスを向上させるのに役立つことがわかりました。私たちのチーム「hypertune28」は、チャレンジの52人の参加者の中で2番目の位置を確保しました。この作品は、次世代の業界レベルの自動運転(SSLAD)のための自己監視学習に関するICCV2021ワークショップで発表されます。
In this technical report, we present our approaches for the continual object detection track of the SODA10M challenge. We adapt ResNet50-FPN as the baseline and try several improvements for the final submission model. We find that task-specific replay scheme, learning rate scheduling, model calibration, and using original image scale helps to improve performance for both large and small objects in images. Our team `hypertune28' secured the second position among 52 participants in the challenge. This work will be presented at the ICCV 2021 Workshop on Self-supervised Learning for Next-Generation Industry-level Autonomous Driving (SSLAD).