航空写真で小型車両を検出することは、人間にとっても困難な作業です。回転するオブジェクト、低解像度、クラス間の変動が小さく、複雑な背景を含む非常に大きな画像は、写真通訳者の作業を退屈で面倒なものにします。残念ながら、Faster R-CNNのような最高の古典的な検出パイプラインでさえ、マルチスケールの垂直オブジェクトを使用して日常生活からのオブジェクト中心の画像を処理するために構築されているため、すぐに使用して良い結果を得ることができません。この作業では、より高速なR-CNNアプローチに基づいて構築し、空中画像タスクに固有の回転等分散を適切に処理する検出フレームワークに変換します。この新しいパイプライン(Fast Rotation Equivariant Regions CNN)を使用すると、最も難しい航空写真データセットの1つであるVeDAIに最先端の結果が得られます。他の2つのベースラインであるFaster R-CNN:MunichおよびGoogleEarth。
Detecting small vehicles in aerial images is a difficult job that can be challenging even for humans. Rotating objects, low resolution, small inter-class variability and very large images comprising complicated backgrounds render the work of photo-interpreters tedious and wearisome. Unfortunately even the best classical detection pipelines like Faster R-CNN cannot be used off-the-shelf with good results because they were built to process object centric images from day-to-day life with multi-scale vertical objects. In this work we build on the Faster R-CNN approach to turn it into a detection framework that deals appropriately with the rotation equivariance inherent to any aerial image task. This new pipeline (Faster Rotation Equivariant Regions CNN) gives, without any bells and whistles, state-of-the-art results on one of the most challenging aerial imagery datasets: VeDAI and give good results w.r.t. the baseline Faster R-CNN on two others: Munich and GoogleEarth .