arXiv reaDer
TJU-DHD:オブジェクト検出のための多様な高解像度データセット
TJU-DHD: A Diverse High-Resolution Dataset for Object Detection
自動運転車とビデオ監視の知覚モジュールにとって、車両、歩行者、およびライダーは最も重要で興味深いオブジェクトです。しかし、そのような重要な物体(特に小さな物体)を検出する最先端の性能は、実際のシステムの需要を満たすにはほど遠いものです。大規模で多様性に富んだ高解像度のデータセットは、需要を満たすためのより優れたオブジェクト検出方法を開発する上で重要な役割を果たします。 Webサイトから収集されたMSCOCOなどの既存の公開大規模データセットは、特定のシナリオに焦点を合わせていません。さらに、特定のシナリオから収集された人気のあるデータセット(KITTIやCitypersonsなど)は、画像とインスタンスの数、解像度、および多様性に制限があります。この問題の解決を試みるために、さまざまな高解像度データセット(TJU-DHDと呼ばれる)を構築します。データセットには、115,354枚の高解像度画像(52%の画像の解像度は1624×1200ピクセル、48%の画像の解像度は少なくとも2,560×1,440ピクセル)と、スケールと外観に大きなばらつきがある合計709,330個のラベル付きオブジェクトが含まれています。一方、データセットには、季節の変動、照明の変動、および天候の変動に豊富な多様性があります。さらに、新しい多様な歩行者データセットがさらに構築されます。 4つの異なる検出器(つまり、1ステージのRetinaNet、アンカーフリーFCOS、2ステージのFPN、およびカスケードR-CNN)を使用して、物体検出と歩行者検出に関する実験が行われます。新しく構築されたデータセットが、これら2つのシーンでの物体検出と歩行者検出の研究を促進するのに役立つことを願っています。データセットはhttps://github.com/tjubiit/TJU-DHDで入手できます。
Vehicles, pedestrians, and riders are the most important and interesting objects for the perception modules of self-driving vehicles and video surveillance. However, the state-of-the-art performance of detecting such important objects (esp. small objects) is far from satisfying the demand of practical systems. Large-scale, rich-diversity, and high-resolution datasets play an important role in developing better object detection methods to satisfy the demand. Existing public large-scale datasets such as MS COCO collected from websites do not focus on the specific scenarios. Moreover, the popular datasets (e.g., KITTI and Citypersons) collected from the specific scenarios are limited in the number of images and instances, the resolution, and the diversity. To attempt to solve the problem, we build a diverse high-resolution dataset (called TJU-DHD). The dataset contains 115,354 high-resolution images (52% images have a resolution of 1624×1200 pixels and 48% images have a resolution of at least 2,560×1,440 pixels) and 709,330 labeled objects in total with a large variance in scale and appearance. Meanwhile, the dataset has a rich diversity in season variance, illumination variance, and weather variance. In addition, a new diverse pedestrian dataset is further built. With the four different detectors (i.e., the one-stage RetinaNet, anchor-free FCOS, two-stage FPN, and Cascade R-CNN), experiments about object detection and pedestrian detection are conducted. We hope that the newly built dataset can help promote the research on object detection and pedestrian detection in these two scenes. The dataset is available at https://github.com/tjubiit/TJU-DHD.
updated: Wed Nov 18 2020 09:32:24 GMT+0000 (UTC)
published: Wed Nov 18 2020 09:32:24 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト