360-Indoor: Towards Learning Real-World Objects in 360° Indoor Equirectangular Images
  広く使用されているオブジェクト検出データセットがいくつかありますが、現在のコンピュータービジョンアルゴリズムは従来の画像ではまだ制限されています。このような画像は、制限された地域での視野を狭めます。一方、360 {\ deg画像は完全な視界を提供します。このホワイトペーパーの目標は、360 {\ degドメインの視覚および機械学習コミュニティを促進する標準データセットを提供することです。研究を促進するために、360 {\ deg屋内画像での視覚的オブジェクト検出およびクラス認識の新しいベンチマークである、360- \ Indoorの実世界360 {\ degパノラマオブジェクト検出データセットを紹介します。これは、共通のオブジェクトと集中的な注釈付きの視野を含む複雑な屋内シーンの画像を収集することによって実現されます。さらに、360-Indoorにはいくつかの異なるプロパティがあります。(1)最大のカテゴリ番号(合計37のラベル)。 (2)平均で最も完全な注釈(画像ごとに27個の境界ボックス)。選択された37個のオブジェクトはすべて屋内シーンで一般的です。約3kの画像と合計で90kのラベルにより、360-Indoorは360 {\ deg画像で最大の検出データセットを実現します。最後に、分類と検出の両方のための最先端の方法に関する広範な実験が提供されます。近い将来、このデータセットをリリースします。
While there are several widely used object detection datasets, current computer vision algorithms are still limited in conventional images. Such images narrow our vision in a restricted region. On the other hand, 360{\deg images provide a thorough sight. In this paper, our goal is to provide a standard dataset to facilitate the vision and machine learning communities in 360{\deg domain. To facilitate the research, we present a real-world 360{\deg panoramic object detection dataset, 360-Indoor, which is a new benchmark for visual object detection and class recognition in 360{\deg indoor images. It is achieved by gathering images of complex indoor scenes containing common objects and the intensive annotated bounding field-of-view. In addition, 360-Indoor has several distinct properties: (1) the largest category number (37 labels in total). (2) the most complete annotations on average (27 bounding boxes per image). The selected 37 objects are all common in indoor scene. With around 3k images and 90k labels in total, 360-Indoor achieves the largest dataset for detection in 360{\deg images. In the end, extensive experiments on the state-of-the-art methods for both classification and detection are provided. We will release this dataset in the near future.
updated: Thu Oct 03 2019 20:36:49 GMT+0000 (UTC)
published: Thu Oct 03 2019 20:36:49 GMT+0000 (UTC)
