arXiv reaDer
自然シーンにおけるインスタンスごとのオクルージョンとデプスオーダー
Instance-wise Occlusion and Depth Orders in Natural Scenes
このホワイトペーパーでは、3D空間内のインスタンスの空間的関係を理解するために使用できるInstaOrderという名前の新しいデータセットを紹介します。データセットは、101Kの自然シーンにおけるクラスラベル付きインスタンスの幾何学的順序の290万の注釈で構成されています。シーンには、(1)オクルーダー/オクルーダーを識別するオクルージョン順序と(2)カメラからの相対距離を考慮した順序関係を表す深さ順序に関して、3,659人の群衆労働者によって注釈が付けられました。データセットは、同じインスタンスの2種類の順序の共同注釈を提供し、オクルージョンの順序と深度の順序が補完的であることを発見しました。また、最先端のアプローチよりも優れたInstaOrderNetと呼ばれる幾何学的順序予測ネットワークを紹介します。さらに、補助的な幾何学的次数損失を使用して、MiDaSのインスタンスごとの深度予測精度を高めるInstaDepthNetを提案します。幾何学的なシーンの理解へのこれらの貢献は、さまざまなコンピュータービジョンタスクの精度を向上させるのに役立ちます。
In this paper, we introduce a new dataset, named InstaOrder, that can be used to understand the spatial relationships of instances in a 3D space. The dataset consists of 2.9M annotations of geometric orderings for class-labeled instances in 101K natural scenes. The scenes were annotated by 3,659 crowd-workers regarding (1) occlusion order that identifies occluder/occludee and (2) depth order that describes ordinal relations that consider relative distance from the camera. The dataset provides joint annotation of two kinds of orderings for the same instances, and we discover that the occlusion order and depth order are complementary. We also introduce a geometric order prediction network called InstaOrderNet, which is superior to state-of-the-art approaches. Moreover, we propose InstaDepthNet that uses auxiliary geometric order loss to boost the instance-wise depth prediction accuracy of MiDaS. These contributions to geometric scene understanding will help to improve the accuracy of various computer vision tasks.
updated: Mon Nov 29 2021 14:45:07 GMT+0000 (UTC)
published: Mon Nov 29 2021 14:45:07 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト