arXiv reaDer
ディープステレオのオープンチャレンジ:ブースターデータセット
Open Challenges in Deep Stereo: the Booster Dataset
高密度で正確なグラウンドトゥルースの視差で注釈が付けられた屋内シーンをフレーミングする、斬新で高解像度でやりがいのあるステレオデータセットを紹介します。私たちのデータセットに特有なのは、いくつかの鏡面反射面と透明面の存在です。つまり、最先端のステレオネットワークの障害の主な原因です。私たちの取得パイプラインは、サブピクセル精度で簡単かつ正確なラベリングを可能にする新しい深い時空ステレオフレームワークを活用しています。 64の異なるシーンで収集され、密なグラウンドトゥルースの不一致で注釈が付けられた合計419のサンプルをリリースします。各サンプルには、高解像度のペア(12 Mpx)と不均衡なペア(左:12 Mpx、右:1.1 Mpx)が含まれています。さらに、手動で注釈が付けられたマテリアルセグメンテーションマスクと15Kのラベルなしサンプルを提供します。データセットに基づいて最先端のディープネットワークを評価し、ステレオの未解決の課題に対処する際の制限を強調し、将来の研究のためのヒントを引き出します。
We present a novel high-resolution and challenging stereo dataset framing indoor scenes annotated with dense and accurate ground-truth disparities. Peculiar to our dataset is the presence of several specular and transparent surfaces, i.e. the main causes of failures for state-of-the-art stereo networks. Our acquisition pipeline leverages a novel deep space-time stereo framework which allows for easy and accurate labeling with sub-pixel precision. We release a total of 419 samples collected in 64 different scenes and annotated with dense ground-truth disparities. Each sample include a high-resolution pair (12 Mpx) as well as an unbalanced pair (Left: 12 Mpx, Right: 1.1 Mpx). Additionally, we provide manually annotated material segmentation masks and 15K unlabeled samples. We evaluate state-of-the-art deep networks based on our dataset, highlighting their limitations in addressing the open challenges in stereo and drawing hints for future research.
updated: Thu Jun 09 2022 17:59:56 GMT+0000 (UTC)
published: Thu Jun 09 2022 17:59:56 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト