既存の手作りの学習ベースのローカル記述子のほとんどは、アフィン画像変換に対してせいぜいほぼ不変であり、変形可能な表面を無視することがよくあります。この論文では、等尺性の非剛体変形に対しても不変であるRGB-D画像(RGBはピクセルの色の明るさを表し、Dは深度情報を表す)から記述子を計算する新しいアプローチを提案することにより、さらに一歩進んでいます。スケールの変更と回転に関して。私たちが提案する記述戦略は、表面測地線を使用して歪みのないローカル画像パッチの特徴表現を学習するという重要なアイデアに基づいています。測地線認識機能を効率的に計算するために、2つの補完的なローカル記述子戦略を設計します。1つは手作りのバイナリテストに基づく効率的なバイナリ記述子(GeoBitという名前)、もう1つは畳み込みニューラルネットワーク(CNN)を使用して機能を計算する学習ベースの記述子(GeoPatch)です。実際のおよび公開されているRGB-Dデータベンチマークを使用したさまざまな実験では、スコアの一致、オブジェクトの取得、および非剛体表面において、最先端の手作りおよび学習ベースの画像およびRGB-D記述子を一貫して上回っています。同等の処理時間での追跡実験。また、変形可能な表面対応アルゴリズムのベンチマークを評価するために、強力な非剛体変形を受けたさまざまなオブジェクト(シャツ、布、絵画、バッグ)のRGB-D画像の正確に一致する注釈を含む新しいデータセットをコミュニティに提供します。
Most of the existing handcrafted and learning-based local descriptors are still at best approximately invariant to affine image transformations, often disregarding deformable surfaces. In this paper, we take one step further by proposing a new approach to compute descriptors from RGB-D images (where RGB refers to the pixel color brightness and D stands for depth information) that are invariant to isometric non-rigid deformations, as well as to scale changes and rotation. Our proposed description strategies are grounded on the key idea of learning feature representations on undistorted local image patches using surface geodesics. We design two complementary local descriptors strategies to compute geodesic-aware features efficiently: one efficient binary descriptor based on handcrafted binary tests (named GeoBit), and one learning-based descriptor (GeoPatch) with convolutional neural networks (CNNs) to compute features. In different experiments using real and publicly available RGB-D data benchmarks, they consistently outperforms state-of-the-art handcrafted and learning-based image and RGB-D descriptors in matching scores, as well as in object retrieval and non-rigid surface tracking experiments, with comparable processing times. We also provide to the community a new dataset with accurate matching annotations of RGB-D images of different objects (shirts, cloths, paintings, bags), subjected to strong non-rigid deformations, for evaluation benchmark of deformable surface correspondence algorithms.