RGB画像から6Dオブジェクトのポーズを推定することは、自動運転やロボットによる把握など、多くの実際のアプリケーションにとって重要です。最近の深層学習モデルは、このタスクで大きな進歩を遂げましたが、その堅牢性はほとんど研究の注目を集めていませんでした。この作業では、初めて、入力画像への知覚できない摂動を伴う深層学習モデルをだますことができる敵対的サンプルを研究します。特に、統一された6Dポーズ推定攻撃、つまりU6DAを提案します。これは、6Dポーズ推定のためのいくつかの最先端(SOTA)深層学習モデルをうまく攻撃できます。 U6DAの重要なアイデアは、モデルをだまして、正しい6Dポーズ推定に不可欠なオブジェクトインスタンスのローカリゼーションと形状の誤った結果を予測することです。具体的には、6Dポーズ推定への転送ベースのブラックボックス攻撃を調査します。 U6DA損失は、敵対的な例の生成をガイドするように設計されています。損失は、セグメンテーションアテンションマップを元の位置からシフトすることを目的としています。生成された敵対的サンプルは、直接6Dポーズ推定モデルに効果的であるだけでなく、堅牢なRANSACモジュールに関係なく2段階モデルを攻撃できることを示します。大規模な公開ベンチマークでのU6DAの有効性、転送可能性、および防御能力を実証するために、広範な実験が実施されました。また、6Dポーズ推定タスクのロバスト性研究のための新しいU6DA-Linemodデータセットを紹介します。コードとデータセットはhttps://github.com/cuge1995/U6DAで入手できます。
Estimating 6D object pose from an RGB image is important for many real-world applications such as autonomous driving and robotic grasping. Recent deep learning models have achieved significant progress on this task but their robustness received little research attention. In this work, for the first time, we study adversarial samples that can fool deep learning models with imperceptible perturbations to input image. In particular, we propose a Unified 6D pose estimation Attack, namely U6DA, which can successfully attack several state-of-the-art (SOTA) deep learning models for 6D pose estimation. The key idea of our U6DA is to fool the models to predict wrong results for object instance localization and shape that are essential for correct 6D pose estimation. Specifically, we explore a transfer-based black-box attack to 6D pose estimation. We design the U6DA loss to guide the generation of adversarial examples, the loss aims to shift the segmentation attention map away from its original position. We show that the generated adversarial samples are not only effective for direct 6D pose estimation models, but also are able to attack two-stage models regardless of their robust RANSAC modules. Extensive experiments were conducted to demonstrate the effectiveness, transferability, and anti-defense capability of our U6DA on large-scale public benchmarks. We also introduce a new U6DA-Linemod dataset for robustness study of the 6D pose estimation task. Our codes and dataset will be available at https://github.com/cuge1995/U6DA.