ディープラーニングの進歩により、オブジェクト検出やセマンティックセグメンテーションなどのタスクの精度が向上し、コンピュータービジョンが着実に進歩しています。それにもかかわらず、ディープニューラルネットワークは敵対的な攻撃に対して脆弱であるため、信頼性の高い展開には課題があります。ロボット工学と高度なドライブ支援システムの3Dシーン理解における2つの重要なタスクは、単眼深度とポーズ推定であり、多くの場合、教師なしで一緒に学習されます。単眼深度推定に対する敵対的攻撃の影響を評価する研究は存在しますが、ポーズ推定に対する敵対的摂動の体系的なデモンストレーションと分析は欠けています。付加的な知覚できない摂動がどのように予測を変更して軌道ドリフトを増加させるだけでなく、その形状を壊滅的に変化させることができるかを示します。また、単眼深度を対象とした敵対的摂動とポーズ推定ネットワークとの関係、および異なるアーキテクチャと損失を持つ他のネットワークへの摂動の伝達可能性についても研究します。私たちの実験は、生成された摂動が相対的な回転と並進の予測に顕著なエラーをもたらし、ネットワークの脆弱性を解明する方法を示しています。
Advances in deep learning have resulted in steady progress in computer vision with improved accuracy on tasks such as object detection and semantic segmentation. Nevertheless, deep neural networks are vulnerable to adversarial attacks, thus presenting a challenge in reliable deployment. Two of the prominent tasks in 3D scene-understanding for robotics and advanced drive assistance systems are monocular depth and pose estimation, often learned together in an unsupervised manner. While studies evaluating the impact of adversarial attacks on monocular depth estimation exist, a systematic demonstration and analysis of adversarial perturbations against pose estimation are lacking. We show how additive imperceptible perturbations can not only change predictions to increase the trajectory drift but also catastrophically alter its geometry. We also study the relation between adversarial perturbations targeting monocular depth and pose estimation networks, as well as the transferability of perturbations to other networks with different architectures and losses. Our experiments show how the generated perturbations lead to notable errors in relative rotation and translation predictions and elucidate vulnerabilities of the networks.