最近、ビジュアルトラッカーの大部分は、高い追跡精度を達成するためのバックボーンとして畳み込みニューラルネットワーク(CNN)を採用しています。ただし、シャムのネットワークを含むCNNによってもたらされる潜在的な敵対的脅威にはあまり注意が払われていません。このホワイトペーパーでは、最初にシャムトラッカーの既存の脆弱性を分析し、攻撃を成功させるための要件を提案します。これに基づいて、敵対的生成問題を定式化し、トラッカーを失敗させる3Dオブジェクトの摂動テクスチャマップを生成するためのエンドツーエンドパイプラインを提案します。最後に、徹底的な実験を行って、アルゴリズムの有効性を検証します。実験結果は、私たちのアルゴリズムによって生成された敵対的な例が、被害者追跡者の追跡精度を首尾よく低下させ、さらにはそれらをドリフトさせることさえできることを示しています。私たちの知る限り、これはビジュアルトラッカーで3D敵対的な例を生成する最初の作業です。
Recently, the majority of visual trackers adopt Convolutional Neural Network (CNN) as their backbone to achieve high tracking accuracy. However, less attention has been paid to the potential adversarial threats brought by CNN, including Siamese network. In this paper, we first analyze the existing vulnerabilities in Siamese trackers and propose the requirements for a successful adversarial attack. On this basis, we formulate the adversarial generation problem and propose an end-to-end pipeline to generate a perturbed texture map for the 3D object that causes the trackers to fail. Finally, we conduct thorough experiments to verify the effectiveness of our algorithm. Experiment results show that adversarial examples generated by our algorithm can successfully lower the tracking accuracy of victim trackers and even make them drift off. To the best of our knowledge, this is the first work to generate 3D adversarial examples on visual trackers.