このホワイトペーパーでは、応答生成と境界ボックス回帰からなる追跡モデルを設計します。最初のコンポーネントはヒートマップを生成し、さまざまな位置でのオブジェクトの存在を示します。2番目の部分は、マウントされたアンカーへの相対境界ボックスシフトを回帰します。スライディングウィンドウの場所。オブジェクトの形状変化に適応するために両方のコンポーネントで使用されるサイズ変更可能なたたみ込みフィルターのおかげで、追跡モデルは異なるサイズのアンカーを列挙する必要がないため、モデルパラメーターが保存されます。モデルを外観の変化に効果的に適合させるために、モデルをいくつかの勾配ステップで収束できるメタ学習設定で追跡モデルを更新するために、再帰ニューラルオプティマイザーをオフラインでトレーニングすることを提案します。これにより、追跡モデルの更新の収束速度が向上し、パフォーマンスが向上します。私たちは、OTB、VOT、LaSOT、GOT-10K、TrackingNetベンチマークでトラッカー、ROAMおよびROAM ++を広範囲に評価し、最新のアルゴリズムに対して優れたパフォーマンスを発揮します。
In this paper, we design a tracking model consisting of response generation and bounding box regression, where the first component produces a heat map to indicate the presence of the object at different positions and the second part regresses the relative bounding box shifts to anchors mounted on sliding-window locations. Thanks to the resizable convolutional filters used in both components to adapt to the shape changes of objects, our tracking model does not need to enumerate different sized anchors, thus saving model parameters. To effectively adapt the model to appearance variations, we propose to offline train a recurrent neural optimizer to update tracking model in a meta-learning setting, which can converge the model in a few gradient steps. This improves the convergence speed of updating the tracking model while achieving better performance. We extensively evaluate our trackers, ROAM and ROAM++, on the OTB, VOT, LaSOT, GOT-10K and TrackingNet benchmark and our methods perform favorably against state-of-the-art algorithms.