過去10年間に、ビデオ内の一般的なオブジェクトを追跡するためのさまざまなアルゴリズムが提案されてきました。最近の大規模なビデオデータセットで実行すると、さまざまな追跡動作が大量に発生する可能性があります。強化学習の新しい傾向は、専門家エージェントのデモンストレーションを使用して、ポリシー学習のプロセスを高速化できることを示しました。このような作品と強化学習の最近のアプリケーションから視覚追跡へのインスピレーションを得て、効果的な追跡ポリシーを学習するために最先端のトラッカーのデモンストレーションを活用する2つの新しいトラッカーA3CTと、A3CTDを提案します。トラッキング中の動作を修正するための同じエキスパートトラッカーの利点。 GOT-10k、OTB-100、LaSOT、UAV123、およびVOTベンチマークでの広範な実験的検証を通じて、提案されたトラッカーがリアルタイムで実行中に最先端のパフォーマンスを達成することを示します。
In the last decade many different algorithms have been proposed to track a generic object in videos. Their execution on recent large-scale video datasets can produce a great amount of various tracking behaviours. New trends in Reinforcement Learning showed that demonstrations of an expert agent can be efficiently used to speed-up the process of policy learning. Taking inspiration from such works and from the recent applications of Reinforcement Learning to visual tracking, we propose two novel trackers, A3CT, which exploits demonstrations of a state-of-the-art tracker to learn an effective tracking policy, and A3CTD, that takes advantage of the same expert tracker to correct its behaviour during tracking. Through an extensive experimental validation on the GOT-10k, OTB-100, LaSOT, UAV123 and VOT benchmarks, we show that the proposed trackers achieve state-of-the-art performance while running in real-time.