単一オブジェクト トラッキング (SOT) の研究はサイクルに陥ります。トラッカーはほとんどのベンチマークでうまく機能しますが、困難なシナリオではすぐに失敗します。研究者は不十分なデータ コンテンツを疑い、より困難な状況でより大きなデータセットを構築するためにより多くの労力を費やすことになります。しかし、非効率なデータ利用と限られた評価方法は、SOT 研究をより深刻に妨げます。前者は既存のデータセットを包括的に活用できない原因となりますが、後者は評価プロセスにおける困難な要因を無視しています。この記事では、代表的なベンチマークを体系化し、シングル オブジェクト トラッキング メタバース (SOTVerse) を形成します。これは、ボトルネックを突破するためのユーザー定義の SOT タスク スペースです。まず、タスクを 3 つのコンポーネント (環境、評価、実行者) で記述する 3E パラダイムを提案します。そして、タスクの特徴をまとめ、組織基準を明確にし、1256万フレームでSOTVerseを構築します。具体的には、SOTVerse はフレームごとに困難な要素に自動的にラベルを付け、ユーザーが構築ルールを使用してユーザー定義のスペースを効率的に生成できるようにします。さらに、SOTVerse は新しいインジケーターを備えた 2 つのメカニズムを提供し、さまざまなサブタスクの下でトラッカーを正常に評価します。その結果、SOTVerse はまず、コンピューター ビジョン分野のリソース利用を改善するための戦略を提供し、研究をより標準的かつ科学的にします。 SOTVerse、ツールキット、評価サーバー、および結果は、http://metaverse.aitestunion.com で入手できます。
Single object tracking (SOT) research falls into a cycle -- trackers perform well on most benchmarks but quickly fail in challenging scenarios, causing researchers to doubt the insufficient data content and take more effort to construct larger datasets with more challenging situations. However, inefficient data utilization and limited evaluation methods more seriously hinder SOT research. The former causes existing datasets can not be exploited comprehensively, while the latter neglects challenging factors in the evaluation process. In this article, we systematize the representative benchmarks and form a Single Object Tracking metaverse (SOTVerse) -- a user-defined SOT task space to break through the bottleneck. We first propose a 3E Paradigm to describe tasks by three components (i.e., environment, evaluation, and executor). Then, we summarize task characteristics, clarify the organization standards, and construct SOTVerse with 12.56 million frames. Specifically, SOTVerse automatically labels challenging factors per frame, allowing users to generate user-defined spaces efficiently via construction rules. Besides, SOTVerse provides two mechanisms with new indicators and successfully evaluates trackers under various subtasks. Consequently, SOTVerse first provides a strategy to improve resource utilization in the computer vision area, making research more standardized and scientific. The SOTVerse, toolkit, evaluation server, and results are available at http://metaverse.aitestunion.com.