マルチオブジェクトトラッキングおよびセグメンテーション(MOTS)は、自動運転アプリケーションにとって重要なタスクです。既存のMOTS研究は、2つの重大な課題に直面しています。1)公開されたデータセットは、さまざまな運転設定に対処するためのネットワークトレーニングの実際の複雑さを十分に捉えていません。 2)作業パイプライン注釈ツールは、MOTS学習例の品質を向上させるために、文献で十分に研究されていません。この作業では、DG-LabelerおよびDGL-MOTSデータセットを導入して、MOTSタスクのトレーニングデータ注釈を容易にし、それに応じてネットワークトレーニングの精度と効率を向上させます。 DG-Labelerは、新しいDepth-Granularity Moduleを使用して、インスタンスの空間関係を表現し、きめの細かいインスタンスマスクを生成します。 DG-Labelerによって注釈が付けられた、DGL-MOTSデータセットは、データの多様性、注釈の品質、および時間的表現において、以前の取り組み(つまり、KITTI MOTSおよびBDD100K)を上回っています。広範なクロスデータセット評価の結果は、DGL-MOTSデータセットでトレーニングされたいくつかの最先端の方法でパフォーマンスが大幅に向上したことを示しています。私たちのDGL-MOTSデータセットとDG-Labelerは、将来の交通機関の視覚を高める貴重な可能性を秘めていると信じています。
Multi-object tracking and segmentation (MOTS) is a critical task for autonomous driving applications. The existing MOTS studies face two critical challenges: 1) the published datasets inadequately capture the real-world complexity for network training to address various driving settings; 2) the working pipeline annotation tool is under-studied in the literature to improve the quality of MOTS learning examples. In this work, we introduce the DG-Labeler and DGL-MOTS dataset to facilitate the training data annotation for the MOTS task and accordingly improve network training accuracy and efficiency. DG-Labeler uses the novel Depth-Granularity Module to depict the instance spatial relations and produce fine-grained instance masks. Annotated by DG-Labeler, our DGL-MOTS dataset exceeds the prior effort (i.e., KITTI MOTS and BDD100K) in data diversity, annotation quality, and temporal representations. Results on extensive cross-dataset evaluations indicate significant performance improvements for several state-of-the-art methods trained on our DGL-MOTS dataset. We believe our DGL-MOTS Dataset and DG-Labeler hold the valuable potential to boost the visual perception of future transportation.