arXiv reaDer
MMPTRACK:ベンチマークを追跡する大規模な高密度注釈付きマルチカメラ複数人
MMPTRACK: Large-scale Densely Annotated Multi-camera Multiple People Tracking Benchmark
マルチカメラ追跡システムは、摩擦のないチェックアウトなど、高品質の追跡結果を必要とするアプリケーションで人気が高まっています。これは、単眼マルチオブジェクト追跡(MOT)システムが、閉塞のために雑然とした混雑した環境で失敗することが多いためです。複数の高度にオーバーラップしたカメラは、部分的な3D情報を復元することにより、問題を大幅に軽減できます。ただし、さまざまなカメラ設定と背景を使用して高品質のマルチカメラ追跡データセットを作成するコストにより、このドメインのデータセットの規模が制限されています。この論文では、自動注釈システムの助けを借りて、5つの異なる環境で大規模な高密度にラベル付けされたマルチカメラ追跡データセットを提供します。このシステムは、オーバーラップおよびキャリブレーションされた深度カメラとRGBカメラを使用して、3Dトラッキング結果を自動的に生成する高性能3Dトラッカーを構築します。 3D追跡結果は、カメラパラメータを使用して各RGBカメラビューに投影され、2D追跡結果が作成されます。次に、3D追跡結果を手動でチェックおよび修正して、ラベルの品質を確認します。これは、完全に手動の注釈よりもはるかに安価です。 2つのリアルタイムマルチカメラトラッカーと異なる設定の人物再識別(ReID)モデルを使用して、広範な実験を実施しました。このデータセットは、雑然とした混雑した環境でのマルチカメラ、マルチオブジェクト追跡システムのより信頼性の高いベンチマークを提供します。また、私たちの結果は、このデータセットにトラッカーとReIDモデルを適応させると、パフォーマンスが大幅に向上することを示しています。私たちのデータセットは、この作業が承認されると公開されます。
Multi-camera tracking systems are gaining popularity in applications that demand high-quality tracking results, such as frictionless checkout because monocular multi-object tracking (MOT) systems often fail in cluttered and crowded environments due to occlusion. Multiple highly overlapped cameras can significantly alleviate the problem by recovering partial 3D information. However, the cost of creating a high-quality multi-camera tracking dataset with diverse camera settings and backgrounds has limited the dataset scale in this domain. In this paper, we provide a large-scale densely-labeled multi-camera tracking dataset in five different environments with the help of an auto-annotation system. The system uses overlapped and calibrated depth and RGB cameras to build a high-performance 3D tracker that automatically generates the 3D tracking results. The 3D tracking results are projected to each RGB camera view using camera parameters to create 2D tracking results. Then, we manually check and correct the 3D tracking results to ensure the label quality, which is much cheaper than fully manual annotation. We have conducted extensive experiments using two real-time multi-camera trackers and a person re-identification (ReID) model with different settings. This dataset provides a more reliable benchmark of multi-camera, multi-object tracking systems in cluttered and crowded environments. Also, our results demonstrate that adapting the trackers and ReID models on this dataset significantly improves their performance. Our dataset will be publicly released upon the acceptance of this work.
updated: Tue Nov 30 2021 06:29:14 GMT+0000 (UTC)
published: Tue Nov 30 2021 06:29:14 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト