既存の個人識別(re-id)メソッドは、ほとんどの場合、ドメインごとのトレーニングデータとラベル付けされた多数の個人IDからの教師ありモデル学習に依存しています。これにより、大規模な展開でのスケーラビリティと使いやすさが制限されます。この作業では、教師なしの方法でラベルのないトラックレットデータから識別者のre-idモデルを訓練できる新しい選択的トラックレット学習(STL)アプローチを提示します。これにより、カメラビュー全体で人物画像/トラックレットの真のマッチングペアに徹底的にラベルを付けるという面倒でコストのかかるプロセスを回避できます。重要なことに、私たちの方法は、生のトラックレットの任意のノイズの多いデータに対して特に堅牢であるため、制約のない追跡データから識別モデルを学習するためにスケーラブルです。これは、IDクラスごとに真の一致とバランスの取れたトラックレットサンプルの存在を想定することが多い、いくつかの既存の代替メソッドとは異なります。これは、マルチカメラマルチタスク深層学習モデル構造で調査されたデータ適応型画像からトラックレットへの選択的マッチング損失関数を定式化することによって実現されます。広範な比較実験は、提案されたSTLモデルが、3つの大きなトラックレットの人のre-idベンチマークで、最先端の教師なし学習およびワンショット学習のre-idメソッドを大幅に上回っていることを示しています。
Existing person re-identification (re-id) methods mostly rely on supervised model learning from a large set of person identity labelled training data per domain. This limits their scalability and usability in large scale deployments. In this work, we present a novel selective tracklet learning (STL) approach that can train discriminative person re-id models from unlabelled tracklet data in an unsupervised manner. This avoids the tedious and costly process of exhaustively labelling person image/tracklet true matching pairs across camera views. Importantly, our method is particularly more robust against arbitrary noisy data of raw tracklets therefore scalable to learning discriminative models from unconstrained tracking data. This differs from a handful of existing alternative methods that often assume the existence of true matches and balanced tracklet samples per identity class. This is achieved by formulating a data adaptive image-to-tracklet selective matching loss function explored in a multi-camera multi-task deep learning model structure. Extensive comparative experiments demonstrate that the proposed STL model surpasses significantly the state-of-the-art unsupervised learning and one-shot learning re-id methods on three large tracklet person re-id benchmarks.