arXiv reaDer
クロスドメインの人の再識別のための教師なしの自己適応技術
Unsupervised and self-adaptative techniques for cross-domain person re-identification
重複しないカメラ間での人物再識別(ReID)は困難な作業であり、このため、従来技術のほとんどの作品は、異なるビューで同じ人物を照合するために、ラベル付きデータセットからの教師あり特徴学習に依存しています。ただし、特にフォレンジックシナリオでは、取得したデータにラベルを付け、その迅速な展開を禁止するという時間のかかるタスクが必要になります。教師なしドメイン適応(UDA)は、IDラベル注釈なしで、ソースでトレーニングされたモデルからターゲットドメインへの特徴学習適応を実行するため、有望な代替手段として登場します。ただし、ほとんどのUDAベースのアルゴリズムは、いくつかのハイパーパラメーターを持つ複雑な損失関数に依存しているため、さまざまなシナリオへの一般化が妨げられます。さらに、UDAはドメイン間の変換に依存するため、見えないドメインから最も信頼性の高いデータを選択することが重要です。これにより、ターゲットデータのノイズの多い例によって引き起こされるエラーの伝播を回避できます。これは見過ごされがちな問題です。この意味で、1つのハイパーパラメータのみで単純な損失関数を最適化し、クラスター内のカメラの多様性に基づく新しいオフライン戦略によって作成されたサンプルのトリプレットを利用する、新しいUDAベースのReIDメソッドを提案します。この新しい戦略は、モデルを適応させ、またモデルを正規化して、ターゲットドメインでの過剰適合を回避します。また、新しい自己アンサンブル戦略を導入します。この戦略では、さまざまな反復からの重みが集約され、適応の異なる瞬間からの知識を組み合わせた最終モデルが作成されます。評価のために、3つのよく知られた深層学習アーキテクチャを検討し、それらを組み合わせて最終的な意思決定を行います。提案された方法は、ターゲットドメインで人の再ランク付けやラベルを使用せず、Market to Duke、挑戦的なMarket1501からMSMT17、およびDukeからMSMT17への適応シナリオで、はるかに簡単なセットアップで最先端を上回ります。 。
Person Re-Identification (ReID) across non-overlapping cameras is a challenging task and, for this reason, most works in the prior art rely on supervised feature learning from a labeled dataset to match the same person in different views. However, it demands the time-consuming task of labeling the acquired data, prohibiting its fast deployment, specially in forensic scenarios. Unsupervised Domain Adaptation (UDA) emerges as a promising alternative, as it performs feature-learning adaptation from a model trained on a source to a target domain without identity-label annotation. However, most UDA-based algorithms rely upon a complex loss function with several hyper-parameters, which hinders the generalization to different scenarios. Moreover, as UDA depends on the translation between domains, it is important to select the most reliable data from the unseen domain, thus avoiding error propagation caused by noisy examples on the target data -- an often overlooked problem. In this sense, we propose a novel UDA-based ReID method that optimizes a simple loss function with only one hyper-parameter and that takes advantage of triplets of samples created by a new offline strategy based on the diversity of cameras within a cluster. This new strategy adapts the model and also regularizes it, avoiding overfitting on the target domain. We also introduce a new self-ensembling strategy, in which weights from different iterations are aggregated to create a final model combining knowledge from distinct moments of the adaptation. For evaluation, we consider three well-known deep learning architectures and combine them for final decision-making. The proposed method does not use person re-ranking nor any label on the target domain, and outperforms the state of the art, with a much simpler setup, on the Market to Duke, the challenging Market1501 to MSMT17, and Duke to MSMT17 adaptation scenarios.
updated: Sun Mar 21 2021 23:58:39 GMT+0000 (UTC)
published: Sun Mar 21 2021 23:58:39 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト