個人再識別 (ReID) のための増分学習は、継続的なデータ ストリームでトレーニングできるモデルを開発することを目的としています。これは、現実世界のアプリケーションにとってより実用的な設定です。ただし、既存の増分 ReID 手法では、カメラが固定されており、新しく出現したデータが以前のクラスからクラス素であるという 2 つの強力な前提を設けています。以前に観察された歩行者が再び現れ、新しいカメラで再び撮影される可能性があるため、これは非現実的です。この論文では、クラスの重複問題を考慮して既存の生涯個人 ReID を発展させる、カメラ インクリメンタル パーソン ReID (CIPR) と呼ばれる未踏のシナリオで個人 ReID を調査します。具体的には、新しいカメラから収集された新しいデータには、以前に確認されたアイデンティティの未知の割合が含まれている可能性があります。これにより、プライバシー上の懸念により、新しいデータに対するクロスカメラ注釈が欠如することになります。これらの課題に対処するために、私たちは新しいフレームワーク ExtendOVA を提案します。まず、クラスの重複の問題に対処するために、インスタンスレベルで以前に確認されたアイデンティティを発見するために、インスタンスごとの確認クラス識別モジュールを導入します。次に、信頼性の高い ID ごとの候補を選択するための基準を提案し、擬似ラベルのノイズ問題を修正するための早期学習正則化項も考案します。さらに、以前のデータの欠如を補うために、プロトタイプのメモリ バンクを使用して代理特徴を作成し、カメラ間の関係をさらに保持するためにカメラ間の蒸留損失を加えます。複数のベンチマークに関する包括的な実験結果は、ExtendOVA が最先端技術を大幅に上回り、顕著な利点を備えていることを示しています。
Incremental learning for person re-identification (ReID) aims to develop models that can be trained with a continuous data stream, which is a more practical setting for real-world applications. However, the existing incremental ReID methods make two strong assumptions that the cameras are fixed and the new-emerging data is class-disjoint from previous classes. This is unrealistic as previously observed pedestrians may re-appear and be captured again by new cameras. In this paper, we investigate person ReID in an unexplored scenario named Camera Incremental Person ReID (CIPR), which advances existing lifelong person ReID by taking into account the class overlap issue. Specifically, new data collected from new cameras may probably contain an unknown proportion of identities seen before. This subsequently leads to the lack of cross-camera annotations for new data due to privacy concerns. To address these challenges, we propose a novel framework ExtendOVA. First, to handle the class overlap issue, we introduce an instance-wise seen-class identification module to discover previously seen identities at the instance level. Then, we propose a criterion for selecting confident ID-wise candidates and also devise an early learning regularization term to correct noise issues in pseudo labels. Furthermore, to compensate for the lack of previous data, we resort prototypical memory bank to create surrogate features, along with a cross-camera distillation loss to further retain the inter-camera relationship. The comprehensive experimental results on multiple benchmarks show that ExtendOVA significantly outperforms the state-of-the-arts with remarkable advantages.