識別可能なパターンを学習するために、車両再識別 (ReID) の最近の研究のほとんどは、さまざまな監視を提供するために公式のベンチマークを再開発するのに苦労しており、これには法外な人的労力が必要です。この論文では、同様の目標を達成しようとしていますが、それ以上の人的努力は必要ありません。この目的のために、幾何学的なローカル機能とグローバル表現の両方を正常にエンコードして車両インスタンスを区別する新しいフレームワークを導入し、公式の ID ラベルからの監視によってのみ最適化します。具体的には、ReID のオブジェクトが同様の幾何学的特性を共有しているという洞察を考慮して、幾何学的特徴の発見を容易にするために、自己教師あり表現学習を借用することを提案します。これらの機能を凝縮するために、完全に自動化された学習ではなく局所最大値集約のコアを備えた解釈可能な注意モジュールを導入します。そのメカニズムは完全に理解でき、応答マップは物理的に合理的です。私たちの知る限り、自己教師あり学習を実行して幾何学的特徴を発見したのは私たちが初めてです。車両 ReID の 3 つの最も一般的なデータセット、つまり、VeRi-776、CityFlow-ReID、VehicleID で包括的な実験を行います。最先端の (SOTA) パフォーマンスと有望な視覚化結果を報告します。また、他の ReID 関連タスク、つまり、人物 ReID およびマルチターゲット マルチカメラ (MTMC) 車両追跡に対するアプローチの優れたスケーラビリティも示します。
To learn distinguishable patterns, most of recent works in vehicle re-identification (ReID) struggled to redevelop official benchmarks to provide various supervisions, which requires prohibitive human labors. In this paper, we seek to achieve the similar goal but do not involve more human efforts. To this end, we introduce a novel framework, which successfully encodes both geometric local features and global representations to distinguish vehicle instances, optimized only by the supervision from official ID labels. Specifically, given our insight that objects in ReID share similar geometric characteristics, we propose to borrow self-supervised representation learning to facilitate geometric features discovery. To condense these features, we introduce an interpretable attention module, with the core of local maxima aggregation instead of fully automatic learning, whose mechanism is completely understandable and whose response map is physically reasonable. To the best of our knowledge, we are the first that perform self-supervised learning to discover geometric features. We conduct comprehensive experiments on three most popular datasets for vehicle ReID, i.e., VeRi-776, CityFlow-ReID, and VehicleID. We report our state-of-the-art (SOTA) performances and promising visualization results. We also show the excellent scalability of our approach on other ReID related tasks, i.e., person ReID and multi-target multi-camera (MTMC) vehicle tracking.