個人の再識別(Re-ID)メソッドの教師あり学習ではデータ注釈のコストが高いため、教師なし学習は実世界でより魅力的になります。階層的クラスタリングに基づくボトムアップクラスタリング(BUC)アプローチは、有望な教師なしクラスタリング手法の1つとして機能します。 BUCの重要な要素の1つは、距離測定戦略です。理想的には、距離測定では、すべてのサンプルのクラスター間距離とクラスター内距離の両方を考慮する必要があります。ただし、BUCは最小距離を使用し、2つのクラスター間の最も近いサンプルのペアのみを考慮し、クラスター内の他のサンプルの多様性を無視します。この問題を解決するために、エネルギー距離を使用して階層的クラスタリング(E-cluster)でクラスター間距離とクラスター内距離の両方を評価し、偏差の二乗和(SSD)を正則化項として使用して、エネルギー距離評価の多様性と類似性のバランスを取ります。 Market-1501、DukeMTMC-reID、MARSなどの大規模なre-IDデータセットでメソッドを評価します。広範な実験により、本手法が最先端の監視なし手法よりも大幅に改善され、一部の転移学習手法よりも優れていることが示されています。
Due to the high cost of data annotation in supervised learning for person re-identification (Re-ID) methods, unsupervised learning becomes more attractive in the real world. The Bottom-up Clustering (BUC) approach based on hierarchical clustering serves as one promising unsupervised clustering method. One key factor of BUC is the distance measurement strategy. Ideally, the distance measurement should consider both inter-cluster and intra-cluster distance of all samples. However, BUC uses the minimum distance, only considers a pair of the nearest sample between two clusters and ignores the diversity of other samples in clusters. To solve this problem, we propose to use the energy distance to evaluate both the inter-cluster and intra-cluster distance in hierarchical clustering(E-cluster), and use the sum of squares of deviations(SSD) as a regularization term to further balance the diversity and similarity of energy distance evaluation. We evaluate our method on large scale re-ID datasets, including Market-1501, DukeMTMC-reID and MARS. Extensive experiments show that our method obtains significant improvements over the state-of-the-art unsupervised methods, and even better than some transfer learning methods.