arXiv reaDer
ES-Net:再識別の詳細を学ぶために顕著な部分を消去する
ES-Net: Erasing Salient Parts to Learn More in Re-Identification
インスタンスレベルの認識の問題として、再識別(re-ID)には、さまざまな機能をキャプチャするためのモデルが必要です。ただし、継続的なトレーニングにより、re-IDモデルは重要な領域にますます注意を払うようになります。その結果、モデルは、顕著な表現を持ついくつかの小さな領域にのみ焦点を当て、他の重要な情報を無視する可能性があります。この現象は、特にモデルが小さなID間変動データで評価される場合に、パフォーマンスの低下につながります。本論文では、画像内の顕著な領域を消去することによって包括的な機能を学習するための新しいネットワーク、Erasing-Salient Net(ES-Net)を提案します。 ES-Netは、オブジェクトの信頼性によって顕著な領域を特定し、トレーニングバッチでそれらを効率的に消去する新しい方法を提案します。一方、過剰消去の問題を軽減するために、このペーパーでは、グローバル最大およびグローバル平均プーリングを一般化するトレーニング可能なプーリング層Pプーリングを使用します。実験は、2つの特定の再識別タスク(つまり、個人の再ID、車両の再ID)で実行されます。当社のES-Netは、3つのPersonre-IDベンチマークと2つのVehiclere-IDベンチマークで最先端の方法を上回っています。具体的には、mAP /ランク1率:Market1501で88.6%/ 95.7%、DuckMTMC-reIDで78.8%/ 89.2%、MSMT17で57.3%/ 80.9%、Veri-776で81.9%/ 97.0%。ランク1 /ランク5の割合:VehicleID(小)で83.6%/ 96.9%、VehicleID(中)で79.9%/ 93.5%、VehicleID(大)で76.9%/ 90.7%。さらに、視覚化された顕著な領域は、ランキング結果について人間が解釈できる視覚的な説明を示しています。
As an instance-level recognition problem, re-identification (re-ID) requires models to capture diverse features. However, with continuous training, re-ID models pay more and more attention to the salient areas. As a result, the model may only focus on few small regions with salient representations and ignore other important information. This phenomenon leads to inferior performance, especially when models are evaluated on small inter-identity variation data. In this paper, we propose a novel network, Erasing-Salient Net (ES-Net), to learn comprehensive features by erasing the salient areas in an image. ES-Net proposes a novel method to locate the salient areas by the confidence of objects and erases them efficiently in a training batch. Meanwhile, to mitigate the over-erasing problem, this paper uses a trainable pooling layer P-pooling that generalizes global max and global average pooling. Experiments are conducted on two specific re-identification tasks (i.e., Person re-ID, Vehicle re-ID). Our ES-Net outperforms state-of-the-art methods on three Person re-ID benchmarks and two Vehicle re-ID benchmarks. Specifically, mAP / Rank-1 rate: 88.6% / 95.7% on Market1501, 78.8% / 89.2% on DuckMTMC-reID, 57.3% / 80.9% on MSMT17, 81.9% / 97.0% on Veri-776, respectively. Rank-1 / Rank-5 rate: 83.6% / 96.9% on VehicleID (Small), 79.9% / 93.5% on VehicleID (Medium), 76.9% / 90.7% on VehicleID (Large), respectively. Moreover, the visualized salient areas show human-interpretable visual explanations for the ranking results.
updated: Wed Mar 10 2021 08:19:46 GMT+0000 (UTC)
published: Wed Mar 10 2021 08:19:46 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト