Omni-Scale Feature Learning for Person Re-Identification
 インスタンスレベルの認識問題として、個人の再識別(ReID)は、異なる空間スケールをキャプチャするだけでなく、複数のスケールの任意の組み合わせをカプセル化する識別特徴に依存しています。同種スケールと異種スケールの両方の特徴を全スケール特徴と呼びます。このホワイトペーパーでは、オムニスケールの特徴学習のために、Omni-Scale Network(OSNet)と呼ばれる新しいディープReID CNNを設計します。これは、それぞれが特定のスケールで特徴を検出する複数の畳み込みストリームで構成される残差ブロックを設計することで実現されます。重要なのは、マルチスケール特徴と入力依存のチャネルごとの重みを動的に融合するための新しい統合された集約ゲートが導入されていることです。空間チャネル相関を効率的に学習し、オーバーフィッティングを回避するために、ビルディングブロックはポイントワイズおよび深度ワイズの畳み込みを使用します。このようなブロックをレイヤーごとに積み重ねることにより、OSNetは非常に軽量であり、既存のReIDベンチマークでゼロからトレーニングできます。 OSNetは、その小さなモデルサイズにもかかわらず、6人のReIDデータセットで最先端のパフォーマンスを達成し、ほとんどの大規模モデルを大幅に上回るパフォーマンスを実現しています。コードとモデルは、で入手できます。
As an instance-level recognition problem, person re-identification (ReID) relies on discriminative features, which not only capture different spatial scales but also encapsulate an arbitrary combination of multiple scales. We call features of both homogeneous and heterogeneous scales omni-scale features. In this paper, a novel deep ReID CNN is designed, termed Omni-Scale Network (OSNet), for omni-scale feature learning. This is achieved by designing a residual block composed of multiple convolutional streams, each detecting features at a certain scale. Importantly, a novel unified aggregation gate is introduced to dynamically fuse multi-scale features with input-dependent channel-wise weights. To efficiently learn spatial-channel correlations and avoid overfitting, the building block uses pointwise and depthwise convolutions. By stacking such block layer-by-layer, our OSNet is extremely lightweight and can be trained from scratch on existing ReID benchmarks. Despite its small model size, OSNet achieves state-of-the-art performance on six person ReID datasets, outperforming most large-sized models, often by a clear margin. Code and models are available at:
updated: Wed Dec 18 2019 09:29:53 GMT+0000 (UTC)
published: Thu May 02 2019 20:42:26 GMT+0000 (UTC)
