arXiv reaDer
Exploiting Prunability for Person Re-Identification
近年、個人を複数の分散カメラで認識しなければならない、個人の再識別などの視覚認識タスク用に提案されたディープラーニング(DL)アーキテクチャが大幅に増加しています。これらのアーキテクチャは最先端の精度を大幅に向上させましたが、特徴抽出に一般的に使用されるCNNの計算の複雑さは依然として問題であり、リソースが限られているプラットフォームやリアルタイムの制約があるアプリケーションでの展開を妨げています。 DLモデルの精度を大幅に低下させることなく、DLモデルを加速および圧縮することには明らかな利点があります。ただし、ソース(プルーニング)ドメインは操作(ターゲット)ドメインとは異なり、重複しない異なるカメラ視点でキャプチャされた画像データ間のドメインシフトにより、認識精度が低下します。このペーパーでは、さまざまな設計シナリオでのこれらのアーキテクチャの実行可能性を調査します。このホワイトペーパーでは、最初に、個人識別に適用されるディープCNNネットワークの計算の複雑さを軽減するのに適したプルーニング手法について再検討します。次に、これらの手法は、プルーニング基準と戦略に従って、およびプルーニング方法を利用してネットワークをターゲットドメインに微調整するためのさまざまなシナリオに従って分析されます。 ResNet特徴抽出器を備えたDLモデル、および複数のベンチマーク再識別データセットを使用して得られた実験結果は、プルーニングが高レベルの精度を維持しながらネットワークの複雑さを大幅に軽減できることを示しています。大規模な事前トレーニングまたは微調整データセットを使用してプルーニングが実行されるシナリオでは、ResNetアーキテクチャに必要なFLOPSの数が半分に減り、同等のランク1の精度(元のモデルの1%以内)が維持されます。大きなCNNをトレーニングしながらプルーニングすると、小さなCNNを微調整するよりもパフォーマンスが大幅に向上します。
Recent years have witnessed a substantial increase in the deep learning (DL)architectures proposed for visual recognition tasks like person re-identification,where individuals must be recognized over multiple distributed cameras. Althoughthese architectures have greatly improved the state-of-the-art accuracy, thecomputational complexity of the CNNs commonly used for feature extractionremains an issue, hindering their deployment on platforms with limited resources,or in applications with real-time constraints. There is an obvious advantage toaccelerating and compressing DL models without significantly decreasing theiraccuracy. However, the source (pruning) domain differs from operational (target)domains, and the domain shift between image data captured with differentnon-overlapping camera viewpoints leads to lower recognition accuracy. In thispaper, we investigate the prunability of these architectures under different designscenarios. This paper first revisits pruning techniques that are suitable forreducing the computational complexity of deep CNN networks applied to personre-identification. Then, these techniques are analysed according to their pruningcriteria and strategy, and according to different scenarios for exploiting pruningmethods to fine-tuning networks to target domains. Experimental resultsobtained using DL models with ResNet feature extractors, and multiplebenchmarks re-identification datasets, indicate that pruning can considerablyreduce network complexity while maintaining a high level of accuracy. Inscenarios where pruning is performed with large pre-training or fine-tuningdatasets, the number of FLOPS required by ResNet architectures is reduced byhalf, while maintaining a comparable rank-1 accuracy (within 1% of the originalmodel). Pruning while training a larger CNNs can also provide a significantlybetter performance than fine-tuning smaller ones.
updated: Wed Apr 14 2021 17:19:59 GMT+0000 (UTC)
published: Thu Jul 04 2019 18:02:53 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト