arXiv reaDer
PRSNet: マスクされた自己教師あり学習歩行者再識別法
PRSNet: A Masked Self-Supervised Learning Pedestrian Re-Identification Method
近年、自己教師あり学習は幅広い学術的議論を呼び、コンピューター ビジョンの重要な問題の多くに対処しています。現在の研究の焦点は、現在のタスクの事前トレーニング中にモデル推論が加速されるように、画像に関する高度なセマンティック情報のネットワーク学習を改善できる優れたエージェント タスクを構築する方法です。既存の特徴抽出ネットワークが ImageNet データセットで事前にトレーニングされており、歩行者の画像のきめの細かい情報をうまく抽出できないという問題を解決するために、コントラスト自己教師あり学習の既存の事前タスクが元のプロパティを破壊する可能性があります。歩行者の画像に基づいて、このペーパーでは、マスク再構築の事前タスクを設計して、強力なロバスト性を持つ事前トレーニング モデルを取得し、それを歩行者再識別タスクに使用します。ネットワークのトレーニング最適化は、重心に基づいてトリプレット損失を改善することによって実行され、マスク画像が追加サンプルとして損失計算に追加されるため、ネットワークはトレーニング後の実際のアプリケーションでの歩行者マッチングにより適切に対処できます。完成されました。この方法は、Marker1501 および CUHK03 データで、既存の自己教師あり学習歩行者再識別方法よりも約 5% 高い mAP を達成し、Rank1 では約 1% 高く、この方法の実現可能性を実証するためにアブレーション実験が行われています。モデル コードは https://github.com/ZJieX/prsnet にあります。
In recent years, self-supervised learning has attracted widespread academic debate and addressed many of the key issues of computer vision. The present research focus is on how to construct a good agent task that allows for improved network learning of advanced semantic information on images so that model reasoning is accelerated during pre-training of the current task. In order to solve the problem that existing feature extraction networks are pre-trained on the ImageNet dataset and cannot extract the fine-grained information in pedestrian images well, and the existing pre-task of contrast self-supervised learning may destroy the original properties of pedestrian images, this paper designs a pre-task of mask reconstruction to obtain a pre-training model with strong robustness and uses it for the pedestrian re-identification task. The training optimization of the network is performed by improving the triplet loss based on the centroid, and the mask image is added as an additional sample to the loss calculation, so that the network can better cope with the pedestrian matching in practical applications after the training is completed. This method achieves about 5% higher mAP on Marker1501 and CUHK03 data than existing self-supervised learning pedestrian re-identification methods, and about 1% higher for Rank1, and ablation experiments are conducted to demonstrate the feasibility of this method. Our model code is located at https://github.com/ZJieX/prsnet.
updated: Sat Mar 11 2023 07:20:32 GMT+0000 (UTC)
published: Sat Mar 11 2023 07:20:32 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト