オブジェクトの再識別 (ReID) は、バイオメトリクスおよび監視システムにおける最も重要な問題の 1 つであり、過去数十年間、画像処理およびコンピューター ビジョンのコミュニティによって広く研究されてきました。堅牢で識別可能な特徴表現を学習することは、オブジェクト ReID にとって重要な課題です。無人航空機 (UAV) に基づく ReID では、飛行中のドローンの連続的に変化するカメラ パラメーター (視野角、高度など) によって画像が特徴付けられるため、この問題はさらに困難になります。この課題に対処するために、さまざまな高度で飛行する UAV からキャプチャされた画像を特徴付けるマルチスケール フィーチャ表現が検討されています。この作業では、UAV ベースのオブジェクト ReID のバックボーンとして、畳み込みのない新しいマルチスケール アーキテクチャである Pyramid Vision Transformer (PVT) を採用するマルチタスク学習アプローチを提案します。クラス内変動の不確実性モデリングにより、提案されたモデルは、不確実性を認識したオブジェクト ID とカメラ ID 情報の両方を使用して共同で最適化できます。実験結果は、提案されたアプローチの有効性を検証するために、空中監視からの2つのReIDデータセットであるPRAIとVRAIで報告されています
Object Re-IDentification (ReID), one of the most significant problems in biometrics and surveillance systems, has been extensively studied by image processing and computer vision communities in the past decades. Learning a robust and discriminative feature representation is a crucial challenge for object ReID. The problem is even more challenging in ReID based on Unmanned Aerial Vehicle (UAV) as the images are characterized by continuously varying camera parameters (e.g., view angle, altitude, etc.) of a flying drone. To address this challenge, multiscale feature representation has been considered to characterize images captured from UAV flying at different altitudes. In this work, we propose a multitask learning approach, which employs a new multiscale architecture without convolution, Pyramid Vision Transformer (PVT), as the backbone for UAV-based object ReID. By uncertainty modeling of intraclass variations, our proposed model can be jointly optimized using both uncertainty-aware object ID and camera ID information. Experimental results are reported on PRAI and VRAI, two ReID data sets from aerial surveillance, to verify the effectiveness of our proposed approach