arXiv reaDer
UAV 車両再識別用の新しいデュアルプーリング アテンション モジュール
A Novel Dual-pooling Attention Module for UAV Vehicle Re-identification
車両の再識別 (Re-ID) には、車両の画像が与えられた場合に、他のカメラで撮影された同じ車両を識別することが含まれます。安全な都市とスマートシティの開発において重要な役割を果たします。無人航空機 (UAV) 技術の急速な成長と実装に伴い、UAV 航空写真シーンにおける車両 Re-ID は研究者から大きな注目を集めています。ただし、UAV は高度が高いため、車両画像の撮影角度が垂直に近づくことがあり、その結果、Re-ID の局所特徴が少なくなります。したがって、本論文は、チャネルプーリングアテンション(CpA)と空間プーリングの2つのブランチを構築することにより、チャネルと空間次元の両方から車両に関する局所的に重要な情報の抽出と強化を実現する、新しいデュアルプーリングアテンション(DpA)モジュールを提案します。注意(SpA)を強化し、複数のプーリング操作を採用して車両のきめの細かい情報への注意を強化します。具体的には、CpA モジュールは、4 つのプーリング操作を組み合わせることにより、特徴マップのチャネルとスプライス特徴の間で動作し、識別情報を含む車両領域に大きな注目が与えられます。 SpA モジュールは、同じプーリング操作戦略を使用して、識別表現を識別し、重み付けされた方法で画像領域内の車両特徴をマージします。両方の次元の特徴情報は最終的に融合され、ラベル スムージング クロス エントロピー損失とハード マイニング トリプレット損失を使用して共同トレーニングされます。これにより、UAV ショットの高さが原因で詳細情報が欠落する問題が解決されます。提案された方法の有効性は、UAV ベースの車両データセット VeRi-UAV および VRU での広範な実験を通じて実証されています。
Vehicle re-identification (Re-ID) involves identifying the same vehicle captured by other cameras, given a vehicle image. It plays a crucial role in the development of safe cities and smart cities. With the rapid growth and implementation of unmanned aerial vehicles (UAVs) technology, vehicle Re-ID in UAV aerial photography scenes has garnered significant attention from researchers. However, due to the high altitude of UAVs, the shooting angle of vehicle images sometimes approximates vertical, resulting in fewer local features for Re-ID. Therefore, this paper proposes a novel dual-pooling attention (DpA) module, which achieves the extraction and enhancement of locally important information about vehicles from both channel and spatial dimensions by constructing two branches of channel-pooling attention (CpA) and spatial-pooling attention (SpA), and employing multiple pooling operations to enhance the attention to fine-grained information of vehicles. Specifically, the CpA module operates between the channels of the feature map and splices features by combining four pooling operations so that vehicle regions containing discriminative information are given greater attention. The SpA module uses the same pooling operations strategy to identify discriminative representations and merge vehicle features in image regions in a weighted manner. The feature information of both dimensions is finally fused and trained jointly using label smoothing cross-entropy loss and hard mining triplet loss, thus solving the problem of missing detail information due to the high height of UAV shots. The proposed method's effectiveness is demonstrated through extensive experiments on the UAV-based vehicle datasets VeRi-UAV and VRU.
updated: Sun Jun 25 2023 02:46:12 GMT+0000 (UTC)
published: Sun Jun 25 2023 02:46:12 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト