arXiv reaDer
物体検出のための光線形空間変換器を備えたコンテンツ拡張機能ピラミッドネットワーク
Content-Augmented Feature Pyramid Network with Light Linear Spatial Transformers for Object Detection
普及しているコンポーネントの1つとして、Feature Pyramid Network(FPN)は、マルチスケールのオブジェクト検出パフォーマンスを向上させるために、現在のオブジェクト検出モデルで広く使用されています。ただし、その機能融合モードは依然として不整合でローカルな方法であるため、表現力が制限されます。 FPNの継承された欠陥に対処するために、コンテンツ拡張機能ピラミッドネットワーク(CA-FPN)と呼ばれる新しいアーキテクチャがこの論文で提案されています。まず、マルチスケールコンテキスト情報を抽出するためにグローバルコンテンツ抽出モジュール(GCEM)が提案されます。次に、軽量の線形空間トランスフォーマー接続がトップダウン経路に追加され、各特徴マップをマルチスケールの特徴で補強します。線形化された近似自己注意関数は、モデルの複雑さを軽減するように設計されています。 Transformerの自己注意メカニズムにより、フィーチャフュージョン中にフィーチャマップを位置合わせする必要がなくなり、位置ずれした欠陥が解決されます。クエリスコープを特徴マップ全体に設定することで、局所的な欠陥も解決できます。 COCOおよびPASCALVOCデータセットに関する広範な実験により、CA-FPNは、ベルやホイッスルのない他のFPNベースの検出器よりも優れており、さまざまな設定で堅牢であることが実証されました。
As one of the prevalent components, Feature Pyramid Network (FPN) is widely used in current object detection models for improving multi-scale object detection performance. However, its feature fusion mode is still in a misaligned and local manner, thus limiting the representation power. To address the inherit defects of FPN, a novel architecture termed Content-Augmented Feature Pyramid Network (CA-FPN) is proposed in this paper. Firstly, a Global Content Extraction Module (GCEM) is proposed to extract multi-scale context information. Secondly, lightweight linear spatial Transformer connections are added in the top-down pathway to augment each feature map with multi-scale features, where a linearized approximate self-attention function is designed for reducing model complexity. By means of the self-attention mechanism in Transformer, there is no longer need to align feature maps during feature fusion, thus solving the misaligned defect. By setting the query scope to the entire feature map, the local defect can also be solved. Extensive experiments on COCO and PASCAL VOC datasets demonstrated that our CA-FPN outperforms other FPN-based detectors without bells and whistles and is robust in different settings.
updated: Wed Apr 13 2022 13:10:46 GMT+0000 (UTC)
published: Thu May 20 2021 02:31:31 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト