arXiv reaDer
統合移行の事前トレーニング済みトランスフォーマーエンコーダー-視覚オブジェクト検出用デコーダー
Integral Migrating Pre-trained Transformer Encoder-decoders for Visual Object Detection
最新のオブジェクト検出器は、バックボーンネットワークとして使用することにより、事前にトレーニングされたビジョントランスフォーマーの利点を活用しています。ただし、バックボーンネットワークを除いて、検出器ヘッドや機能ピラミッドネットワークなどの他の検出器コンポーネントはランダムに初期化されたままであるため、検出器と事前トレーニング済みモデル間の一貫性が妨げられます。この研究では、オブジェクト検出のために事前トレーニングされたトランスエンコーダーデコーダー(imTED)を統合的に移行し、「完全に事前トレーニングされた」だけでなく、事前トレーニングされたモデルと一致する特徴抽出操作パスを構築することを提案します。既存のトランスベースの検出器に対するimTEDの本質的な改善点は、次の2つです。(1)事前にトレーニングされたトランスデコーダを検出器ヘッドに組み込みます。 (2)特徴抽出パスから特徴ピラミッドネットワークを削除します。このような改善により、ランダムに初期化されたパラメータの割合が大幅に減少し、検出器の生成機能が強化されます。 MS COCOデータセットでの実験は、imTEDが一貫して対応するものよりも約2.8%AP優れていることを示しています。ベルやホイッスルがない場合、imTEDは最先端の数ショットのオブジェクト検出を最大7.6%AP改善し、大幅に高い一般化機能を示します。コードは公開されます。
Modern object detectors have taken the advantages of pre-trained vision transformers by using them as backbone networks. However, except for the backbone networks, other detector components, such as the detector head and the feature pyramid network, remain randomly initialized, which hinders the consistency between detectors and pre-trained models. In this study, we propose to integrally migrate the pre-trained transformer encoder-decoders (imTED) for object detection, constructing a feature extraction-operation path that is not only "fully pre-trained" but also consistent with pre-trained models. The essential improvements of imTED over existing transformer-based detectors are twofold: (1) it embeds the pre-trained transformer decoder to the detector head; and (2) it removes the feature pyramid network from the feature extraction path. Such improvements significantly reduce the proportion of randomly initialized parameters and enhance the generation capability of detectors. Experiments on MS COCO dataset demonstrate that imTED consistently outperforms its counterparts by ~2.8% AP. Without bells and whistles, imTED improves the state-of-the-art of few-shot object detection by up to 7.6% AP, demonstrating significantly higher generalization capability. Code will be made publicly available.
updated: Thu May 19 2022 15:11:20 GMT+0000 (UTC)
published: Thu May 19 2022 15:11:20 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト