arXiv reaDer
UP-DETR:トランスフォーマーを使用したオブジェクト検出のための教師なし事前トレーニング
UP-DETR: Unsupervised Pre-training for Object Detection with Transformers
トランスフォーマーを使用したオブジェクト検出(DETR)は、トランスフォーマーエンコーダーデコーダーアーキテクチャを介して、FasterR-CNNで競争力のあるパフォーマンスを実現します。自然言語処理におけるトランスフォーマーの事前トレーニングの大成功に触発されて、ランダムクエリパッチ検出という名前のプレテキストタスクを、オブジェクト検出のための監視なしの事前トレーニングDETR(UP-DETR)に提案します。具体的には、指定された画像からパッチをランダムに切り取り、クエリとしてデコーダーにフィードします。モデルは、元の画像からこれらのクエリパッチを検出するように事前にトレーニングされています。事前トレーニングでは、マルチタスク学習とマルチクエリローカリゼーションという2つの重要な問題に対処します。 (1)口実タスクでの分類とローカリゼーションの設定をトレードオフするために、CNNバックボーンをフリーズし、パッチ検出と共同で最適化されたパッチ機能再構築ブランチを提案します。 (2)マルチクエリローカリゼーションを実行するために、シングルクエリパッチからUP-DETRを導入し、オブジェクトクエリシャッフルとアテンションマスクを使用してマルチクエリパッチに拡張します。私たちの実験では、UP-DETRは、オブジェクト検出、ワンショット検出、およびパノラマセグメンテーションの収束を高速化し、平均精度を高めることで、DETRのパフォーマンスを大幅に向上させます。コードと事前トレーニングモデル:https://github.com/dddzg/up-detr。
Object detection with transformers (DETR) reaches competitive performance with Faster R-CNN via a transformer encoder-decoder architecture. Inspired by the great success of pre-training transformers in natural language processing, we propose a pretext task named random query patch detection to Unsupervisedly Pre-train DETR (UP-DETR) for object detection. Specifically, we randomly crop patches from the given image and then feed them as queries to the decoder. The model is pre-trained to detect these query patches from the original image. During the pre-training, we address two critical issues: multi-task learning and multi-query localization. (1) To trade off classification and localization preferences in the pretext task, we freeze the CNN backbone and propose a patch feature reconstruction branch which is jointly optimized with patch detection. (2) To perform multi-query localization, we introduce UP-DETR from single-query patch and extend it to multi-query patches with object query shuffle and attention mask. In our experiments, UP-DETR significantly boosts the performance of DETR with faster convergence and higher average precision on object detection, one-shot detection and panoptic segmentation. Code and pre-training models: https://github.com/dddzg/up-detr.
updated: Wed Apr 07 2021 15:15:49 GMT+0000 (UTC)
published: Wed Nov 18 2020 05:16:11 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト