arXiv reaDer
UP-DETR:トランスフォーマーを使用したオブジェクト検出のための教師なし事前トレーニング
UP-DETR: Unsupervised Pre-training for Object Detection with Transformers
トランスを使用したオブジェクト検出(DETR)は、トランスエンコーダ-デコーダアーキテクチャを介して、FasterR-CNNで競争力のあるパフォーマンスを実現します。自然言語処理におけるトランスフォーマーの事前トレーニングの大成功に触発されて、オブジェクト検出のためにDETR(UP-DETR)を監視なしで事前トレーニングするために、ランダムクエリパッチ検出という名前のプレテキストタスクを提案します。具体的には、指定された画像からパッチをランダムに切り取り、クエリとしてデコーダーにフィードします。モデルは、元の画像からこれらのクエリパッチを検出するように事前にトレーニングされています。事前トレーニングでは、マルチタスク学習とマルチクエリローカリゼーションという2つの重要な問題に対処します。 (1)口実タスクにおける分類とローカリゼーションのマルチタスク学習をトレードオフするために、CNNバックボーンをフリーズし、パッチ検出と共同で最適化されたパッチ機能再構築ブランチを提案します。 (2)マルチクエリローカリゼーションを実行するために、シングルクエリパッチからUP-DETRを導入し、オブジェクトクエリシャッフルとアテンションマスクを使用してマルチクエリパッチに拡張します。私たちの実験では、UP-DETRは、PASCAL VOCおよびCOCOデータセットでの収束を高速化し、精度を高めて、DETRのパフォーマンスを大幅に向上させます。コードはまもなく利用可能になります。
Object detection with transformers (DETR) reaches competitive performance with Faster R-CNN via a transformer encoder-decoder architecture. Inspired by the great success of pre-training transformers in natural language processing, we propose a pretext task named random query patch detection to unsupervisedly pre-train DETR (UP-DETR) for object detection. Specifically, we randomly crop patches from the given image and then feed them as queries to the decoder. The model is pre-trained to detect these query patches from the original image. During the pre-training, we address two critical issues: multi-task learning and multi-query localization. (1) To trade-off multi-task learning of classification and localization in the pretext task, we freeze the CNN backbone and propose a patch feature reconstruction branch which is jointly optimized with patch detection. (2) To perform multi-query localization, we introduce UP-DETR from single-query patch and extend it to multi-query patches with object query shuffle and attention mask. In our experiments, UP-DETR significantly boosts the performance of DETR with faster convergence and higher precision on PASCAL VOC and COCO datasets. The code will be available soon.
updated: Wed Nov 18 2020 05:16:11 GMT+0000 (UTC)
published: Wed Nov 18 2020 05:16:11 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト