arXiv reaDer
Transformers による物体検出: レビュー
Object Detection with Transformers: A Review
自然言語処理 (NLP) におけるトランスフォーマーの驚異的なパフォーマンスは、研究者にコンピューター ビジョン タスクへの応用を探求する動機を与えています。 DEtection TRansformer (DETR) は、検出をセットの予測問題として再構成することにより、オブジェクト検出タスクにトランスフォーマーを導入します。その結果、提案の生成と後処理ステップが不要になります。当初、DETR は競争力のあるパフォーマンスにもかかわらず、トレーニングの収束が遅く、小さなオブジェクトの検出が効果的ではないという問題に悩まされていました。ただし、これらの問題に対処するために数多くの改善が提案されており、DETR が大幅に改善され、最先端のパフォーマンスを発揮できるようになります。私たちの知る限り、これはオリジナルの DETR モデルで最近提案された 21 の進歩を包括的にレビューした最初の論文です。 DETR の基本モジュールと、バックボーン構造の変更、クエリ設計戦略、アテンション メカニズムの改良などの最近の機能強化の両方について詳しく説明します。さらに、さまざまな検出トランスの比較分析を実施し、そのパフォーマンスとネットワーク アーキテクチャを評価します。この研究が、既存の課題に対処し、物体検出領域での変圧器の応用を探求することに対する研究者の関心をさらに高めることを願っています。検出トランスの進行中の開発に興味のある読者は、当社の Web サイト (https://github.com/mindgarage-shan/trans_object_detection_survey) を参照してください。
The astounding performance of transformers in natural language processing (NLP) has motivated researchers to explore their applications in computer vision tasks. DEtection TRansformer (DETR) introduces transformers to object detection tasks by reframing detection as a set prediction problem. Consequently, eliminating the need for proposal generation and post-processing steps. Initially, despite competitive performance, DETR suffered from slow training convergence and ineffective detection of smaller objects. However, numerous improvements are proposed to address these issues, leading to substantial improvements in DETR and enabling it to exhibit state-of-the-art performance. To our knowledge, this is the first paper to provide a comprehensive review of 21 recently proposed advancements in the original DETR model. We dive into both the foundational modules of DETR and its recent enhancements, such as modifications to the backbone structure, query design strategies, and refinements to attention mechanisms. Moreover, we conduct a comparative analysis across various detection transformers, evaluating their performance and network architectures. We hope that this study will ignite further interest among researchers in addressing the existing challenges and exploring the application of transformers in the object detection domain. Readers interested in the ongoing developments in detection transformers can refer to our website at: https://github.com/mindgarage-shan/trans_object_detection_survey
updated: Mon Jul 10 2023 16:41:15 GMT+0000 (UTC)
published: Wed Jun 07 2023 16:13:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト