arXiv reaDer
D2Q-DETR: トランスフォーマーを使用した向きのあるオブジェクト検出のためのデカップリングと動的クエリ
D2Q-DETR: Decoupling and Dynamic Queries for Oriented Object Detection with Transformers
有望な結果にもかかわらず、既存の指向オブジェクト検出方法は、通常、ヒューリスティックに設計されたルール (たとえば RRoI 生成、回転 NMS) を伴います。この論文では、指向性オブジェクト検出のためのエンドツーエンドのフレームワークを提案します。これにより、モデル パイプラインが簡素化され、優れたパフォーマンスが得られます。私たちのフレームワークは DETR に基づいており、ボックス回帰ヘッドがポイント予測ヘッドに置き換えられています。ポイントの学習はより柔軟で、ポイントの分布はターゲットの回転ボックスの角度とサイズを反映できます。さらに、クエリ機能を分類機能と回帰機能に分離することを提案します。これにより、モデルの精度が大幅に向上します。通常、航空写真には数千のインスタンスが含まれています。モデルの精度と効率のバランスをより良くするために、モデルのパフォーマンスを犠牲にすることなく、スタックされたデコーダーレイヤーのオブジェクトクエリの数を減らす、新しい動的クエリ設計を提案します。最後に、既存の DETR のような検出器のラベル割り当て戦略を再考し、パフォーマンスを向上させる効果的なラベル再割り当て戦略を提案します。メソッドに D2Q-DETR という名前を付けます。最大かつ挑戦的な DOTA-v1.0 および DOTA-v1.5 データセットでの実験は、D2Q-DETR が既存の NMS ベースおよび NMS フリーの指向オブジェクト検出方法よりも優れており、新しい最先端技術を達成することを示しています。
Despite the promising results, existing oriented object detection methods usually involve heuristically designed rules, e.g., RRoI generation, rotated NMS. In this paper, we propose an end-to-end framework for oriented object detection, which simplifies the model pipeline and obtains superior performance. Our framework is based on DETR, with the box regression head replaced with a points prediction head. The learning of points is more flexible, and the distribution of points can reflect the angle and size of the target rotated box. We further propose to decouple the query features into classification and regression features, which significantly improves the model precision. Aerial images usually contain thousands of instances. To better balance model precision and efficiency, we propose a novel dynamic query design, which reduces the number of object queries in stacked decoder layers without sacrificing model performance. Finally, we rethink the label assignment strategy of existing DETR-like detectors and propose an effective label re-assignment strategy for improved performance. We name our method D2Q-DETR. Experiments on the largest and challenging DOTA-v1.0 and DOTA-v1.5 datasets show that D2Q-DETR outperforms existing NMS-based and NMS-free oriented object detection methods and achieves the new state-of-the-art.
updated: Wed Mar 01 2023 14:36:19 GMT+0000 (UTC)
published: Wed Mar 01 2023 14:36:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト