arXiv reaDer
RecursiveDet: エンドツーエンドの領域ベースの再帰的オブジェクト検出
RecursiveDet: End-to-End Region-based Recursive Object Detection
Sparse R-CNN のようなエンドツーエンドの領域ベースのオブジェクト検出器には、通常、複数のカスケード境界ボックス デコード ステージがあり、以前の結果に従って現在の予測を改良します。各ステージ内のモデル パラメーターは独立しているため、膨大なコストが発生します。この論文では、デコードステージの一般的な設定が実際には冗長であることがわかりました。パラメータを共有して再帰的デコーダを作成するだけで、検出器はすでに大幅な改善を実現しています。再帰デコーダは、提案ボックスの位置エンコード (PE) によってさらに強化できます。これにより、入力境界ボックスの正確な位置とサイズが認識され、再帰中のさまざまな段階からの提案に適応できるようになります。さらに、境界ボックス内のさまざまな位置にある RoI 特徴要素と動的畳み込みカーネルを区別する中心度ベースの PE も設計します。提案された方法の有効性を検証するために、集中的なアブレーションを実施し、最近主流の 3 つの領域ベースの検出器に基づいて完全なモデルを構築します。 RecusiveDet は、モデル パラメーターをさらに減らし、計算コストをわずかに増加させても、明らかなパフォーマンスの向上を達成できます。コードは https://github.com/bravezzzzzz/RecursiveDet で入手できます。
End-to-end region-based object detectors like Sparse R-CNN usually have multiple cascade bounding box decoding stages, which refine the current predictions according to their previous results. Model parameters within each stage are independent, evolving a huge cost. In this paper, we find the general setting of decoding stages is actually redundant. By simply sharing parameters and making a recursive decoder, the detector already obtains a significant improvement. The recursive decoder can be further enhanced by positional encoding (PE) of the proposal box, which makes it aware of the exact locations and sizes of input bounding boxes, thus becoming adaptive to proposals from different stages during the recursion. Moreover, we also design centerness-based PE to distinguish the RoI feature element and dynamic convolution kernels at different positions within the bounding box. To validate the effectiveness of the proposed method, we conduct intensive ablations and build the full model on three recent mainstream region-based detectors. The RecusiveDet is able to achieve obvious performance boosts with even fewer model parameters and slightly increased computation cost. Codes are available at https://github.com/bravezzzzzz/RecursiveDet.
updated: Tue Jul 25 2023 16:22:58 GMT+0000 (UTC)
published: Tue Jul 25 2023 16:22:58 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト