arXiv reaDer
インフィニティ型の魚のローカリゼーション:野生でのスケッチガイドによるオブジェクトのローカリゼーション
Localizing Infinity-shaped fishes: Sketch-guided object localization in the wild
この作業では、スケッチガイドオブジェクトローカリゼーション(SGOL)の問題を調査します。この問題では、人間のスケッチをクエリとして使用して、自然画像でオブジェクトのローカリゼーションを実行します。このクロスモーダル設定では、最初に、特定のSGOLトレーニングなしで、固定されたクラスのセットで以前の作業を上回ることができる、打ち負かすのが難しいベースラインで貢献します。ベースラインは、利用可能なシンプルで強力な方法に基づいてSGOLアプローチのパフォーマンスを分析するのに役立ちます。難しい分類を回避し、スケッチと画像間のドメインギャップを緩和してオブジェクトインスタンスをローカライズするスケッチ条件付きDETR(DEtection TRansformer)アーキテクチャを提案することにより、先行技術を進歩させます。 SGOLの主な目標はオブジェクトの検出に焦点を当てていますが、スケッチに基づくインスタンスのセグメンテーションへの自然な拡張を検討しました。この新しいタスクにより、ピクセルレベルでオブジェクトを識別する方向に進むことができます。これは、いくつかのアプリケーションで非常に重要です。モデルとそのバリアントが以前の最先端の結果を大幅に上回っていることを実験的に示します。モデルのすべてのトレーニングコードとテストコードは、将来の調査を容易にするためにリリースされます{https://github.com/priba/sgol_wild}。
This work investigates the problem of sketch-guided object localization (SGOL), where human sketches are used as queries to conduct the object localization in natural images. In this cross-modal setting, we first contribute with a tough-to-beat baseline that without any specific SGOL training is able to outperform the previous works on a fixed set of classes. The baseline is useful to analyze the performance of SGOL approaches based on available simple yet powerful methods. We advance prior arts by proposing a sketch-conditioned DETR (DEtection TRansformer) architecture which avoids a hard classification and alleviates the domain gap between sketches and images to localize object instances. Although the main goal of SGOL is focused on object detection, we explored its natural extension to sketch-guided instance segmentation. This novel task allows to move towards identifying the objects at pixel level, which is of key importance in several applications. We experimentally demonstrate that our model and its variants significantly advance over previous state-of-the-art results. All training and testing code of our model will be released to facilitate future research{https://github.com/priba/sgol_wild}.
updated: Fri Sep 24 2021 10:39:43 GMT+0000 (UTC)
published: Fri Sep 24 2021 10:39:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト