arXiv reaDer
少数ショットオブジェクト検出のための動的関連性学習
Dynamic Relevance Learning for Few-Shot Object Detection
高価なバウンディングボックス注釈により、オブジェクト検出タスクの開発が制限されています。したがって、数ショットのオブジェクト検出というより困難なタスクに焦点を当てる必要があります。検出器は、わずかなトレーニングサンプルで新しいクラスのオブジェクトを認識する必要があります。今日、メタ学習に基づく多くの既存の一般的な方法は、メタR-CNNシリーズなどの有望なパフォーマンスを達成しています。ただし、毎回クエリ画像の検出をガイドするための注意として、サポートデータの単一のカテゴリのみが使用されます。それらの相互の関連性は未開発のままです。また、最近の作品の多くは、サポートデータとクエリ画像を、それらの関係を考慮せずに独立したブランチとして扱っています。この問題に対処するために、すべてのサポート画像とクエリ画像の関心領域(RoI)の関係を利用して、動的グラフ畳み込みネットワーク(GCN)を構築する動的関連性学習モデルを提案します。このGCNの出力を使用してベース検出器の予測分布を調整することにより、提案されたモデルは、クラス表現を暗黙的に改善するように検出器をガイドできます。 PascalVOCおよびMS-COCOデータセットに対して包括的な実験が実施されました。提案されたモデルは、全体として最高のパフォーマンスを実現します。これは、より一般化された機能を学習することの有効性を示しています。私たちのコードはhttps://github.com/liuweijie19980216/DRL-for-FSODで入手できます。
Expensive bounding-box annotations have limited the development of object detection task. Thus, it is necessary to focus on more challenging task of few-shot object detection. It requires the detector to recognize objects of novel classes with only a few training samples. Nowadays, many existing popular methods based on meta-learning have achieved promising performance, such as Meta R-CNN series. However, only a single category of support data is used as the attention to guide the detecting of query images each time. Their relevance to each other remains unexploited. Moreover, a lot of recent works treat the support data and query images as independent branch without considering the relationship between them. To address this issue, we propose a dynamic relevance learning model, which utilizes the relationship between all support images and Region of Interest (RoI) on the query images to construct a dynamic graph convolutional network (GCN). By adjusting the prediction distribution of the base detector using the output of this GCN, the proposed model can guide the detector to improve the class representation implicitly. Comprehensive experiments have been conducted on Pascal VOC and MS-COCO dataset. The proposed model achieves the best overall performance, which shows its effectiveness of learning more generalized features. Our code is available at https://github.com/liuweijie19980216/DRL-for-FSOD.
updated: Wed Aug 04 2021 18:29:42 GMT+0000 (UTC)
published: Wed Aug 04 2021 18:29:42 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト