arXiv reaDer
方向統計による少数ショットの弱く監視されたオブジェクトの検出
Few-shot Weakly-Supervised Object Detection via Directional Statistics
いくつかの例から新しいオブジェクトを検出することは、最近コンピュータビジョンの新しいトピックになっています。ただし、これらの方法では、フィールドロボティクスなどの実際のシナリオでの適用性を制限する新しいオブジェクトカテゴリを学習するために、完全に注釈が付けられたトレーニング画像が必要です。この作業では、数ショットの共通オブジェクトローカリゼーション(COL)と数ショットの弱教師ありオブジェクト検出(WSOD)の確率的複数インスタンス学習アプローチを提案します。これらのタスクでは、取得するのにはるかに安価な画像レベルのラベルのみが使用可能です。事前にトレーニングされたFaster-RCNNの最後の層から抽出された特徴を操作することは、以前のエピソード学習ベースの数ショットCOLメソッドと比較してより効果的であることがわかります。私たちのモデルは、新しいオブジェクトの分布を同時に学習し、期待値最大化ステップを介してそれらをローカライズします。確率モデルとして、事前にトレーニングされた埋め込み空間に適用された場合に、ガウス分布よりもセマンティック情報をより適切にキャプチャするvon Mises-Fisher(vMF)分布を採用します。新規オブジェクトがローカライズされると、それらを利用して線形外観モデルを学習し、新しい画像内の新規クラスを検出します。私たちの広範な実験は、提案された方法が単純であるにもかかわらず、数ショットのCOLとWSOD、および大規模なWSODタスクで強力なベースラインを上回っていることを示しています。
Detecting novel objects from few examples has become an emerging topic in computer vision recently. However, these methods need fully annotated training images to learn new object categories which limits their applicability in real world scenarios such as field robotics. In this work, we propose a probabilistic multiple instance learning approach for few-shot Common Object Localization (COL) and few-shot Weakly Supervised Object Detection (WSOD). In these tasks, only image-level labels, which are much cheaper to acquire, are available. We find that operating on features extracted from the last layer of a pre-trained Faster-RCNN is more effective compared to previous episodic learning based few-shot COL methods. Our model simultaneously learns the distribution of the novel objects and localizes them via expectation-maximization steps. As a probabilistic model, we employ von Mises-Fisher (vMF) distribution which captures the semantic information better than Gaussian distribution when applied to the pre-trained embedding space. When the novel objects are localized, we utilize them to learn a linear appearance model to detect novel classes in new images. Our extensive experiments show that the proposed method, despite being simple, outperforms strong baselines in few-shot COL and WSOD, as well as large-scale WSOD tasks.
updated: Thu Mar 25 2021 22:34:16 GMT+0000 (UTC)
published: Thu Mar 25 2021 22:34:16 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト