arXiv reaDer
Max-Margin を超えて: 少数ショット オブジェクト検出のためのクラス マージンの平衡
Beyond Max-Margin: Class Margin Equilibrium for Few-shot Object Detection
少数ショット オブジェクトの検出は、基本クラス オブジェクトのセットで学習した特徴表現を使用して新しいクラス オブジェクトを表すことにより、大幅な進歩を遂げました。ただし、新しいクラス分類と表現の間の暗黙の矛盾は残念ながら無視されます。一方で、正確な新規クラス分類を達成するには、いずれかの 2 つの基本クラスの分布が互いに遠く離れている必要があります (最大マージン)。一方、新しいクラスを正確に表現するには、基本クラスの分布を互いに近づけて、新しいクラスのクラス内距離 (最小マージン) を減らす必要があります。この論文では、特徴空間の分割と新しいクラスの再構成の両方を体系的に最適化することを目的として、クラスマージン平衡 (CME) アプローチを提案します。 CME は、完全に接続された層を使用してローカリゼーション機能を分離することにより、最初に少数ショット検出問題を少数ショット分類問題に変換します。次に、CME は、特徴学習中に単純だが効果的なクラス マージン損失を導入することにより、新しいクラスに十分なマージン スペースを確保します。最後に、CME は、敵対的な最小値と最大値の方法で新しいクラス インスタンスの機能を妨害することにより、マージンの均衡を追求します。 Pascal VOC および MS-COCO データセットの実験では、CME が 2 つのベースライン検出器 (平均で最大 3 ~ 5%) を大幅に改善し、最先端のパフォーマンスを達成することが示されています。コードは https://github.com/Bohao-Lee/CME で入手できます。
Few-shot object detection has made substantial progressby representing novel class objects using the feature representation learned upon a set of base class objects. However,an implicit contradiction between novel class classification and representation is unfortunately ignored. On the one hand, to achieve accurate novel class classification, the distributions of either two base classes must be far away fromeach other (max-margin). On the other hand, to precisely represent novel classes, the distributions of base classes should be close to each other to reduce the intra-class distance of novel classes (min-margin). In this paper, we propose a class margin equilibrium (CME) approach, with the aim to optimize both feature space partition and novel class reconstruction in a systematic way. CME first converts the few-shot detection problem to the few-shot classification problem by using a fully connected layer to decouple localization features. CME then reserves adequate margin space for novel classes by introducing simple-yet-effective class margin loss during feature learning. Finally, CME pursues margin equilibrium by disturbing the features of novel class instances in an adversarial min-max fashion. Experiments on Pascal VOC and MS-COCO datasets show that CME significantly improves upon two baseline detectors (up to 3∼5% in average), achieving state-of-the-art performance. Code is available at https://github.com/Bohao-Lee/CME .
updated: Mon May 31 2021 04:55:57 GMT+0000 (UTC)
published: Mon Mar 08 2021 09:04:03 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト