手作りのローカルフィーチャセットを考えると、集計を介してグローバル表現を取得することは、計算効率を高め、タスクパフォーマンスを向上させる有望な手法です。 Bag of WordsやFisher Vectorなどの既存の機能集約(FA)アプローチは、通常、パイプラインモードのために必要な情報をキャプチャできません。このペーパーでは、ローカル記述子を集約するための体系的なソリューション(ProLFAという名前)を提供するための一般的な定式化を提案します。緩和された排他的制約の下で、多数の記述子から代表的なプロトタイプを選択することにより、コンパクトでありながら解釈可能な表現を生成できます。一方、集約された表現の識別可能性を強化するために、タスク固有の方向に沿ってバンドルされた記述子のドメイン不変の投影を合理的に実施します。さらに、ProLFAには強力な一般化機能も提供されており、ローカル機能集約の半監視および完全監視シナリオに柔軟に対応できます。さまざまな記述子とタスクの実験結果は、提案されたProLFAが、機能集約に関する現在利用可能な代替案よりもかなり優れていることを示しています。
Given a set of hand-crafted local features, acquiring a global representation via aggregation is a promising technique to boost computational efficiency and improve task performance. Existing feature aggregation (FA) approaches, including Bag of Words and Fisher Vectors, usually fail to capture the desired information due to their pipeline mode. In this paper, we propose a generic formulation to provide a systematical solution (named ProLFA) to aggregate local descriptors. It is capable of producing compact yet interpretable representations by selecting representative prototypes from numerous descriptors, under relaxed exclusivity constraint. Meanwhile, to strengthen the discriminability of the aggregated representation, we rationally enforce the domain-invariant projection of bundled descriptors along a task-specific direction. Furthermore, ProLFA is also provided with a powerful generalization ability to deal flexibly with the semi-supervised and fully supervised scenarios in local feature aggregation. Experimental results on various descriptors and tasks demonstrate that the proposed ProLFA is considerably superior over currently available alternatives about feature aggregation.