きめの細かい認識タスクは、サブカテゴリ分類問題を処理します。これは、実際のアプリケーションにとって重要です。この作業では、特に「個別のセグメンテーション」と呼ばれる、最もきめの細かいレベルでのセグメンテーションタスクに関心があります。つまり、個人レベルのカテゴリにはサブカテゴリがありません。個々のレベルのセグメンテーションの問題は、いくつかの新しいプロパティ、単一の個々のオブジェクトの制限されたトレーニングデータ、未知の背景、深度の使用の難しさを明らかにします。これらの新しい問題に対処するため、バックグラウンドコンテキストの少ないRGB-Dオブジェクト優先画像を生成し、3D情報を使用したスケール対応のトレーニングとテストを可能にする「Context Less-Aware」(CoLA)パイプラインを提案します。広範な実験により、提案されたCoLA戦略は、YCB-Videoデータセットおよび提案されたSupermarket-10Kデータセットのベースラインメソッドを大幅に上回ることが示されています。コード、トレーニング済みモデル、および新しいデータセットは、このペーパーで公開されます。
Fine-grained recognition task deals with sub-category classification problem, which is important for real-world applications. In this work, we are particularly interested in the segmentation task on the finest-grained level, which is specifically named "individual segmentation". In other words, the individual-level category has no sub-category under it. Segmentation problem in the individual level reveals some new properties, limited training data for single individual object, unknown background, and difficulty for the use of depth. To address these new problems, we propose a "Context Less-Aware" (CoLA) pipeline, which produces RGB-D object-predominated images that have less background context, and enables a scale-aware training and testing with 3D information. Extensive experiments show that the proposed CoLA strategy largely outperforms baseline methods on YCB-Video dataset and our proposed Supermarket-10K dataset. Code, trained model and new dataset will be published with this paper.