arXiv reaDer
複数の色空間で形状とテクスチャの特徴を組み合わせることによる、オープンエンドのきめの細かい3Dオブジェクトの分類
Open-Ended Fine-Grained 3D Object Categorization by Combining Shape and Texture Features in Multiple Colorspaces
サービスロボットの数が増え続けている結果、高精度のリアルタイム3Dオブジェクト認識に対する需要が高まっています。より複雑で動的な環境でのロボットアプリケーションの拡張を考慮すると、すべてのオブジェクトカテゴリを事前にプログラムし、すべての例外を事前に予測することは不可能であることは明らかです。したがって、ロボットは、環境での作業中に新しいオブジェクトカテゴリについて自由形式で学習する機能を備えている必要があります。この目標に向けて、形状を考慮してスケールおよびポーズに依存しないオブジェクト表現を生成するディープトランスファー学習アプローチを提案します。複数の色空間のテクスチャ情報。得られたグローバルオブジェクト表現は、インスタンスベースのオブジェクトカテゴリの学習と認識に送られます。ここでは、専門家ではない人間のユーザーが学習ループに存在し、新しいオブジェクトカテゴリを教えるか、不十分なものを修正することで、経験獲得のプロセスをインタラクティブにガイドできます。または誤ったカテゴリ。この作業では、形状情報がすべてのカテゴリの共通パターンをエンコードし、テクスチャ情報を使用して各インスタンスの外観を詳細に記述します。複数の色空間の組み合わせとネットワークアーキテクチャを評価して、最もわかりやすいシステムを見つけます。実験結果は、提案されたネットワークアーキテクチャが、オブジェクト分類の精度とスケーラビリティの点で、選択された最先端のアプローチを上回っていることを示しました。さらに、提案されたアプローチのリアルタイムのパフォーマンスを示すために、ビールを提供するシナリオのコンテキストで実際のロボット実験を実行しました。
As a consequence of an ever-increasing number of service robots, there is a growing demand for highly accurate real-time 3D object recognition. Considering the expansion of robot applications in more complex and dynamic environments,it is evident that it is not possible to pre-program all object categories and anticipate all exceptions in advance. Therefore, robots should have the functionality to learn about new object categories in an open-ended fashion while working in the environment.Towards this goal, we propose a deep transfer learning approach to generate a scale- and pose-invariant object representation by considering shape and texture information in multiple colorspaces. The obtained global object representation is then fed to an instance-based object category learning and recognition,where a non-expert human user exists in the learning loop and can interactively guide the process of experience acquisition by teaching new object categories, or by correcting insufficient or erroneous categories. In this work, shape information encodes the common patterns of all categories, while texture information is used to describes the appearance of each instance in detail.Multiple color space combinations and network architectures are evaluated to find the most descriptive system. Experimental results showed that the proposed network architecture out-performed the selected state-of-the-art approaches in terms of object classification accuracy and scalability. Furthermore, we performed a real robot experiment in the context of serve-a-beer scenario to show the real-time performance of the proposed approach.
updated: Fri May 28 2021 19:54:03 GMT+0000 (UTC)
published: Sat Sep 19 2020 14:06:18 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト