arXiv reaDer
説明可能なシーン理解のための動的データ駆動型アプローチ
A Dynamic Data Driven Approach for Explainable Scene Understanding
シーンの理解は、コンピュータービジョンの分野で重要なトピックであり、リモートセンシング、監視、スマート農業、ロボット工学、自動運転、スマートシティなどの幅広いドメインへのアプリケーションでの計算上の課題を示しています。シーンの積極的な説明主導の理解と分類を検討します。 1つまたは複数のセンサーを利用するエージェントが未知の環境に配置され、その感覚入力に基づいて、エージェントが知覚されたシーンに何らかのラベルを割り当てる必要があるとします。エージェントはセンサーを調整してシーンに関する追加の詳細をキャプチャできますが、センサーの操作にはコストがかかるため、エージェントがシーンを迅速かつ効率的に理解することが重要です。また、エージェントがシーンのグローバルな状態(たとえば、シーンのカテゴリやシーンで発生する主要なイベント)だけでなく、シーンの特性/プロパティを理解して、シーンのグローバルな状態。最後に、エージェントが未知のシーンカテゴリに遭遇した場合、エージェントはシーンへのラベルの割り当てを拒否し、人間に支援を要求し、人間から提供されたフィードバックに基づいて基礎となる知識ベースと機械学習モデルを更新できる必要があります。シーンのアクティブな説明駆動型分類のための動的データ駆動型フレームワークを紹介します。私たちのフレームワークは、ACUMEN:説明主導型ネットワークによるアクティブな分類と理解の方法と題されています。提案されたACUMENアプローチの有用性を実証し、それをドメイン固有のアプリケーションに適応させる方法を示すために、ビジョンベースのセンサーを備えたアクティブなロボットエージェントを使用した屋内シーンの分類を含むケーススタディの例に焦点を当てます。電気光学カメラ。
Scene-understanding is an important topic in the area of Computer Vision, and illustrates computational challenges with applications to a wide range of domains including remote sensing, surveillance, smart agriculture, robotics, autonomous driving, and smart cities. We consider the active explanation-driven understanding and classification of scenes. Suppose that an agent utilizing one or more sensors is placed in an unknown environment, and based on its sensory input, the agent needs to assign some label to the perceived scene. The agent can adjust its sensor(s) to capture additional details about the scene, but there is a cost associated with sensor manipulation, and as such, it is important for the agent to understand the scene in a fast and efficient manner. It is also important that the agent understand not only the global state of a scene (e.g., the category of the scene or the major events taking place in the scene) but also the characteristics/properties of the scene that support decisions and predictions made about the global state of the scene. Finally, when the agent encounters an unknown scene category, it must be capable of refusing to assign a label to the scene, requesting aid from a human, and updating its underlying knowledge base and machine learning models based on feedback provided by the human. We introduce a dynamic data driven framework for the active explanation-driven classification of scenes. Our framework is entitled ACUMEN: Active Classification and Understanding Method by Explanation-driven Networks. To demonstrate the utility of the proposed ACUMEN approach and show how it can be adapted to a domain-specific application, we focus on an example case study involving the classification of indoor scenes using an active robotic agent with vision-based sensors, i.e., an electro-optical camera.
updated: Sat Jun 18 2022 02:41:51 GMT+0000 (UTC)
published: Sat Jun 18 2022 02:41:51 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト