arXiv reaDer
AcousticFusion:動的環境での音源定位とビジュアルSLAMの融合
AcousticFusion: Fusing Sound Source Localization to Visual SLAM in Dynamic Environments
人や他のエージェントなどの環境内の動的オブジェクトは、既存の同時ローカリゼーションおよびマッピング(SLAM)アプローチの課題につながります。動的環境に対処するために、コンピュータービジョンの研究者は通常、学習ベースのオブジェクト検出器を適用して、これらの動的オブジェクトを削除します。ただし、これらのオブジェクト検出器は、移動ロボットのオンボード処理には計算コストがかかりすぎます。実際のアプリケーションでは、これらのオブジェクトは、オンボードの音源定位によって効果的に検出できるノイズの多い音を出力します。音源オブジェクトの方向情報は、到来方向(DoA)推定により効率的に取得できますが、深度推定は困難です。したがって、本論文では、音源方向をRGB-D画像に融合し、マルチロボットSLAMシステムに対する動的障害物の影響を除去する新しい視聴覚融合アプローチを提案します。異なる動的環境でのマルチロボットSLAMの実験結果は、提案された方法が非常に小さな計算リソースを使用して非常に安定した自己位置特定結果を取得することを示しています。
Dynamic objects in the environment, such as people and other agents, lead to challenges for existing simultaneous localization and mapping (SLAM) approaches. To deal with dynamic environments, computer vision researchers usually apply some learning-based object detectors to remove these dynamic objects. However, these object detectors are computationally too expensive for mobile robot on-board processing. In practical applications, these objects output noisy sounds that can be effectively detected by on-board sound source localization. The directional information of the sound source object can be efficiently obtained by direction of sound arrival (DoA) estimation, but depth estimation is difficult. Therefore, in this paper, we propose a novel audio-visual fusion approach that fuses sound source direction into the RGB-D image and thus removes the effect of dynamic obstacles on the multi-robot SLAM system. Experimental results of multi-robot SLAM in different dynamic environments show that the proposed method uses very small computational resources to obtain very stable self-localization results.
updated: Tue Aug 03 2021 02:10:26 GMT+0000 (UTC)
published: Tue Aug 03 2021 02:10:26 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト