2D 前方監視ソナーは、水中ロボットの認識にとって重要なセンサーです。この分野でよく知られている問題は、ソナー イメージング中に仰角方向で欠落している情報を推定することです。フライスルーミッション中の 3D マッピングやロボットナビゲーションのために、画像ごとに 3D 情報を推定することが求められています。最近の学習ベースの手法は長所を示していますが、まだ欠点もあります。教師あり学習方法では高品質の結果が得られていますが、3D グラウンドトゥルース ラベルを取得するにはさらなる努力が必要になる場合があります。既存の自己教師あり手法では、3D 教師による合成画像を使用した事前トレーニングが必要です。本研究では、合成画像を用いた事前学習なしで安定した仰角推定の自己教師あり学習を実現することを目的としています。自己教師あり学習中の失敗は、動作の縮退の問題によって引き起こされる可能性があります。まず、主監視信号に関連する 2D 前方監視ソナーの運動フィールドを分析します。私たちは最新の学習フレームワークを利用し、トレーニング データセットが効果的なモーションで構築されている場合、合成データの知識がなくてもネットワークを自己教師ありの方法でトレーニングできることを証明します。シミュレーションと実際の実験の両方で、提案された方法が検証されます。
2D forward-looking sonar is a crucial sensor for underwater robotic perception. A well-known problem in this field is estimating missing information in the elevation direction during sonar imaging. There are demands to estimate 3D information per image for 3D mapping and robot navigation during fly-through missions. Recent learning-based methods have demonstrated their strengths, but there are still drawbacks. Supervised learning methods have achieved high-quality results but may require further efforts to acquire 3D ground-truth labels. The existing self-supervised method requires pretraining using synthetic images with 3D supervision. This study aims to realize stable self-supervised learning of elevation angle estimation without pretraining using synthetic images. Failures during self-supervised learning may be caused by motion degeneracy problems. We first analyze the motion field of 2D forward-looking sonar, which is related to the main supervision signal. We utilize a modern learning framework and prove that if the training dataset is built with effective motions, the network can be trained in a self-supervised manner without the knowledge of synthetic data. Both simulation and real experiments validate the proposed method.