ディープラーニングは、インテリジェントな車両運転の認識 (3D オブジェクト検出など) で広く使用されています。有益な車両間 (V2V) 通信により、他のエージェントからの深層学習ベースの機能を自車両に共有して、自車両の認識を向上させることができます。近年アルゴリズムが飛躍的に進歩したV2V研究では協調的知覚と名付けられています。ただし、既存のすべての協調的認識アルゴリズムは、現実世界の複雑な運転シナリオで一般的な損失通信 (LC) が原因で、損失の多い共有機能の可能性を考慮せずに理想的な V2V 通信を前提としています。本論文では、最初に V2V Cooperative Perception における非可逆通信による副作用 (検出性能の低下など) を検討し、次に、非可逆通信の副作用を緩和するための新しい中間 LC を考慮した特徴融合手法を提案します。 LC-aware Repair Network (LCRN) をサポートし、特別に設計された V2V Attention Module (V2VAM) によって自車両と他の車両との相互作用を強化します。これには、自車両の車両内注意および不確実性を認識した車両間注意が含まれます。公開協調知覚データセット OPV2V (デジタル ツイン CARLA シミュレータに基づく) に関する大規模な実験は、提案された方法が、損失のある V2V 通信下での協調点群ベースの 3D オブジェクト検出に非常に効果的であることを示しています。
Deep learning has been widely used in the perception (e.g., 3D object detection) of intelligent vehicle driving. Due to the beneficial Vehicle-to-Vehicle (V2V) communication, the deep learning based features from other agents can be shared to the ego vehicle so as to improve the perception of the ego vehicle. It is named as Cooperative Perception in the V2V research, whose algorithms have been dramatically advanced recently. However, all the existing cooperative perception algorithms assume the ideal V2V communication without considering the possible lossy shared features because of the Lossy Communication (LC) which is common in the complex real-world driving scenarios. In this paper, we first study the side effect (e.g., detection performance drop) by the lossy communication in the V2V Cooperative Perception, and then we propose a novel intermediate LC-aware feature fusion method to relieve the side effect of lossy communication by a LC-aware Repair Network (LCRN) and enhance the interaction between the ego vehicle and other vehicles by a specially designed V2V Attention Module (V2VAM) including intra-vehicle attention of ego vehicle and uncertainty-aware inter-vehicle attention. The extensive experiment on the public cooperative perception dataset OPV2V (based on digital-twin CARLA simulator) demonstrates that the proposed method is quite effective for the cooperative point cloud based 3D object detection under lossy V2V communication.