協調的認識により、Connected Autonomous Vehicle (CAV) は近くにある他の CAV と対話して周囲のオブジェクトの認識を強化し、安全性と信頼性を高めることができます。死角、低解像度、天候の影響など、従来の車両認識の限界を補うことができます。協調的知覚の中間的な融合方法のための効果的な特徴融合モデルは、特徴選択と情報集約を改善して、知覚精度をさらに高めることができます。トレーニング可能な機能選択モジュールを備えた適応機能融合モデルを提案します。提案されたモデルの 1 つである Spatial-wise Adaptive feature Fusion (S-AdaFusion) は、OPV2V データセットの 2 つのサブセット (車両検出用のデフォルト CARLA タウンとドメイン適応用の Culver City) で、他のすべての最先端モデルよりも優れています。さらに、以前の研究では、車両検出のための協調的知覚のみがテストされています。しかし、歩行者は交通事故で重傷を負う可能性がはるかに高くなります。 CODD データセットを使用して、車両と歩行者の両方の検出に対する協調的知覚のパフォーマンスを評価します。私たちのアーキテクチャは、CODD データセットでの車両と歩行者の両方の検出について、他の既存のモデルよりも高い平均精度 (AP) を達成します。実験は、協調的知覚が従来の知覚プロセスと比較して歩行者検出精度も向上させることを示しています。
Cooperative perception allows a Connected Autonomous Vehicle (CAV) to interact with the other CAVs in the vicinity to enhance perception of surrounding objects to increase safety and reliability. It can compensate for the limitations of the conventional vehicular perception such as blind spots, low resolution, and weather effects. An effective feature fusion model for the intermediate fusion methods of cooperative perception can improve feature selection and information aggregation to further enhance the perception accuracy. We propose adaptive feature fusion models with trainable feature selection modules. One of our proposed models Spatial-wise Adaptive feature Fusion (S-AdaFusion) outperforms all other state-of-the-art models on the two subsets of OPV2V dataset: default CARLA towns for vehicle detection and the Culver City for domain adaptation. In addition, previous studies have only tested cooperative perception for vehicle detection. A pedestrian, however, is much more likely to be seriously injured in a traffic accident. We evaluate the performance of cooperative perception for both vehicle and pedestrian detection using the CODD dataset. Our architecture achieves higher Average Precision (AP) than other existing models for both vehicle and pedestrian detection on the CODD dataset. The experiments demonstrate that cooperative perception also can improve the pedestrian detection accuracy compared to the conventional perception process.