この研究では、ネットワーク内の順方向および逆方向の伝播に焦点を当てて、特徴の精製と勾配逆伝播のプロセス中のチャネル特徴と畳み込みカーネルの間の関連付けを調べます。その結果、特徴の空間的固化のための高密度チャネル圧縮と呼ばれる方法を提案します。この方法の中心的な概念を利用して、バックボーンおよびヘッド ネットワーク用の 2 つの革新的なモジュールを紹介します。フィーチャ空間固化構造 (DCFS) の高密度チャネル圧縮と非対称マルチレベル圧縮分離ヘッド (ADH) です。 YOLOv5 モデルに統合すると、これら 2 つのモジュールは並外れたパフォーマンスを発揮し、YOLOCS と呼ばれる修正されたモデルになります。 MSCOCO データセットで評価すると、大、中、および小の YOLOCS モデルでは、それぞれ 50.1%、47.6%、および 42.5% の AP が得られます。 YOLOv5 モデルと同様の推論速度を維持し、大、中、および小 YOLOCS モデルは、YOLOv5 モデルの AP をそれぞれ 1.1%、2.3%、および 5.2% 上回っています。
In this study, we examine the associations between channel features and convolutional kernels during the processes of feature purification and gradient backpropagation, with a focus on the forward and backward propagation within the network. Consequently, we propose a method called Dense Channel Compression for Feature Spatial Solidification. Drawing upon the central concept of this method, we introduce two innovative modules for backbone and head networks: the Dense Channel Compression for Feature Spatial Solidification Structure (DCFS) and the Asymmetric Multi-Level Compression Decoupled Head (ADH). When integrated into the YOLOv5 model, these two modules demonstrate exceptional performance, resulting in a modified model referred to as YOLOCS. Evaluated on the MSCOCO dataset, the large, medium, and small YOLOCS models yield AP of 50.1%, 47.6%, and 42.5%, respectively. Maintaining inference speeds remarkably similar to those of the YOLOv5 model, the large, medium, and small YOLOCS models surpass the YOLOv5 model's AP by 1.1%, 2.3%, and 5.2%, respectively.