arXiv reaDer
DMSA: 適応親和性に基づく動的マルチスケール教師なしセマンティック セグメンテーション
DMSA: Dynamic Multi-scale Unsupervised Semantic Segmentation Based on Adaptive Affinity
この論文で提案された方法は、4 つの損失関数に基づくエンドツーエンドの教師なしセマンティック セグメンテーション アーキテクチャ DMSA を提案します。このフレームワークは、Atrous Spatial Pyramid Pooling (ASPP) モジュールを使用して特徴抽出を強化します。同時に、動的拡張戦略は、マルチスケールのコンテキスト情報をより適切にキャプチャするように設計されています。第 2 に、Pixel-Adaptive Refinement (PAR) モジュールが導入されました。これは、高品質の疑似ラベルを取得するために、特徴の融合後に最初の疑似ラベルを適応的に改良することができます。実験は、提案された DSMA フレームワークが顕著性データセットの既存の方法よりも優れていることを示しています。 COCO 80 データセットでは、MIoU が 2.0 向上し、精度が 5.39 向上しています。 Pascal VOC 2012 Augmented データセットでは、MIoU が 4.9 向上し、精度が 3.4 向上しています。さらに、PARモジュールの導入後、モデルの収束速度も大幅に改善されました。
The proposed method in this paper proposes an end-to-end unsupervised semantic segmentation architecture DMSA based on four loss functions. The framework uses Atrous Spatial Pyramid Pooling (ASPP) module to enhance feature extraction. At the same time, a dynamic dilation strategy is designed to better capture multi-scale context information. Secondly, a Pixel-Adaptive Refinement (PAR) module is introduced, which can adaptively refine the initial pseudo labels after feature fusion to obtain high quality pseudo labels. Experiments show that the proposed DSMA framework is superior to the existing methods on the saliency dataset. On the COCO 80 dataset, the MIoU is improved by 2.0, and the accuracy is improved by 5.39. On the Pascal VOC 2012 Augmented dataset, the MIoU is improved by 4.9, and the accuracy is improved by 3.4. In addition, the convergence speed of the model is also greatly improved after the introduction of the PAR module.
updated: Wed Mar 01 2023 03:08:30 GMT+0000 (UTC)
published: Wed Mar 01 2023 03:08:30 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト