arXiv reaDer
弱教師ありセマンティックセグメンテーションの動的特徴正則化損失
Dynamic Feature Regularized Loss for Weakly Supervised Semantic Segmentation
落書きレベルの注釈を使用して、弱く監視されたセマンティックセグメンテーションに取り組むことに焦点を当てます。正則化された損失は、このタスクの効果的な解決策であることが証明されています。ただし、ほとんどの既存の正規化された損失は、静的な浅い特徴(色、空間情報)を利用して正規化されたカーネルを計算するだけであり、このような静的な浅い特徴は複雑なケースでペアワイズピクセル関係を記述できないため、最終的なパフォーマンスが制限されます。この論文では、異なるピクセルの関係を表すのに十分な情報を集約するために動的に更新される浅い特徴と深い特徴の両方を利用する新しい正則化された損失を提案します。さらに、正確な深い特徴を提供するために、バックボーンとしてビジョントランスフォーマーを採用し、ペアごとの特徴関係をトレーニングするための特徴一貫性ヘッドを設計します。多くのベルとホイッスルを使用する多段階トレーニング戦略を採用するほとんどのアプローチとは異なり、私たちのアプローチはエンドツーエンドの方法で直接トレーニングでき、機能の一貫性の頭と通常の損失が互いに利益を得ることができます。広範な実験により、私たちのアプローチは新しい最先端のパフォーマンスを達成し、6%以上のmIoUの増加で他のアプローチを大幅に上回っていることを示しています。
We focus on tackling weakly supervised semantic segmentation with scribble-level annotation. The regularized loss has been proven to be an effective solution for this task. However, most existing regularized losses only leverage static shallow features (color, spatial information) to compute the regularized kernel, which limits its final performance since such static shallow features fail to describe pair-wise pixel relationship in complicated cases. In this paper, we propose a new regularized loss which utilizes both shallow and deep features that are dynamically updated in order to aggregate sufficient information to represent the relationship of different pixels. Moreover, in order to provide accurate deep features, we adopt vision transformer as the backbone and design a feature consistency head to train the pair-wise feature relationship. Unlike most approaches that adopt multi-stage training strategy with many bells and whistles, our approach can be directly trained in an end-to-end manner, in which the feature consistency head and our regularized loss can benefit from each other. Extensive experiments show that our approach achieves new state-of-the-art performances, outperforming other approaches by a significant margin with more than 6% mIoU increase.
updated: Tue Aug 03 2021 05:11:00 GMT+0000 (UTC)
published: Tue Aug 03 2021 05:11:00 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト