落書き教師ありセマンティックセグメンテーションは、高品質の注釈なしでのその有望なパフォーマンスのために最近多くの注目を集めています。監督が不足しているため、自信を持って一貫した予測を得るのは通常困難です。通常、人々はこれらの問題を処理して、適切にラベル付けされたデータセットで補助タスクを採用するか、落書き注釈に関する追加要件を備えたグラフィカルモデルを組み込みます。代わりに、この作業は、追加情報やその他の制限なしに、落書き注釈によってセマンティックセグメンテーションを直接実現することを目的としています。具体的には、エントロピーの最小化や、不確実性を低減するための神経表現上のネットワーク埋め込みランダムウォークなど、全体的な操作を提案します。ランダムウォークの確率的遷移行列が与えられると、関連する画像間の予測に一貫性を課すために、その神経固有空間を自己監視してネットワークをさらにトレーニングします。包括的な実験とアブレーション研究により、提案されたアプローチが検証され、他のアプローチよりも優れていることが実証されています。それはいくつかのフルラベルの監視されたものにさえ匹敵し、落書きがランダムに縮小またはドロップされたときにうまく機能します。
Scribble-supervised semantic segmentation has gained much attention recently for its promising performance without high-quality annotations. Due to the lack of supervision, confident and consistent predictions are usually hard to obtain. Typically, people handle these problems to either adopt an auxiliary task with the well-labeled dataset or incorporate the graphical model with additional requirements on scribble annotations. Instead, this work aims to achieve semantic segmentation by scribble annotations directly without extra information and other limitations. Specifically, we propose holistic operations, including minimizing entropy and a network embedded random walk on neural representation to reduce uncertainty. Given the probabilistic transition matrix of a random walk, we further train the network with self-supervision on its neural eigenspace to impose consistency on predictions between related images. Comprehensive experiments and ablation studies verify the proposed approach, which demonstrates superiority over others; it is even comparable to some full-label supervised ones and works well when scribbles are randomly shrunk or dropped.