arXiv reaDer
EPVT: 皮膚病変認識におけるドメイン一般化のための環境認識プロンプト ビジョン トランスフォーマー
EPVT: Environment-aware Prompt Vision Transformer for Domain Generalization in Skin Lesion Recognition
深層学習を用いた皮膚病変の認識は目覚ましい進歩を遂げており、これらのシステムを実世界のシナリオに展開する必要性が高まっています。しかし、最近の研究では、皮膚病変認識のためのディープ ニューラル ネットワークが、疾患とは関係のない画像アーティファクト (つまり、暗い角、密集した毛髪) に過度に依存している可能性があり、目に見えない環境では一般化が不十分になる可能性があることが明らかになりました。この問題に対処するために、EPVT と呼ばれる新しいドメイン一般化手法を提案します。これは、ビジョン トランスフォーマーにプロンプトを埋め込んで、さまざまなドメインから知識を共同で学習することを含みます。具体的には、EPVT は一連のドメイン プロンプトを活用し、それぞれがドメイン エキスパートとして機能して、ドメイン固有の知識を取得します。データセット全体に関する一般知識の共有プロンプト。知識の共有とさまざまなプロンプトの相互作用を促進するために、ドメイン プロンプトと共有プロンプト間の低ランクの乗算更新を可能にするドメイン プロンプト ジェネレーターを導入します。ドメイン ミックスアップ戦略は、各ドメインで同時に発生するアーティファクトを減らすためにさらに考案されています。これにより、より柔軟な意思決定マージンが可能になり、誤って割り当てられたドメイン ラベルの問題が軽減されます。分布外の 4 つのデータセットと 6 つの異なる偏った ISIC データセットに関する実験は、さまざまな環境での皮膚病変の認識における EPVT の優れた一般化能力を示しています。私たちのコードとデータセットは、https://github.com/SiyuanYan1/EPVT でリリースされます。
Skin lesion recognition using deep learning has made remarkable progress, and there is an increasing need for deploying these systems in real-world scenarios. However, recent research has revealed that deep neural networks for skin lesion recognition may overly depend on disease-irrelevant image artifacts (i.e. dark corners, dense hairs), leading to poor generalization in unseen environments. To address this issue, we propose a novel domain generalization method called EPVT, which involves embedding prompts into the vision transformer to collaboratively learn knowledge from diverse domains. Concretely, EPVT leverages a set of domain prompts, each of which plays as a domain expert, to capture domain-specific knowledge; and a shared prompt for general knowledge over the entire dataset. To facilitate knowledge sharing and the interaction of different prompts, we introduce a domain prompt generator that enables low-rank multiplicative updates between domain prompts and the shared prompt. A domain mixup strategy is additionally devised to reduce the co-occurring artifacts in each domain, which allows for more flexible decision margins and mitigates the issue of incorrectly assigned domain labels. Experiments on four out-of-distribution datasets and six different biased ISIC datasets demonstrate the superior generalization ability of EPVT in skin lesion recognition across various environments. Our code and dataset will be released at https://github.com/SiyuanYan1/EPVT.
updated: Sun Apr 09 2023 07:46:03 GMT+0000 (UTC)
published: Tue Apr 04 2023 03:36:14 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト