arXiv reaDer
新規参入者を飾る: 継続的なテスト時間の適応のためのビジュアル ドメイン プロンプト
Decorate the Newcomers: Visual Domain Prompt for Continual Test Time Adaptation
継続的テスト時間適応 (CTTA) は、ソース データにアクセスせずに、継続的に変化するラベルのないターゲット ドメインにソース モデルを適応させることを目的としています。既存の方法は主に、新しいドメイン データセットの疑似ラベルを予測するなど、自己トレーニング方法でのモデル ベースの適応に焦点を当てています。疑似ラベルはノイズが多く、信頼性が低いため、これらの方法は、動的なデータ分布を処理する際に壊滅的な忘却とエラーの蓄積に悩まされます。 NLP のプロンプト学習に動機付けられて、このホワイト ペーパーでは、ソース モデルのパラメーターを凍結しながら、ターゲット ドメインのイメージ レベルのビジュアル ドメイン プロンプトを学習することを提案します。テスト中、変化するターゲット データセットは、学習した視覚的なプロンプトで入力データを再構成することにより、ソース モデルに適応させることができます。具体的には、現在のドメイン知識を抽出し、継続的な適応においてドメイン共有知識を維持するために、ドメイン固有プロンプトとドメイン非依存プロンプトの 2 種類のプロンプトを考案します。さらに、ドメイン不変のプロンプトでドメインに敏感なパラメーターを抑制して、ドメイン共有の知識をより効果的に学習するための恒常性ベースのプロンプト適応戦略を設計します。モデル依存のパラダイムからモデルフリーのパラダイムへのこの移行により、壊滅的な忘却とエラーの蓄積の問題を回避できます。実験では、CIFAR-10C、CIFAR-100C、ImageNet-C、および VLCS データセットを含む 4 つの広く使用されているベンチマークで、提案された方法が最先端の方法よりも大幅なパフォーマンスの向上を達成することが示されています。
Continual Test-Time Adaptation (CTTA) aims to adapt the source model to continually changing unlabeled target domains without access to the source data. Existing methods mainly focus on model-based adaptation in a self-training manner, such as predicting pseudo labels for new domain datasets. Since pseudo labels are noisy and unreliable, these methods suffer from catastrophic forgetting and error accumulation when dealing with dynamic data distributions. Motivated by the prompt learning in NLP, in this paper, we propose to learn an image-level visual domain prompt for target domains while having the source model parameters frozen. During testing, the changing target datasets can be adapted to the source model by reformulating the input data with the learned visual prompts. Specifically, we devise two types of prompts, i.e., domains-specific prompts and domains-agnostic prompts, to extract current domain knowledge and maintain the domain-shared knowledge in the continual adaptation. Furthermore, we design a homeostasis-based prompt adaptation strategy to suppress domain-sensitive parameters in domain-invariant prompts to learn domain-shared knowledge more effectively. This transition from the model-dependent paradigm to the model-free one enables us to bypass the catastrophic forgetting and error accumulation problems. Experiments show that our proposed method achieves significant performance gains over state-of-the-art methods on four widely-used benchmarks, including CIFAR-10C, CIFAR-100C, ImageNet-C, and VLCS datasets.
updated: Thu Dec 08 2022 08:56:02 GMT+0000 (UTC)
published: Thu Dec 08 2022 08:56:02 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト