arXiv reaDer
対照学習は、事前トレーニングから微調整まで、敵対的なロバスト性をいつ維持しますか?
When Does Contrastive Learning Preserve Adversarial Robustness from Pretraining to Finetuning?
対照学習(CL)は、一般化可能な特徴表現を学習し、その上で線形分類器を微調整することにより、ダウンストリームタスクの最先端のパフォーマンスを実現できます。ただし、敵対的なロバスト性が画像分類で不可欠になるにつれて、CLがダウンストリームタスクに対するロバスト性を維持できるかどうかは不明なままです。主な課題は、教師あり事前トレーニング+教師あり微調整パラダイムでは、事前トレーニングから微調整までの学習タスクの不一致により、敵対的なロバスト性が簡単に忘れられることです。このような課題を「タスク間の堅牢性の転送可能性」と呼びます。上記の問題に対処するために、このホワイトペーパーでは、堅牢性の向上というレンズを通してCLの原則を再検討し、前進させます。 (1)対照的なビューの設計が重要であることを示します。画像の高周波成分は、モデルの堅牢性を向上させるのに有益です。 (2)疑似監視刺激でCLを拡張する(たとえば、機能のクラスタリングに頼る)ことで、忘れることなく堅牢性を維持できます。新しいデザインを備えた、新しい敵対的な対照的な事前トレーニングフレームワークであるAdvCLを提案します。 AdvCLは、モデルの精度と微調整の効率を損なうことなく、タスク間のロバスト性の転送可能性を強化できることを示しています。徹底的な実験的研究により、AdvCLは、複数のデータセット(CIFAR-10、CIFAR-100、およびSTL-10)および微調整スキーム(線形評価および完全モデルの微調整)。
Contrastive learning (CL) can learn generalizable feature representations and achieve the state-of-the-art performance of downstream tasks by finetuning a linear classifier on top of it. However, as adversarial robustness becomes vital in image classification, it remains unclear whether or not CL is able to preserve robustness to downstream tasks. The main challenge is that in the self-supervised pretraining + supervised finetuning paradigm, adversarial robustness is easily forgotten due to a learning task mismatch from pretraining to finetuning. We call such a challenge 'cross-task robustness transferability'. To address the above problem, in this paper we revisit and advance CL principles through the lens of robustness enhancement. We show that (1) the design of contrastive views matters: High-frequency components of images are beneficial to improving model robustness; (2) Augmenting CL with pseudo-supervision stimulus (e.g., resorting to feature clustering) helps preserve robustness without forgetting. Equipped with our new designs, we propose AdvCL, a novel adversarial contrastive pretraining framework. We show that AdvCL is able to enhance cross-task robustness transferability without loss of model accuracy and finetuning efficiency. With a thorough experimental study, we demonstrate that AdvCL outperforms the state-of-the-art self-supervised robust learning methods across multiple datasets (CIFAR-10, CIFAR-100, and STL-10) and finetuning schemes (linear evaluation and full model finetuning).
updated: Mon Nov 01 2021 17:59:43 GMT+0000 (UTC)
published: Mon Nov 01 2021 17:59:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト