arXiv reaDer
タスクにとらわれないロバストな表現学習
Task-Agnostic Robust Representation Learning
深層学習モデルは、入力の小さいが意図的に選択された摂動に対して非常に脆弱であることが報告されています。特に、深いネットワークは、クリーンな画像の精度がほぼ最適であるにもかかわらず、最悪の場合でも人間が知覚できない摂動(いわゆる敵対的な例)で画像を誤って分類することがよくあります。この問題に取り組むために、ネットワークの堅牢性を向上させるためのトレーニング手順を研究するために多くの研究が行われてきました。ただし、これまでの研究のほとんどは、教師あり学習の場合に焦点を当てています。自己管理型学習方法の人気が高まるにつれ、下流のタスクで結果として得られる表現の堅牢性を調査および改善することも重要です。この論文では、タスクにとらわれない方法で、ラベルのないデータを使用したロバストな表現学習の問題を研究します。具体的には、最初に、クリーンなデータとロバスト性正則化の損失を使用して、ダウンストリームタスクでの予測モデル(学習された表現に基づく)の敵対的損失の上限を導き出します。さらに、正則化はタスクに依存しないため、表現学習フェーズ中に正則化を直接最小化して、ダウンストリーム予測モデルをより堅牢にすることを提案します。広範な実験は、私たちの方法が関連するベースラインと比較して好ましい敵対的パフォーマンスを達成することを示しています。
It has been reported that deep learning models are extremely vulnerable to small but intentionally chosen perturbations of its input. In particular, a deep network, despite its near-optimal accuracy on the clean images, often mis-classifies an image with a worst-case but humanly imperceptible perturbation (so-called adversarial examples). To tackle this problem, a great amount of research has been done to study the training procedure of a network to improve its robustness. However, most of the research so far has focused on the case of supervised learning. With the increasing popularity of self-supervised learning methods, it is also important to study and improve the robustness of their resulting representation on the downstream tasks. In this paper, we study the problem of robust representation learning with unlabeled data in a task-agnostic manner. Specifically, we first derive an upper bound on the adversarial loss of a prediction model (which is based on the learned representation) on any downstream task, using its loss on the clean data and a robustness regularizer. Moreover, the regularizer is task-independent, thus we propose to minimize it directly during the representation learning phase to make the downstream prediction model more robust. Extensive experiments show that our method achieves preferable adversarial performance compared to relevant baselines.
updated: Tue Mar 15 2022 02:05:11 GMT+0000 (UTC)
published: Tue Mar 15 2022 02:05:11 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト