ゼロショット学習(ZSL)は、特にきめの細かいオブジェクトの認識、取得、および画像キャプションの分野で特に注目を集めています。トレーニングサンプルが完全に不足しており、防衛の移転性が高い要件であるため、学習したZSLモデルは敵の攻撃に対して特に脆弱です。最近の研究では、敵対的に堅牢な一般化にはより多くのデータが必要であることが示されました。これは、ZSLの堅牢性に大きく影響する可能性があります。しかし、この方向に向けられた努力はほとんどありません。このホワイトペーパーでは、最初の試みを行い、堅牢なZSLモデルを学習するための体系的なソリューション(ATZSLという名前)を提供する一般的な定式化を提案します。 ZSLをmin-max最適化問題にキャストすることにより、目に見えないクラスのクリーンイメージで無視できるパフォーマンスを失うだけで、さまざまな敵対オブジェクト認識のより良い一般化を実現できます。それに対処するために、防衛関係予測ネットワークを設計します。これは、属性を介して見られたクラスドメインと見えないクラスドメインを橋渡しし、予測と防衛戦略を一般化します。さらに、フレームワークを拡張して、目に見えないクラス属性の有害なシナリオに対処できます。次に、広範な実験グループが提示され、ATZSLが、さまざまな設定で現在利用可能な代替案よりも、モデルの転送可能性と堅牢性の間で著しく有利なトレードオフを取得することを示しています。
Zero-shot learning (ZSL) has received extensive attention recently especially in areas of fine-grained object recognition, retrieval, and image captioning. Due to the complete lack of training samples and high requirement of defense transferability, the ZSL model learned is particularly vulnerable against adversarial attacks. Recent work also showed adversarially robust generalization requires more data. This may significantly affect the robustness of ZSL. However, very few efforts have been devoted towards this direction. In this paper, we take an initial attempt, and propose a generic formulation to provide a systematical solution (named ATZSL) for learning a robust ZSL model. It is capable of achieving better generalization on various adversarial objects recognition while only losing a negligible performance on clean images for unseen classes, by casting ZSL into a min-max optimization problem. To address it, we design a defensive relation prediction network, which can bridge the seen and unseen class domains via attributes to generalize prediction and defense strategy. Additionally, our framework can be extended to deal with the poisoned scenario of unseen class attributes. An extensive group of experiments are then presented, demonstrating that ATZSL obtains remarkably more favorable trade-off between model transferability and robustness, over currently available alternatives under various settings.