ゼロショット学習 (ZSL) は、目に見えるクラスから得られる知識、つまり視覚的および意味的な関係を一般化することによって、目に見えないクラスを認識することを目的としています。モデルの汎化能力を向上させるために画像拡張技術が一般的に適用されます。ただし、このアプローチは ZSL に悪影響を与える可能性もあります。これは、単一ラベルの監視のみに依存する従来の拡張技術では意味情報を維持できず、結果として意味の歪みの問題が発生するためです。言い換えれば、画像の議論は画像の意味論的 (属性など) 情報を改ざんする可能性があります。意味の歪みの問題を軽減しながら画像拡張の利点を活用するために、敵対的サンプル (HAS) を利用する新しい ZSL アプローチを提案します。 HAS は、次の 3 つの重要な側面を考慮した敵対的トレーニングを通じて ZSL を進歩させます: (1) 正しいラベルを維持しながら、ネガティブ クラスと同様の拡張を強制することによる堅牢な生成、(2) 潜在スペース制約を導入して、ラベルからの重大な逸脱を回避することによる信頼性の高い生成(3) 各意味属性の局在化に応じて画像を調整することにより、属性ベースの摂動を組み込むことによる多様な生成。 3 つの著名なゼロショット ベンチマーク データセットでの包括的な実験を通じて、ZSL シナリオと一般化ゼロショット学習 (GZSL) シナリオの両方における敵対的サンプル アプローチの有効性を実証します。私たちのソースコードは https://github.com/uqzhichen/HASZSL で入手できます。
Zero-Shot Learning (ZSL) aims to recognize unseen classes by generalizing the knowledge, i.e., visual and semantic relationships, obtained from seen classes, where image augmentation techniques are commonly applied to improve the generalization ability of a model. However, this approach can also cause adverse effects on ZSL since the conventional augmentation techniques that solely depend on single-label supervision is not able to maintain semantic information and result in the semantic distortion issue consequently. In other words, image argumentation may falsify the semantic (e.g., attribute) information of an image. To take the advantage of image augmentations while mitigating the semantic distortion issue, we propose a novel ZSL approach by Harnessing Adversarial Samples (HAS). HAS advances ZSL through adversarial training which takes into account three crucial aspects: (1) robust generation by enforcing augmentations to be similar to negative classes, while maintaining correct labels, (2) reliable generation by introducing a latent space constraint to avert significant deviations from the original data manifold, and (3) diverse generation by incorporating attribute-based perturbation by adjusting images according to each semantic attribute's localization. Through comprehensive experiments on three prominent zero-shot benchmark datasets, we demonstrate the effectiveness of our adversarial samples approach in both ZSL and Generalized Zero-Shot Learning (GZSL) scenarios. Our source code is available at https://github.com/uqzhichen/HASZSL.