arXiv reaDer
敵対的なVQA:VQAモデルの堅牢性を評価するための新しいベンチマーク
Adversarial VQA: A New Benchmark for Evaluating the Robustness of VQA Models
大規模な事前トレーニングの恩恵を受けて、人気のある視覚的質問応答(VQA)タスクのパフォーマンスが大幅に向上するのを目の当たりにしました。急速な進歩にもかかわらず、これらの最先端の(SOTA)モデルが、実際の例に遭遇したときに堅牢であるかどうかは不明なままです。これを研究するために、敵対的な人間とモデルのループ手順を介して繰り返し収集された、新しい大規模なVQAベンチマークである敵対的なVQAを紹介します。この新しいベンチマークを通じて、いくつかの興味深い発見があります。 (i)驚いたことに、データセットの収集中に、専門家でないアノテーターがSOTAVQAモデルを簡単に攻撃できることがわかりました。 (ii)大規模な事前トレーニング済みモデルと敵対的トレーニング方法の両方が、新しいベンチマークで標準のVQA v2データセットよりもはるかに悪いパフォーマンスを達成し、敵対的データセットの有効性を示しながら、これらのモデルの脆弱性を明らかにします。 (iii)データ拡張に使用すると、データセットは他の堅牢なVQAベンチマークでモデルのパフォーマンスを効果的に高めることができます。 Adversarial VQAデータセットが、コミュニティでの堅牢性の研究に新たな光を当て、将来の作業の貴重なベンチマークとして役立つことを願っています。
Benefiting from large-scale pre-training, we have witnessed significant performance boost on the popular Visual Question Answering (VQA) task. Despite rapid progress, it remains unclear whether these state-of-the-art (SOTA) models are robust when encountering examples in the wild. To study this, we introduce Adversarial VQA, a new large-scale VQA benchmark, collected iteratively via an adversarial human-and-model-in-the-loop procedure. Through this new benchmark, we discover several interesting findings. (i) Surprisingly, we find that during dataset collection, non-expert annotators can easily attack SOTA VQA models successfully. (ii) Both large-scale pre-trained models and adversarial training methods achieve far worse performance on the new benchmark than over standard VQA v2 dataset, revealing the fragility of these models while demonstrating the effectiveness of our adversarial dataset. (iii) When used for data augmentation, our dataset can effectively boost model performance on other robust VQA benchmarks. We hope our Adversarial VQA dataset can shed new light on robustness study in the community and serve as a valuable benchmark for future work.
updated: Fri Aug 13 2021 07:01:48 GMT+0000 (UTC)
published: Tue Jun 01 2021 05:54:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト