最近、生成的敵対ネットワーク(GAN)が多くの関心を集めています。目に見えない高品質のサンプル、特に画像の生成効率は、長年にわたって向上しています。自然言語生成(NLG)の分野では、敵対的な設定を使用して意味のある文を生成することは、現実的な文を生成する既存のアーキテクチャの欠如と評価ツールの欠如という2つの理由で困難であることが示されています。この論文では、特定の画像(画像キャプションとも呼ばれる)に従って文を生成する条件付きGAN(cGAN)に関連する敵対的アーキテクチャを提案します。この試みは、事前トレーニングまたは強化方法を使用しない最初の試みです。また、実験設定を安全に評価して解釈し、さらに研究を進めることができる理由も説明します。
Recently, generative adversarial networks (GAN) have gathered a lot of interest. Their efficiency in generating unseen samples of high quality, especially images, has improved over the years. In the field of Natural Language Generation (NLG), the use of the adversarial setting to generate meaningful sentences has shown to be difficult for two reasons: the lack of existing architectures to produce realistic sentences and the lack of evaluation tools. In this paper, we propose an adversarial architecture related to the conditional GAN (cGAN) that generates sentences according to a given image (also called image captioning). This attempt is the first that uses no pre-training or reinforcement methods. We also explain why our experiment settings can be safely evaluated and interpreted for further works.