arXiv reaDer
体系的な一般化のためにニューラルモジュールネットワークはどのようにモジュール化されるべきか?
How Modular Should Neural Module Networks Be for Systematic Generalization?
ニューラルモジュールネットワーク(NMN)は、サブタスクに取り組むモジュールの構成を介して視覚的な質問応答(VQA)を目的としています。 NMNは、体系的な一般化を実現するための有望な戦略です。つまり、トレーニング分布のバイアス要因を克服します。ただし、体系的な一般化を容易にするNMNの側面は完全には理解されていません。この論文では、NMNのモジュール性の程度が体系的な一般化に大きな影響を与えることを示しています。 3つのVQAデータセット(VQA-MNIST、SQOOP、およびCLEVR-CoGenT)での一連の実験で、モジュール性の程度を調整すると、特に画像エンコーダーの段階で、かなり高い体系的な一般化に到達することがわかりました。これらの発見は、体系的な一般化の点で以前のものよりも優れた新しいNMNアーキテクチャにつながります。
Neural Module Networks (NMNs) aim at Visual Question Answering (VQA) via composition of modules that tackle a sub-task. NMNs are a promising strategy to achieve systematic generalization, i.e., overcoming biasing factors in the training distribution. However, the aspects of NMNs that facilitate systematic generalization are not fully understood. In this paper, we demonstrate that the degree of modularity of the NMN have large influence on systematic generalization. In a series of experiments on three VQA datasets (VQA-MNIST, SQOOP, and CLEVR-CoGenT), our results reveal that tuning the degree of modularity, especially at the image encoder stage, reaches substantially higher systematic generalization. These findings lead to new NMN architectures that outperform previous ones in terms of systematic generalization.
updated: Sat Jan 15 2022 22:59:24 GMT+0000 (UTC)
published: Tue Jun 15 2021 14:13:47 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト