arXiv reaDer
グラフニューラルネットワークの事前学習のための戦略
Strategies for Pre-training Graph Neural Networks
機械学習の多くのアプリケーションでは、トレーニング中にタスク固有のラベルが不足している一方で、トレーニング中のものとは分布的に異なるテスト例で正確な事前予測を行うモデルを必要とする。この課題に対する効果的なアプローチは、データが豊富な関連タスクでモデルを事前学習し、その後、関心のある下流のタスクでモデルを微調整することである。事前学習は多くの言語や視覚の分野で有効であるが、グラフデータセット上での事前学習をどのように効果的に利用するかは未解決の課題である。本論文では、グラフニューラルネットワーク(GNN)の事前学習のための新しい戦略と自己教師付き手法を開発する。我々の戦略の成功の鍵は、GNNが有用なローカル表現とグローバル表現を同時に学習できるように、個々のノードやグラフ全体のレベルで表現力のあるGNNを事前学習させることである。我々は、複数のグラフ分類データセットでの事前学習を系統的に研究している。その結果、グラフ全体または個々のノードのレベルでGNNを事前学習させる素朴な戦略では改善に限界があり、多くの下流のタスクで逆効果の転移を引き起こす可能性があることがわかった。対照的に、我々の戦略は逆効果の転移を回避し、下流タスクでの一般化を大幅に改善し、非訓練モデルと比較してROC-AUCの絶対値が9.4%向上し、分子特性予測とタンパク質機能予測のための最先端の性能を達成した。
Many applications of machine learning require a model to make accurate pre-dictions on test examples that are distributionally different from training ones, while task-specific labels are scarce during training. An effective approach to this challenge is to pre-train a model on related tasks where data is abundant, and then fine-tune it on a downstream task of interest. While pre-training has been effective in many language and vision domains, it remains an open question how to effectively use pre-training on graph datasets. In this paper, we develop a new strategy and self-supervised methods for pre-training Graph Neural Networks (GNNs). The key to the success of our strategy is to pre-train an expressive GNN at the level of individual nodes as well as entire graphs so that the GNN can learn useful local and global representations simultaneously. We systematically study pre-training on multiple graph classification datasets. We find that naive strategies, which pre-train GNNs at the level of either entire graphs or individual nodes, give limited improvement and can even lead to negative transfer on many downstream tasks. In contrast, our strategy avoids negative transfer and improves generalization significantly across downstream tasks, leading up to 9.4% absolute improvements in ROC-AUC over non-pre-trained models and achieving state-of-the-art performance for molecular property prediction and protein function prediction.
updated: Tue Feb 18 2020 19:49:48 GMT+0000 (UTC)
published: Wed May 29 2019 08:11:52 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト