Optimization of Graph Neural Networks: Implicit Acceleration by Skip Connections and More Depth
グラフニューラルネットワーク(GNN)は、表現力と一般化のレンズから研究されてきました。ただし、それらの最適化プロパティはあまりよく理解されていません。 GNNの勾配ダイナミクスを研究することにより、GNNトレーニングの分析に向けた第一歩を踏み出します。まず、線形化されたGNNを分析し、トレーニングの非凸性にもかかわらず、線形レートでのグローバル最小値への収束が、実際のグラフで検証する穏やかな仮定の下で保証されることを証明します。次に、GNNのトレーニング速度に影響を与える可能性のあるものを調査します。私たちの結果は、GNNのトレーニングが、接続のスキップ、より深い深さ、および/または適切なラベル配布によって暗黙的に加速されることを示しています。経験的結果は、線形化されたGNNの理論的結果が非線形GNNのトレーニング動作と一致していることを確認しています。私たちの結果は、最適化の観点からスキップ接続を備えたGNNの成功に対する最初の理論的サポートを提供し、スキップ接続を備えたディープGNNが実際に有望であることを示唆しています。
Graph Neural Networks (GNNs) have been studied from the lens of expressive power and generalization. However, their optimization properties are less well understood. We take the first step towards analyzing GNN training by studying the gradient dynamics of GNNs. First, we analyze linearized GNNs and prove that despite the non-convexity of training, convergence to a global minimum at a linear rate is guaranteed under mild assumptions that we validate on real-world graphs. Second, we study what may affect the GNNs' training speed. Our results show that the training of GNNs is implicitly accelerated by skip connections, more depth, and/or a good label distribution. Empirical results confirm that our theoretical results for linearized GNNs align with the training behavior of nonlinear GNNs. Our results provide the first theoretical support for the success of GNNs with skip connections in terms of optimization, and suggest that deep GNNs with skip connections would be promising in practice.
