Dynamic Graph Message Passing Networks
 長期依存関係のモデリングは、セマンティックセグメンテーションやオブジェクト検出などの複雑なシーン理解タスクにとって重要です。 CNNは多くのコンピュータービジョンタスクに優れていますが、通常はローカルカーネルのレイヤーで構成されているため、長距離の構造化された関係をキャプチャすることは依然として制限されています。完全に接続されたグラフは、そのようなモデリングには有益ですが、その計算オーバーヘッドは法外です。メッセージパッシングニューラルネットワークフレームワークに基づく動的グラフメッセージパッシングネットワークを提案します。これは、完全に接続されたグラフをモデリングする関連作業と比較して、計算の複雑さを大幅に軽減します。これは、メッセージの受け渡しのために、入力で条件付けされたグラフのノードを適応的にサンプリングすることによって実現されます。次に、サンプリングされたノードに基づいて、ノードに依存するフィルターの重みと、それらの間で情報を伝播するための親和性マトリックスを動的に予測します。このモデルを使用して、3つの異なるタスクとバックボーンアーキテクチャに関する強力な最先端のベースラインに関して、大幅な改善を示しています。私たちのアプローチは、完全に接続されたグラフよりも優れていますが、使用する浮動小数点演算とパラメーターは大幅に少なくなっています。
Modelling long-range dependencies is critical for complex scene understanding tasks such as semantic segmentation and object detection. Although CNNs have excelled in many computer vision tasks, they are still limited in capturing long-range structured relationships as they typically consist of layers of local kernels. A fully-connected graph is beneficial for such modelling, however, its computational overhead is prohibitive. We propose a dynamic graph message passing network, based on the message passing neural network framework, that significantly reduces the computational complexity compared to related works modelling a fully-connected graph. This is achieved by adaptively sampling nodes in the graph, conditioned on the input, for message passing. Based on the sampled nodes, we then dynamically predict node-dependent filter weights and the affinity matrix for propagating information between them. Using this model, we show significant improvements with respect to strong, state-of-the-art baselines on three different tasks and backbone architectures. Our approach also outperforms fully-connected graphs while using substantially fewer floating point operations and parameters.
updated: Sun Jun 14 2020 10:35:58 GMT+0000 (UTC)
published: Mon Aug 19 2019 17:46:34 GMT+0000 (UTC)
