arXiv reaDer
ダイナミック グラフ メッセージ パッシング ネットワーク
Dynamic Graph Message Passing Networks
長期的な依存関係のモデル化は、コンピューター ビジョンのシーン理解タスクにとって重要です。 CNN は多くのビジョン タスクで優れていますが、通常はローカル カーネルのレイヤーで構成されているため、長期にわたる構造化された関係を捉えるにはまだ限界があります。全結合グラフはこのようなモデリングに役立ちますが、その計算オーバーヘッドは非常に大きくなります。完全に接続されたグラフをモデル化する関連作業と比較して、計算の複雑さを大幅に軽減する動的グラフメッセージパッシングネットワークを提案します。これは、メッセージパッシングのために、入力を条件としてグラフ内のノードを適応的にサンプリングすることによって実現されます。サンプリングされたノードに基づいて、ノードに依存するフィルターの重みと、ノード間で情報を伝達するためのアフィニティ マトリックスを動的に予測します。このモデルを使用して、3 つの異なるタスクとバックボーン アーキテクチャに関する強力な最先端のベースラインに関して大幅な改善を示します。また、私たちのアプローチは、使用する浮動小数点演算とパラメーターが大幅に少ない一方で、完全に接続されたグラフよりも優れています。プロジェクトの Web サイトは です。
Modelling long-range dependencies is critical for scene understanding tasks in computer vision. Although CNNs have excelled in many vision tasks, they are still limited in capturing long-range structured relationships as they typically consist of layers of local kernels. A fully-connected graph is beneficial for such modelling, however, its computational overhead is prohibitive. We propose a dynamic graph message passing network, that significantly reduces the computational complexity compared to related works modelling a fully-connected graph. This is achieved by adaptively sampling nodes in the graph, conditioned on the input, for message passing. Based on the sampled nodes, we dynamically predict node-dependent filter weights and the affinity matrix for propagating information between them. Using this model, we show significant improvements with respect to strong, state-of-the-art baselines on three different tasks and backbone architectures. Our approach also outperforms fully-connected graphs while using substantially fewer floating-point operations and parameters. The project website is
updated: Thu Sep 15 2022 03:42:47 GMT+0000 (UTC)
published: Mon Aug 19 2019 17:46:34 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト