グラフ構造学習は、データからグラフの接続性を学習することを目的としています。ほとんどの場合、画像に明示的なグラフ構造を使用できないため、多くのコンピューター ビジョン関連のタスクでは特に重要です。イメージ間でグラフを作成する自然な方法は、各イメージをノードとして扱い、ペアワイズ イメージの類似性を重みとして対応するエッジに割り当てることです。画像間のペアごとの類似性は、特徴表現のノイズに敏感であり、信頼できないグラフ構造につながることはよく知られています。統計的検定の観点からこの問題に対処します。各ノードの特徴ベクトルを独立したサンプルとして表示することにより、特徴表現の類似性に基づいて 2 つのノード間にエッジを作成するかどうかの決定は、1 つの統計的テストと考えることができます。エッジを作成する決定のロバスト性を向上させるために、複数のサンプルが抽出され、複数の統計テストによって統合されて、より信頼性の高い類似性尺度が生成され、その結果、より信頼性の高いグラフ構造が生成されます。 B-Attention という名前の対応するエレガントな行列形式は、効率を高めるように設計されています。グラフ構造学習のための複数のテストの有効性は、複数のクラスタリングと ReID ベンチマーク データセットで理論的および経験的に検証されています。ソース コードは https://github.com/Thomas-wyh/B-Attention で入手できます。
Graph structure learning aims to learn connectivity in a graph from data. It is particularly important for many computer vision related tasks since no explicit graph structure is available for images for most cases. A natural way to construct a graph among images is to treat each image as a node and assign pairwise image similarities as weights to corresponding edges. It is well known that pairwise similarities between images are sensitive to the noise in feature representations, leading to unreliable graph structures. We address this problem from the viewpoint of statistical tests. By viewing the feature vector of each node as an independent sample, the decision of whether creating an edge between two nodes based on their similarity in feature representation can be thought as a single statistical test. To improve the robustness in the decision of creating an edge, multiple samples are drawn and integrated by multiple statistical tests to generate a more reliable similarity measure, consequentially more reliable graph structure. The corresponding elegant matrix form named B-Attention is designed for efficiency. The effectiveness of multiple tests for graph structure learning is verified both theoretically and empirically on multiple clustering and ReID benchmark datasets. Source codes are available at https://github.com/Thomas-wyh/B-Attention.