この作業では、クリーンなラベル付きの例がいくつか与えられたときに、ノイズの多いラベルから分類子を学習する問題を検討します。クリーンでノイズの多いデータの構造は、クラスごとのグラフによってモデル化され、グラフのたたみ込みネットワーク(GCN)は、ノイズの多い例のクラス関連性を予測するために使用されます。クラスごとに、GCNはバイナリ分類子として扱われます。これは、重み付きバイナリクロスエントロピー損失関数を使用して、ノイズのある例とクリーンな例を区別することを学習します。 GCNで推定された「クリーン」確率は、関連性の尺度として利用されます。ノイズの多い例は、最終タスクの分類子を学習するときに、その関連性によって重み付けされます。いくつかのショット学習問題の拡張バージョンでメソッドを評価します。新しいクラスのいくつかのクリーンな例に、追加のノイズの多いデータが追加されます。実験結果は、GCNベースのクリーニングプロセスにより、ノイズの多いデータをクリーニングしない場合よりも分類精度が大幅に向上すること、およびクリーンな例がほとんど使用されない標準の数ショット分類が向上することを示しています。
In this work we consider the problem of learning a classifier from noisy labels when a few clean labeled examples are given. The structure of clean and noisy data is modeled by a graph per class and Graph Convolutional Networks (GCN) are used to predict class relevance of noisy examples. For each class, the GCN is treated as a binary classifier, which learns to discriminate clean from noisy examples using a weighted binary cross-entropy loss function. The GCN-inferred "clean" probability is then exploited as a relevance measure. Each noisy example is weighted by its relevance when learning a classifier for the end task. We evaluate our method on an extended version of a few-shot learning problem, where the few clean examples of novel classes are supplemented with additional noisy data. Experimental results show that our GCN-based cleaning process significantly improves the classification accuracy over not cleaning the noisy data, as well as standard few-shot classification where only few clean examples are used.