arXiv reaDer
入力変換による自己監視ラベル拡張
Self-supervised Label Augmentation via Input Transformations
入力信号のみを与えられた人工ラベルを構築することによって学習する自己教師あり学習は、最近、ラベルのないデータセットを使用した表現の学習、つまり、人間が注釈を付けた監督なしの学習にかなりの注目を集めています。このホワイトペーパーでは、このような手法を使用して、完全にラベル付けされたデータセットでもモデルの精度を大幅に向上できることを示します。私たちのスキームは、元のタスクと自己管理タスクの両方を学習するようにモデルをトレーニングしますが、対応する損失の合計を最適化する従来のマルチタスク学習フレームワークとは異なります。私たちの主なアイデアは、元のラベルと自己監視ラベルの共同分布に関して単一の統合タスクを学ぶことです。つまり、入力変換の自己監視を介して元のラベルを拡張します。このシンプルでありながら効果的なアプローチにより、元のタスクと自己管理タスクを同時に学習しているときに特定の不変制約を緩和することで、モデルを簡単にトレーニングできます。また、さまざまな拡張からの予測を組み合わせて予測精度を向上させる集約推論を可能にします。さらに、単一の(より速い)推論で集約された推論の効果を持つ、自己蒸留と呼ぶ新しい知識伝達手法を提案します。数回のショットや不均衡な分類シナリオなど、さまざまな完全に監視された設定でのフレームワークの大幅な精度の向上と幅広い適用性を示します。
Self-supervised learning, which learns by constructing artificial labels given only the input signals, has recently gained considerable attention for learning representations with unlabeled datasets, i.e., learning without any human-annotated supervision. In this paper, we show that such a technique can be used to significantly improve the model accuracy even under fully-labeled datasets. Our scheme trains the model to learn both original and self-supervised tasks, but is different from conventional multi-task learning frameworks that optimize the summation of their corresponding losses. Our main idea is to learn a single unified task with respect to the joint distribution of the original and self-supervised labels, i.e., we augment original labels via self-supervision of input transformation. This simple, yet effective approach allows to train models easier by relaxing a certain invariant constraint during learning the original and self-supervised tasks simultaneously. It also enables an aggregated inference which combines the predictions from different augmentations to improve the prediction accuracy. Furthermore, we propose a novel knowledge transfer technique, which we refer to as self-distillation, that has the effect of the aggregated inference in a single (faster) inference. We demonstrate the large accuracy improvement and wide applicability of our framework on various fully-supervised settings, e.g., the few-shot and imbalanced classification scenarios.
updated: Mon Jun 29 2020 12:10:28 GMT+0000 (UTC)
published: Mon Oct 14 2019 00:37:33 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト