回転は、対照学習におけるデータ拡張の候補として頻繁にリストされますが、満足のいく改善が得られることはめったにありません。これは、回転した画像が常にポジまたはネガとして扱われるためであると主張します。画像のセマンティクスは、回転不変または回転可変である可能性があるため、回転した画像を正として扱うか負として扱うかは、画像の内容に基づいて決定する必要があります。したがって、新しい拡張戦略である適応型の正または負のデータ拡張 (PNDA) を提案します。この場合、元の画像とその回転された画像は、意味的に近い場合は正のペアになり、意味的に異なる場合は負のペアになります。 PNDA を達成するために、最初に教師なしの方法で画像ごとに回転が正か負かを判断します。次に、PNDA を対照学習フレームワークに適用します。私たちの実験は、PNDA が対照学習のパフォーマンスを向上させることを示しました。コードは https://github.com/AtsuMiyai/rethinking_rotation で入手できます。
Rotation is frequently listed as a candidate for data augmentation in contrastive learning but seldom provides satisfactory improvements. We argue that this is because the rotated image is always treated as either positive or negative. The semantics of an image can be rotation-invariant or rotation-variant, so whether the rotated image is treated as positive or negative should be determined based on the content of the image. Therefore, we propose a novel augmentation strategy, adaptive Positive or Negative Data Augmentation (PNDA), in which an original and its rotated image are a positive pair if they are semantically close and a negative pair if they are semantically different. To achieve PNDA, we first determine whether rotation is positive or negative on an image-by-image basis in an unsupervised way. Then, we apply PNDA to contrastive learning frameworks. Our experiments showed that PNDA improves the performance of contrastive learning. The code is available at https://github.com/AtsuMiyai/rethinking_rotation.