arXiv reaDer
ラベル付けされた実画像データセットを自動生成された輪郭に置き換える
Replacing Labeled Real-image Datasets with Auto-generated Contours
本研究では、式駆動型教師あり学習(FDSL)のパフォーマンスが、ビジョンの事前トレーニング中に実際の画像、人間、および自己監視を使用せずに、ImageNet-21kのパフォーマンスと同等またはそれを超えることができることを示します。トランスフォーマー(ViT)。たとえば、ImageNet-21kで事前トレーニングされたViT-Baseは、ImageNet-1kで微調整された場合に81.8%のトップ1精度を示し、FDSLは同じ条件(画像の数、ハイパーパラメータ、およびエポック数)。数式によって生成された画像は、プライバシー/著作権の問題、ラベル付けのコストとエラー、および実際の画像が被るバイアスを回避するため、一般的なモデルを事前にトレーニングする可能性が非常に高くなります。合成画像のパフォーマンスを理解するために、2つの仮説をテストしました。つまり、(i)オブジェクトの輪郭がFDSLデータセットで重要であり、(ii)ラベルを作成するためのパラメーターの数を増やすと、FDSL事前トレーニングのパフォーマンスが向上します。前者の仮説をテストするために、単純なオブジェクトの輪郭の組み合わせで構成されるデータセットを構築しました。このデータセットはフラクタルのパフォーマンスと一致する可能性があることがわかりました。後者の仮説では、事前トレーニングタスクの難易度を上げると、一般に微調整の精度が向上することがわかりました。
In the present work, we show that the performance of formula-driven supervised learning (FDSL) can match or even exceed that of ImageNet-21k without the use of real images, human-, and self-supervision during the pre-training of Vision Transformers (ViTs). For example, ViT-Base pre-trained on ImageNet-21k shows 81.8% top-1 accuracy when fine-tuned on ImageNet-1k and FDSL shows 82.7% top-1 accuracy when pre-trained under the same conditions (number of images, hyperparameters, and number of epochs). Images generated by formulas avoid the privacy/copyright issues, labeling cost and errors, and biases that real images suffer from, and thus have tremendous potential for pre-training general models. To understand the performance of the synthetic images, we tested two hypotheses, namely (i) object contours are what matter in FDSL datasets and (ii) increased number of parameters to create labels affects performance improvement in FDSL pre-training. To test the former hypothesis, we constructed a dataset that consisted of simple object contour combinations. We found that this dataset can match the performance of fractals. For the latter hypothesis, we found that increasing the difficulty of the pre-training task generally leads to better fine-tuning accuracy.
updated: Sat Jun 18 2022 06:43:38 GMT+0000 (UTC)
published: Sat Jun 18 2022 06:43:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト