arXiv reaDer
誘導バイアスに対するバイアスについて
On the Bias Against Inductive Biases
自然言語処理の分野に革命を起こしたトランスフォーマー モデルから借りて、視覚タスクの自己教師あり特徴学習も、これらの非常に深い等方性ネットワークを使用した最先端の成功を収めています。ただし、典型的な AI 研究者は、数十億のパラメーターと二次自己注意活性化を備えたモデルをトレーニングすることはもちろん、評価するためのリソースも持っていません。さらなる研究を促進するためには、典型的な研究者が十分に研究できるこれらの巨大な変圧器モデルの特徴を理解する必要があります。これらのトランス モデルの興味深い特性の 1 つは、従来の畳み込みネットワークに存在する誘導バイアスのほとんどを除去することです。この作業では、教師なし視覚的特徴学習に使用される小規模から中規模の等方性ネットワークに対するこれらおよびより誘導的なバイアスの影響を分析し、それらの除去が必ずしも理想的ではないことを示します。
Borrowing from the transformer models that revolutionized the field of natural language processing, self-supervised feature learning for visual tasks has also seen state-of-the-art success using these extremely deep, isotropic networks. However, the typical AI researcher does not have the resources to evaluate, let alone train, a model with several billion parameters and quadratic self-attention activations. To facilitate further research, it is necessary to understand the features of these huge transformer models that can be adequately studied by the typical researcher. One interesting characteristic of these transformer models is that they remove most of the inductive biases present in classical convolutional networks. In this work, we analyze the effect of these and more inductive biases on small to moderately-sized isotropic networks used for unsupervised visual feature learning and show that their removal is not always ideal.
updated: Fri May 28 2021 19:41:48 GMT+0000 (UTC)
published: Fri May 28 2021 19:41:48 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト