arXiv reaDer
損失を事前にトレーニングする:有益な事前確率を使用した簡単なベイジアン転送学習
Pre-Train Your Loss: Easy Bayesian Transfer Learning with Informative Priors
ディープラーニングは、ソースタスクで学習した初期化から開始して、大規模な基盤モデルをダウンストリームタスクで微調整する転移学習パラダイムにますます移行しています。ただし、初期化には、ソースタスクに関する情報はほとんど含まれていません。代わりに、監視または自己監視のアプローチを通じて、ソースタスクから非常に有益な事後確率を学習できることを示します。これは、ダウンストリームタスクの損失面全体を変更する事前確率の基礎として機能します。このシンプルなモジュラーアプローチにより、さまざまなダウンストリームの分類およびセグメンテーションタスクでパフォーマンスが大幅に向上し、データ効率の高い学習が可能になり、標準の事前トレーニング戦略の代わりになります。これらの非常に有益な事前確率は、事前にトレーニングされた重みと同様に、将来の使用のために保存することもでき、ベイズの深層学習で通常使用されるゼロ平均等方性の有益でない事前確率とは対照的です。
Deep learning is increasingly moving towards a transfer learning paradigm whereby large foundation models are fine-tuned on downstream tasks, starting from an initialization learned on the source task. But an initialization contains relatively little information about the source task. Instead, we show that we can learn highly informative posteriors from the source task, through supervised or self-supervised approaches, which then serve as the basis for priors that modify the whole loss surface on the downstream task. This simple modular approach enables significant performance gains and more data-efficient learning on a variety of downstream classification and segmentation tasks, serving as a drop-in replacement for standard pre-training strategies. These highly informative priors also can be saved for future use, similar to pre-trained weights, and stand in contrast to the zero-mean isotropic uninformative priors that are typically used in Bayesian deep learning.
updated: Fri May 20 2022 16:19:30 GMT+0000 (UTC)
published: Fri May 20 2022 16:19:30 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト