arXiv reaDer
再生学習: データ生成のための学習パラダイム
Regeneration Learning: A Learning Paradigm for Data Generation
条件付きデータ生成のための機械学習方法は、通常、ソース条件付きデータ X からターゲット データ Y へのマッピングを構築します。ターゲット Y (テキスト、音声、音楽、画像、ビデオなど) は通常、高次元で複雑であり、次のような情報が含まれています。ソースデータには存在しないため、ソースターゲットマッピングでの効果的かつ効率的な学習が妨げられます。この論文では、最初に X から Y' (Y の抽象化/表現) を生成し、次に Y' から Y を生成する、データ生成のための再生学習と呼ばれる学習パラダイムを提示します。トレーニング中、Y' は手作りのルールまたは自己教師あり学習のいずれかによって Y から取得され、X-->Y' および Y'-->Y の学習に使用されます。再生学習は、表現学習の概念をデータ生成タスクに拡張し、従来の表現学習の対応物と見なすことができます。なぜなら、1) 再生学習はデータ生成のターゲット データ Y の抽象化 (Y') を処理するのに対し、従来の表現学習は処理するからです。データ理解のためのソースデータ X の抽象化 (X')。 2) 再生学習における Y'-->Y と表現学習における X-->X' の両方のプロセスは、自己教師ありの方法 (たとえば、事前トレーニング) で学習できます。 3) 再生学習における X から Y' へのマッピングと、表現学習における X' から Y へのマッピングの両方が、X から Y への直接マッピングよりも単純です。 、テキスト生成、音声認識、音声合成、作曲、画像生成、およびビデオ生成) を使用して、データ生成方法の開発に貴重な洞察を提供できます。
Machine learning methods for conditional data generation usually build a mapping from source conditional data X to target data Y. The target Y (e.g., text, speech, music, image, video) is usually high-dimensional and complex, and contains information that does not exist in source data, which hinders effective and efficient learning on the source-target mapping. In this paper, we present a learning paradigm called regeneration learning for data generation, which first generates Y' (an abstraction/representation of Y) from X and then generates Y from Y'. During training, Y' is obtained from Y through either handcrafted rules or self-supervised learning and is used to learn X-->Y' and Y'-->Y. Regeneration learning extends the concept of representation learning to data generation tasks, and can be regarded as a counterpart of traditional representation learning, since 1) regeneration learning handles the abstraction (Y') of the target data Y for data generation while traditional representation learning handles the abstraction (X') of source data X for data understanding; 2) both the processes of Y'-->Y in regeneration learning and X-->X' in representation learning can be learned in a self-supervised way (e.g., pre-training); 3) both the mappings from X to Y' in regeneration learning and from X' to Y in representation learning are simpler than the direct mapping from X to Y. We show that regeneration learning can be a widely-used paradigm for data generation (e.g., text generation, speech recognition, speech synthesis, music composition, image generation, and video generation) and can provide valuable insights into developing data generation methods.
updated: Sat Jan 21 2023 01:33:34 GMT+0000 (UTC)
published: Sat Jan 21 2023 01:33:34 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト