arXiv reaDer
事前の正則化を使用した非常に不完全なデータシナリオでの深正規化フローモデルのトレーニング
Training Deep Normalizing Flow Models in Highly Incomplete Data Scenarios with Prior Regularization
GANや正規化フローモデルを含む深い生成フレームワークは、複雑な高次元の統計分布を効果的に(明示的または暗黙的に)学習することにより、部分的に観測されたデータサンプルの欠落値を埋めることに成功することが証明されています。ただし、学習に使用できるデータが部分的にしか観察されないタスクでは、データの欠落率の関数としてパフォーマンスが単調に低下します。欠測データレートが高いレジーム(たとえば、60%以上)では、最先端のモデルが壊れて、非現実的および/または意味的に不正確なデータを生成する傾向があることが観察されています。不良設定問題の解決策の従来の定式化に触発された、不足シナリオでのデータ分布の学習を容易にするための新しいフレームワークを提案します。提案されたフレームワークは、当然、不完全なデータから学習するプロセスを、学習中のモデルのパラメーターと欠落しているデータ値の共同最適化タスクとして提示することから生じます。この方法には、ディープノーマライズフローモデルなどの明示的で扱いやすいディープ生成フレームワークをトレーニングするために使用される目的とシームレスに統合する事前の正則化項を適用することが含まれます。特にデータ不足率が1に近づくにつれて、提案されたフレームワークが競合する手法よりも優れていることを、広範な実験的検証を通じて示します。
Deep generative frameworks including GANs and normalizing flow models have proven successful at filling in missing values in partially observed data samples by effectively learning -- either explicitly or implicitly -- complex, high-dimensional statistical distributions. In tasks where the data available for learning is only partially observed, however, their performance decays monotonically as a function of the data missingness rate. In high missing data rate regimes (e.g., 60% and above), it has been observed that state-of-the-art models tend to break down and produce unrealistic and/or semantically inaccurate data. We propose a novel framework to facilitate the learning of data distributions in high paucity scenarios that is inspired by traditional formulations of solutions to ill-posed problems. The proposed framework naturally stems from posing the process of learning from incomplete data as a joint optimization task of the parameters of the model being learned and the missing data values. The method involves enforcing a prior regularization term that seamlessly integrates with objectives used to train explicit and tractable deep generative frameworks such as deep normalizing flow models. We demonstrate via extensive experimental validation that the proposed framework outperforms competing techniques, particularly as the rate of data paucity approaches unity.
updated: Sat Apr 03 2021 20:57:57 GMT+0000 (UTC)
published: Sat Apr 03 2021 20:57:57 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト