arXiv reaDer
BiAdam: 高速適応バイレベル最適化法
BiAdam: Fast Adaptive Bilevel Optimization Methods
2 値最適化は、ハイパーパラメーター最適化やメタ学習などの多くのアプリケーションにより、最近、機械学習への関心が高まっています。近年、バイレベル法が数多く提案されていますが、これらの方法は適応学習率の使用を考慮していません。適応学習率が最適化アルゴリズムを加速できることはよく知られています。このギャップを埋めるために、この論文では、外側の問題がおそらく非凸であり、内側の問題が強く凸であるという確率論的二値最適化問題を解決するための新しい高速適応二値フレームワークを提案します。私たちのフレームワークは、多くの種類の適応学習率を含む統一された適応行列を使用し、運動量と分散を削減する手法を柔軟に使用できます。特に、2 値最適化のための便利な収束解析フレームワークを提供します。具体的には、ε-定常解を見つけるための O(ϵ^-4) のサンプル複雑度を達成する高速シングルループ適応型バイレベル最適化 (BiAdam) アルゴリズムを提案します。一方、BiAdam アルゴリズムの高速化バージョン (VR-BiAdam) を提案します。これは、知られている最高のサンプル複雑度 O(ϵ^-3) に達します。私たちの知る限り、最初に適応学習率を使用した適応バイレベル最適化法を研究します。データのハイパークリーニングとハイパー表現の学習タスクに関する実験結果は、アルゴリズムの効率性を示しています。
Bilevel optimization recently has attracted increased interest in machine learning due to its many applications such as hyper-parameter optimization and meta learning. Although many bilevel methods recently have been proposed, these methods do not consider using adaptive learning rates. It is well known that adaptive learning rates can accelerate optimization algorithms. To fill this gap, in the paper, we propose a novel fast adaptive bilevel framework to solve stochastic bilevel optimization problems that the outer problem is possibly nonconvex and the inner problem is strongly convex. Our framework uses unified adaptive matrices including many types of adaptive learning rates, and can flexibly use the momentum and variance reduced techniques. In particular, we provide a useful convergence analysis framework for the bilevel optimization. Specifically, we propose a fast single-loop adaptive bilevel optimization (BiAdam) algorithm, which achieves a sample complexity of O(ϵ^-4) for finding an ϵ-stationary solution. Meanwhile, we propose an accelerated version of BiAdam algorithm (VR-BiAdam), which reaches the best known sample complexity of O(ϵ^-3). To the best of our knowledge, we first study the adaptive bilevel optimization methods with adaptive learning rates. Experimental results on data hyper-cleaning and hyper-representation learning tasks demonstrate the efficiency of our algorithms.
updated: Sat Feb 18 2023 22:36:36 GMT+0000 (UTC)
published: Mon Jun 21 2021 20:16:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト