arXiv reaDer
ミニからミニマックス最適化までの加速されたゼロ次および一次運動量法
Accelerated Zeroth-Order and First-Order Momentum Methods from Mini to Minimax Optimization
この論文では、非凸ミニ最適化とミニマックス最適化の両方のための加速されたゼロ次および一次運動量法のクラスを提案します。具体的には、関数値のみを取得できるブラックボックスミニ最適化のための新しい加速ゼロ次運動量(Acc-ZOM)法を提案します。さらに、Acc-ZOMメソッドがϵ停留点を見つけるためにO(d ^ 3 / 4ϵ ^ -3)のクエリの複雑さを低くし、O(d ^ 1の係数で最もよく知られている結果を改善することを証明します。 / 4)ここで、dは可変次元を示します。特に、Acc-ZOMは、既存の0次確率的アルゴリズムで必要とされる大きなバッチを必要としません。一方、ブラックボックスミニマックス最適化のための加速ゼロ次運動量降下上昇(Acc-ZOMDA)法を提案します。この方法では、関数値のみを取得できます。私たちのAcc-ZOMDAは、ϵ停留点を見つけるために大きなバッチを必要とせずにO((d_1 + d_2)^ 3 /4κ_y^4.5ϵ ^ -3)の低いクエリ複雑度を取得します。ここで、d_1とd_2は可変次元を示し、κ_yは条件数。さらに、ミニマックス最適化のための加速一次運動量降下上昇(Acc-MDA)法を提案します。この方法では、明示的な勾配にアクセスできます。私たちのAcc-MDAは、ϵ停留点を見つけるために大きなバッチを必要とせずに、O(κ_y^ 4.5ϵ ^ -3)の低い勾配の複雑さを実現します。特に、Acc-MDAは、バッチサイズO(κ_y^ 4)でO(κ_y^ 2.5ϵ ^ -3)のより低い勾配の複雑さを取得できます。これにより、最もよく知られている結果がO(κ_y^ 1)の係数で改善されます。 / 2)。ディープニューラルネットワークへのブラックボックス敵対的攻撃とロジスティック回帰への中毒攻撃に関する広範な実験結果は、アルゴリズムの効率を示しています。
In the paper, we propose a class of accelerated zeroth-order and first-order momentum methods for both nonconvex mini-optimization and minimax-optimization. Specifically, we propose a new accelerated zeroth-order momentum (Acc-ZOM) method for black-box mini-optimization where only function values can be obtained. Moreover, we prove that our Acc-ZOM method achieves a lower query complexity of O(d^3/4ϵ^-3) for finding an ϵ-stationary point, which improves the best known result by a factor of O(d^1/4) where d denotes the variable dimension. In particular, our Acc-ZOM does not need large batches required in the existing zeroth-order stochastic algorithms. Meanwhile, we propose an accelerated zeroth-order momentum descent ascent (Acc-ZOMDA) method for black-box minimax optimization, where only function values can be obtained. Our Acc-ZOMDA obtains a low query complexity of O((d_1+d_2)^3/4κ_y^4.5ϵ^-3) without requiring large batches for finding an ϵ-stationary point, where d_1 and d_2 denote variable dimensions and κ_y is condition number. Moreover, we propose an accelerated first-order momentum descent ascent (Acc-MDA) method for minimax optimization, whose explicit gradients are accessible. Our Acc-MDA achieves a low gradient complexity of O(κ_y^4.5ϵ^-3) without requiring large batches for finding an ϵ-stationary point. In particular, our Acc-MDA can obtain a lower gradient complexity of O(κ_y^2.5ϵ^-3) with a batch size O(κ_y^4), which improves the best known result by a factor of O(κ_y^1/2). Extensive experimental results on black-box adversarial attack to deep neural networks and poisoning attack to logistic regression demonstrate efficiency of our algorithms.
updated: Mon Jan 17 2022 01:35:44 GMT+0000 (UTC)
published: Tue Aug 18 2020 22:19:29 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト