学習と視覚の発達とともに、乗数の交互方向法(ADMM)は線形制約のある分離可能な最適化モデルの一般的なアルゴリズムになりました。ただし、ADMMとその数値のバリエーション(不正確、近接、線形化など)は、タスク適応能力が弱いため、複雑な学習タスクと視覚タスクを処理する際に最先端のパフォーマンスを得るのが困難です。最近、タスク固有の計算モジュール(設計されたフィルターや学習されたアーキテクチャーなど)をADMMの反復に組み込むことに関心が高まっています。残念ながら、これらのタスク関連モジュールは、制御不能で不安定な反復フローを導入し、元の最適化モデルの構造を破壊します。したがって、既存の理論的調査は、これらの結果のタスク固有の反復に対して無効です。このホワイトペーパーでは、学習および視覚の問題に柔軟なタスク固有のモジュールを組み込むために、シンプルで汎用的な近位ADMMフレームワークを開発します。目的関数値と制約違反の両方で収束を厳密に証明し、反復の複雑さによって測定された最悪の収束率を提供します。私たちの調査は、タスク適応型ADMMを分析するための新しい視点を開発するだけでなく、実際のアプリケーションの実用的な最適化手法の設計に関する有意義なガイドラインも提供します。理論的な結果を検証し、アルゴリズムフレームワークの効率を実証するために、数値実験が行われます。
Along with the development of learning and vision, Alternating Direction Method of Multiplier (ADMM) has become a popular algorithm for separable optimization model with linear constraint. However, the ADMM and its numerical variants (e.g., inexact, proximal or linearized) are awkward to obtain state-of-the-art performance when dealing with complex learning and vision tasks due to their weak task-adaption ability. Recently, there has been an increasing interest in incorporating task-specific computational modules (e.g., designed filters or learned architectures) into ADMM iterations. Unfortunately, these task-related modules introduce uncontrolled and unstable iterative flows, they also break the structures of the original optimization model. Therefore, existing theoretical investigations are invalid for these resulted task-specific iterations. In this paper, we develop a simple and generic proximal ADMM framework to incorporate flexible task-specific module for learning and vision problems. We rigorously prove the convergence both in objective function values and the constraint violation and provide the worst-case convergence rate measured by the iteration complexity. Our investigations not only develop new perspectives for analyzing task-adaptive ADMM but also supply meaningful guidelines on designing practical optimization methods for real-world applications. Numerical experiments are conducted to verify the theoretical results and demonstrate the efficiency of our algorithmic framework.