arXiv reaDer
制約付きディープネットワーク:ログバリア拡張によるラグランジュ最適化
Constrained Deep Networks: Lagrangian Optimization via Log-Barrier Extensions
 この研究は、CNNの出力に厳しい不等式制約を課すことの最適化の側面を調査します。ディープネットワークのコンテキストでは、制約はよく知られている制限にもかかわらず、その単純さのためにペナルティで一般的に処理されます。最近のいくつかの作業を除いて、主に明示的なデュアル更新/射影と確率的最適化を交互に行うことによって生じる計算の複雑さと安定性/収束の問題のため、ラグランジュ双対最適化は大幅に回避されました。いくつかの研究は、驚くべきことに、深いCNNに対して、ペナルティよりもラグランジュ最適化の理論的および実用的な利点が実際には実現しないことを示しました。一連の非制約損失を伴う制約付きCNN問題のラグランジュ最適化を近似する対数バリア拡張を提案します。標準の内点法や対数バリア法とは異なり、私たちの定式化は最初に実行可能なソリューションを必要としません。さらに、提案された拡張が双対性ギャップの上限をもたらすことを示す新しい技術結果を提供します。これにより、標準のログバリアの二元性ギャップの結果が一般化され、実現可能なソリューションの準最適性証明書が生成されます。非凸問題については準最適性は保証されていませんが、私たちの結果は、対数バリア拡張が、暗黙の二重変数を介して制約付きCNNのラグランジュ最適化を近似する原理的な方法であることを示しています。さまざまな制約のある、弱く監視された包括的なセグメンテーション実験を報告します。精度、制約の満足度、トレーニングの安定性の点で、既存の制約付きCNNの方法よりもはるかに多くの制約を処理する場合に、公式の性能が優れていることを示しています。
This study investigates the optimization aspects of imposing hard inequality constraints on the outputs of CNNs. In the context of deep networks, constraints are commonly handled with penalties for their simplicity, and despite their well-known limitations. Lagrangian-dual optimization has been largely avoided, except for a few recent works, mainly due to the computational complexity and stability/convergence issues caused by alternating explicit dual updates/projections and stochastic optimization. Several studies showed that, surprisingly for deep CNNs, the theoretical and practical advantages of Lagrangian optimization over penalties do not materialize in practice. We propose log-barrier extensions, which approximate Lagrangian optimization of constrained-CNN problems with a sequence of unconstrained losses. Unlike standard interior-point and log-barrier methods, our formulation does not need an initial feasible solution. Furthermore, we provide a new technical result, which shows that the proposed extensions yield an upper bound on the duality gap. This generalizes the duality-gap result of standard log-barriers, yielding sub-optimality certificates for feasible solutions. While sub-optimality is not guaranteed for non-convex problems, our result shows that log-barrier extensions are a principled way to approximate Lagrangian optimization for constrained CNNs via implicit dual variables. We report comprehensive weakly supervised segmentation experiments, with various constraints, showing that our formulation outperforms substantially the existing constrained-CNN methods, both in terms of accuracy, constraint satisfaction and training stability, more so when dealing with a large number of constraints.
updated: Tue Apr 14 2020 22:05:40 GMT+0000 (UTC)
published: Mon Apr 08 2019 17:25:46 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト