arXiv reaDer
畳み込み解析演算子学習:加速と収束
Convolutional Analysis Operator Learning: Acceleration and Convergence
  畳み込み演算子の学習は、多くの信号処理およびコンピュータービジョンアプリケーションで注目を集めています。学習カーネルは、トレーニングシグナル全体で多くの重複するパッチを抽出して保存する、いわゆるパッチドメインアプローチにほぼ依存しています。メモリの需要により、特に畳み込みニューラルネットワークなどの多層構造を使用して大規模なデータセットからカーネルを学習する場合、または学習したカーネルを高次元の信号回復問題に適用する場合、パッチドメインメソッドには制限があります。いわゆる畳み込みアプローチは、多くの重複するパッチを保存しないため、特に注意深いアルゴリズム設計でメモリの問題を克服します。 「合成」信号モデル、たとえば、畳み込み辞書学習で研究されています。この論文は、畳み込みの観点で解析スパース化正則化器を学習する新しい畳み込み解析演算子学習(CAOL)フレームワークを提案し、マジョライザー(BPEG-M)を使用して対応するブロックマルチ非凸を解決する新しい収束ブロック近接外挿勾配法を開発します問題。 CAOLフレームワーク内の多様なフィルターを学習するために、このホワイトペーパーでは、タイトフレームフィルター条件を強制する直交性制約と、フィルター間の多様性を促進する正則化を紹介します。数値実験では、鋭いメジャーライザーを使用すると、BPEG-Mが最先端のブロック近位勾配(BPG)メソッドと比較してCAOL収束率を大幅に加速することを示しています。スパースビューコンピューター断層撮影の数値実験は、CAOLを介して学習した畳み込みスパース化正則化が従来のエッジ保存正則化と比較して再構成の品質を大幅に改善することを示しています。学習した正則化装置でより多くのより広いカーネルを使用すると、再構成された画像のエッジがよりよく保存されます。
Convolutional operator learning is gaining attention in many signal processing and computer vision applications. Learning kernels has mostly relied on so-called patch-domain approaches that extract and store many overlapping patches across training signals. Due to memory demands, patch-domain methods have limitations when learning kernels from large datasets -- particularly with multi-layered structures, e.g., convolutional neural networks -- or when applying the learned kernels to high-dimensional signal recovery problems. The so-called convolution approach does not store many overlapping patches, and thus overcomes the memory problems particularly with careful algorithmic designs; it has been studied within the "synthesis" signal model, e.g., convolutional dictionary learning. This paper proposes a new convolutional analysis operator learning (CAOL) framework that learns an analysis sparsifying regularizer with the convolution perspective, and develops a new convergent Block Proximal Extrapolated Gradient method using a Majorizer (BPEG-M) to solve the corresponding block multi-nonconvex problems. To learn diverse filters within the CAOL framework, this paper introduces an orthogonality constraint that enforces a tight-frame filter condition, and a regularizer that promotes diversity between filters. Numerical experiments show that, with sharp majorizers, BPEG-M significantly accelerates the CAOL convergence rate compared to the state-of-the-art block proximal gradient (BPG) method. Numerical experiments for sparse-view computational tomography show that a convolutional sparsifying regularizer learned via CAOL significantly improves reconstruction quality compared to a conventional edge-preserving regularizer. Using more and wider kernels in a learned regularizer better preserves edges in reconstructed images.
updated: Wed Sep 11 2019 10:03:54 GMT+0000 (UTC)
published: Thu Feb 15 2018 14:51:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト