ディープコンボリューショナルネットワーク(ConvNet)構造自体を画像事前分布として利用するディープイメージ事前分布(DIP)は、コンピュータービジョンおよび機械学習コミュニティで注目されています。さまざまな画像復元アプリケーションに対するConvNet構造の有効性を経験的に示しています。ただし、DIPが非常にうまく機能する理由はまだ不明であり、畳み込み演算が画像の再構成または強調に役立つ理由はあまり明確ではありません。この研究では、これらの質問に取り組みます。提案されたアプローチは、畳み込みを「遅延埋め込み」と「変換(すなわちエンコーダーデコーダー)」に分割し、動的システムと自己に密接に関連するシンプルだが必須の画像/テンソルモデリング手法を提案しています-類似性。埋め込み空間での多様体モデリング(MMES)と名付けられた提案手法は、マルチウェイ遅延埋め込み変換と組み合わせた新規ノイズ除去オートエンコーダーを使用して実装されます。シンプルであるにもかかわらず、MMESの画像/テンソルの完了、超解像、デコンボリューション、ノイズ除去の結果は、広範な実験でDIPと競合することさえあり、これらの結果は、DIPの観点からの再解釈/特性評価に役立ちます「低次元パッチ多様体事前」の
Deep image prior (DIP), which utilizes a deep convolutional network (ConvNet) structure itself as an image prior, has attracted attentions in computer vision and machine learning communities. It empirically shows the effectiveness of ConvNet structure for various image restoration applications. However, why the DIP works so well is still unknown, and why convolution operation is useful for image reconstruction or enhancement is not very clear. In this study, we tackle these questions. The proposed approach is dividing the convolution into ``delay-embedding'' and ``transformation (i.e. encoder-decoder)'', and proposing a simple, but essential, image/tensor modeling method which is closely related to dynamical systems and self-similarity. The proposed method named as manifold modeling in embedded space (MMES) is implemented by using a novel denoising-auto-encoder in combination with multi-way delay-embedding transform. In spite of its simplicity, the image/tensor completion, super-resolution, deconvolution, and denoising results of MMES are quite similar even competitive to DIP in our extensive experiments, and these results would help us for reinterpreting/characterizing the DIP from a perspective of ``low-dimensional patch-manifold prior''.