従来の画像サイズ変更方法は通常、ピクセルスペースで機能し、さまざまな顕著性測定を使用します。重要なコンテンツを保存しながら、画像の形状を調整することが課題です。この論文では、ニューラルネットワークの深層に豊富な重要な意味情報が含まれている特徴空間で画像のサイズ変更を実行します。事前にトレーニングされた分類ネットワークから抽出された画像特徴マップを直接調整し、ニューラルネットワークベースの最適化を使用してサイズ変更された画像を再構築します。この斬新なアプローチは、ネットワークの階層的エンコーディング、特に、セマンティックオブジェクトと領域を認識し、それらのアスペクト比を維持できる、より深い層の高レベルの識別力を活用します。深い特徴からの再構成を使用すると、画像空間のサイズ変更演算子によって導入されるアーティファクトが減少します。私たちはベンチマークで私たちの方法を評価し、代替アプローチと比較し、挑戦的な画像でその強さを示します。
Traditional image resizing methods usually work in pixel space and use various saliency measures. The challenge is to adjust the image shape while trying to preserve important content. In this paper we perform image resizing in feature space where the deep layers of a neural network contain rich important semantic information. We directly adjust the image feature maps, extracted from a pre-trained classification network, and reconstruct the resized image using a neural-network based optimization. This novel approach leverages the hierarchical encoding of the network, and in particular, the high-level discriminative power of its deeper layers, that recognizes semantic objects and regions and allows maintaining their aspect ratio. Our use of reconstruction from deep features diminishes the artifacts introduced by image-space resizing operators. We evaluate our method on benchmarks, compare to alternative approaches, and demonstrate its strength on challenging images.