Fast End-to-End Trainable Guided Filter
  Fully Convolutional Networks(FCN)の機能を活用することにより、高密度のピクセル単位の画像予測が進歩しました。 FCNの中心的な問題の1つは、共同アップサンプリングを処理する能力の制限です。この問題に対処するために、FCNの新しいビルディングブロック、つまりガイド付きフィルターレイヤーを提示します。これは、対応する低解像度の1つと高解像度のガイダンスマップが与えられると、高解像度の出力を効率的に生成するように設計されています。このような層には学習可能なパラメーターが含まれており、FCNと統合し、エンドツーエンドのトレーニングを通じて共同で最適化できます。エンドツーエンドのトレーニングをさらに活用するために、トレーニング可能な変換関数をプラグインして、タスク固有のガイダンスマップを生成します。提案された層に基づいて、ピクセル単位の画像予測のための一般的なフレームワーク、Deep Guided Filtering Network(DGF)を提示します。提案されたネットワークは、5つの画像処理タスクで評価されます。 MIT-Adobe FiveK Datasetの実験は、DGFの実行速度が10〜100倍速く、最先端のパフォーマンスを達成することを示しています。また、DGFが複数のコンピュータービジョンタスクのパフォーマンスの向上に役立つことも示しています。
Dense pixel-wise image prediction has been advanced by harnessing the capabilities of Fully Convolutional Networks (FCNs). One central issue of FCNs is the limited capacity to handle joint upsampling. To address the problem, we present a novel building block for FCNs, namely guided filtering layer, which is designed for efficiently generating a high-resolution output given the corresponding low-resolution one and a high-resolution guidance map. Such a layer contains learnable parameters, which can be integrated with FCNs and jointly optimized through end-to-end training. To further take advantage of end-to-end training, we plug in a trainable transformation function for generating the task-specific guidance map. Based on the proposed layer, we present a general framework for pixel-wise image prediction, named deep guided filtering network (DGF). The proposed network is evaluated on five image processing tasks. Experiments on MIT-Adobe FiveK Dataset demonstrate that DGF runs 10-100 times faster and achieves the state-of-the-art performance. We also show that DGF helps to improve the performance of multiple computer vision tasks.
updated: Wed Sep 25 2019 07:58:10 GMT+0000 (UTC)
published: Thu Mar 15 2018 07:31:24 GMT+0000 (UTC)
