この論文では、LDR画像からシーンのHDR画像を生成する問題について考察します。最近の研究では、ディープラーニングを採用し、エンドツーエンドで問題を解決しているため、パフォーマンスが大幅に向上しています。ただし、ハンドヘルドカメラでキャプチャされた動的シーンのLDR画像から高品質の画像を生成することは依然として困難です。たとえば、前景オブジェクトの大きな動きによるオクルージョンなど、ゴーストアーチファクトが発生します。成功の秘訣は、入力画像を特徴空間でどれだけうまく融合できるかにかかっています。ここでは、HDR画像生成の基本的な計算を実行しながら、低品質の画像生成につながる要因を取り除きます。たとえば、最適な露出を選択します。画像/地域。 2つのアイデアに基づいて、機能をより適切に融合できる新しい方法を提案します。 1つはマルチステップ機能の融合です。私たちのネットワークは、同じ構造を持つブロックのスタック内の機能を徐々に融合しています。もう1つは、問題に不可欠な2つの操作、つまり適切な画像/領域の比較と選択を効果的に実行するコンポーネントブロックの設計です。実験結果は、提案された方法が、標準的なベンチマークテストで以前の最先端の方法よりも優れていることを示しています。
This paper considers the problem of generating an HDR image of a scene from its LDR images. Recent studies employ deep learning and solve the problem in an end-to-end fashion, leading to significant performance improvements. However, it is still hard to generate a good quality image from LDR images of a dynamic scene captured by a hand-held camera, e.g., occlusion due to the large motion of foreground objects, causing ghosting artifacts. The key to success relies on how well we can fuse the input images in their feature space, where we wish to remove the factors leading to low-quality image generation while performing the fundamental computations for HDR image generation, e.g., selecting the best-exposed image/region. We propose a novel method that can better fuse the features based on two ideas. One is multi-step feature fusion; our network gradually fuses the features in a stack of blocks having the same structure. The other is the design of the component block that effectively performs two operations essential to the problem, i.e., comparing and selecting appropriate images/regions. Experimental results show that the proposed method outperforms the previous state-of-the-art methods on the standard benchmark tests.