arXiv reaDer
深層学習画像のカラー化のためのさまざまな損失の分析
Analysis of Different Losses for Deep Learning Image Colorization
画像のカラー化は、現実的な方法でグレースケール画像に色情報を追加することを目的としています。最近の方法は、主にディープラーニング戦略に依存しています。画像を自動的に色付けする方法を学びながら、目的の色出力に関連する適切な目的関数を定義できます。それらのいくつかは、予測された画像とグラウンドトゥルース画像の間の特定のタイプのエラーに基づいていますが、他の損失は知覚特性の比較に依存しています。しかし、目的関数の選択は重要ですか、つまり、結果に重要な役割を果たしますか?この章では、推定された着色結果に対する損失関数の影響を分析することにより、この質問に答えることを目指しています。その目標を達成するために、文献で使用されているさまざまな損失と評価指標を確認します。次に、レビューされた目的関数のいくつかを使用してベースラインネットワークをトレーニングします。従来のL1およびL2損失、およびWassersteinGANやVGGベースのLPIPS損失などのより複雑な組み合わせです。定量的な結果は、VGGベースのLPIPSでトレーニングされたモデルが、ほとんどの評価メトリックに対して全体的にわずかに優れた結果を提供することを示しています。ワッサースタインGANにL2損失を加えた場合、またはVGGベースのLPIPSを使用した場合、定性的な結果はより鮮やかな色を示します。最後に、特にグラウンドトゥルースが利用できない古いアーカイブ写真の場合に、カラー画像を適切に評価することの難しさを克服するために、定量的なユーザー調査の便利さについても説明します。
Image colorization aims to add color information to a grayscale image in a realistic way. Recent methods mostly rely on deep learning strategies. While learning to automatically colorize an image, one can define well-suited objective functions related to the desired color output. Some of them are based on a specific type of error between the predicted image and ground truth one, while other losses rely on the comparison of perceptual properties. But, is the choice of the objective function that crucial, i.e., does it play an important role in the results? In this chapter, we aim to answer this question by analyzing the impact of the loss function on the estimated colorization results. To that goal, we review the different losses and evaluation metrics that are used in the literature. We then train a baseline network with several of the reviewed objective functions: classic L1 and L2 losses, as well as more complex combinations such as Wasserstein GAN and VGG-based LPIPS loss. Quantitative results show that the models trained with VGG-based LPIPS provide overall slightly better results for most evaluation metrics. Qualitative results exhibit more vivid colors when with Wasserstein GAN plus the L2 loss or again with the VGG-based LPIPS. Finally, the convenience of quantitative user studies is also discussed to overcome the difficulty of properly assessing on colorized images, notably for the case of old archive photographs where no ground truth is available.
updated: Mon May 09 2022 17:12:32 GMT+0000 (UTC)
published: Wed Apr 06 2022 14:19:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト