arXiv reaDer
DDColor: デュアル デコーダーによる写真のようにリアルでセマンティックを意識した画像の色付けに向けて
DDColor: Towards Photo-Realistic and Semantic-Aware Image Colorization via Dual Decoders
画像の自動カラー化は難しい問題です。高い病気とマルチモーダルの不確実性のため、ディープ ニューラル ネットワークを直接トレーニングすると、通常、セマンティック カラーが不正確になり、色の豊富さが低下します。最近の変換器ベースの方法はより良い結果をもたらすことができますが、多くの場合、実装が難しく、一般化能力が低い手動で設計された事前確率に依存しています。さらに、色の注意は単一スケールの機能で実行されるため、深刻な色のにじみ効果が発生する傾向があり、十分なセマンティック情報を活用できません。これらの問題に対処するために、画像の色付けのためのデュアルデコーダーを備えた新しいエンドツーエンドの方法である DDColor を提案します。私たちのアプローチには、マルチスケール イメージ デコーダーとトランスフォーマー ベースのカラー デコーダーが含まれます。前者は画像の空間解像度を復元し、後者は相互注意を介して色と意味表現の間の相関関係を確立します。追加の事前確率を使用するのではなく、2 つのデコーダーが連携してマルチスケール画像機能を活用し、アダプティブ カラー クエリの最適化を導き、色のにじみ効果を大幅に軽減します。さらに、生成された結果の色の豊かさをさらに高めるために、シンプルでありながら効果的なカラフルネスの損失が導入されました。私たちの広範な実験は、DDColor が既存の最先端の作品よりも量的にも質的にも大幅に優れたパフォーマンスを達成することを示しています。コードは https://github.com/piddnad/DDColor で公開されます。
Automatic image colorization is a challenging problem. Due to the high illness and multi-modal uncertainty, directly training a deep neural network usually leads to incorrect semantic colors and low color richness. Recent transformer-based methods can deliver better results, but they often rely on manually designed priors, which are hard to implement and suffer from poor generalization ability. Moreover, they tend to introduce serious color bleeding effects since color attention is performed on single-scale features, thus fail to exploit sufficient semantic information. To address these issues, we propose DDColor, a new end-to-end method with dual decoders for image colorization. Our approach includes a multi-scale image decoder and a transformer-based color decoder. The former restores the spatial resolution of the image, while the latter establishes the correlation between color and semantic representations via cross-attention. Rather than using additional priors, our two decoders work together to leverage multi-scale image features to guide optimization of adaptive color queries, significantly alleviating color bleeding effects. In addition, a simple yet effective colorfulness loss is introduced to further enhance the color richness of generated results. Our extensive experiments demonstrate that DDColor achieves significantly superior performance to existing state-of-the-art works both quantitatively and qualitatively. Codes will be made publicly available at https://github.com/piddnad/DDColor.
updated: Wed Apr 12 2023 06:32:37 GMT+0000 (UTC)
published: Thu Dec 22 2022 11:17:57 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト