arXiv reaDer
着色トランスフォーマー
Colorization Transformer
自己注意に基づく多様で忠実度の高い画像の色付けのための新しいアプローチであるColorizationTransformerを紹介します。グレースケール画像が与えられると、カラー化は3つのステップで進行します。まず、条件付き自己回帰トランスフォーマーを使用して、グレースケール画像の低解像度の粗いカラーリングを生成します。私たちのアーキテクチャは、条件付きトランスレイヤーを採用して、グレースケール入力を効果的に調整します。後続の2つの完全並列ネットワークは、粗い色の低解像度画像を細かい色の高解像度画像にアップサンプリングします。 Colorization Transformerからのサンプリングにより、さまざまなカラーリングが生成されます。その忠実度は、FIDの結果とMechanical Turkテストでの人間による評価に基づいて、ImageNetのカラーリングに関する以前の最先端技術を上回ります。驚くべきことに、60%以上の場合、人間の評価者は、グラウンドトゥルースよりも生成された3つの着色料の中で最も高い評価を好みます。 Colorization Transformerのコードと事前トレーニング済みのチェックポイントは、https://github.com/google-research/google-research/tree/master/coltranで公開されています。
We present the Colorization Transformer, a novel approach for diverse high fidelity image colorization based on self-attention. Given a grayscale image, the colorization proceeds in three steps. We first use a conditional autoregressive transformer to produce a low resolution coarse coloring of the grayscale image. Our architecture adopts conditional transformer layers to effectively condition grayscale input. Two subsequent fully parallel networks upsample the coarse colored low resolution image into a finely colored high resolution image. Sampling from the Colorization Transformer produces diverse colorings whose fidelity outperforms the previous state-of-the-art on colorising ImageNet based on FID results and based on a human evaluation in a Mechanical Turk test. Remarkably, in more than 60% of cases human evaluators prefer the highest rated among three generated colorings over the ground truth. The code and pre-trained checkpoints for Colorization Transformer are publicly available at https://github.com/google-research/google-research/tree/master/coltran
updated: Mon Feb 08 2021 18:45:06 GMT+0000 (UTC)
published: Mon Feb 08 2021 18:45:06 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト