arXiv reaDer
画像から画像への変換にローカルドメインを活用する
Leveraging Local Domains for Image-to-Image Translation
Image-to-Image(i2i)ネットワークは、グローバルシーン構造に影響を与えないため、ローカルの変更をキャプチャするのに苦労します。たとえば、高速道路のシーンからオフロードに変換する場合、i2iネットワークはグローバルな色の特徴に簡単に焦点を合わせますが、車線のマーキングがないなど、人間の明らかな特性を無視します。このホワイトペーパーでは、「ローカルドメイン」と呼ばれる空間ドメインの特性に関する人間の知識を活用し、画像から画像への変換におけるその利点を示します。単純な幾何学的ガイダンスに依存して、いくつかのソースデータでパッチベースのGANをトレーニングし、新しい目に見えないドメインを幻覚化します。これにより、ターゲットへの転送学習が容易になります。構造化されていない環境から悪天候まで、3つのタスクを実験します。私たちの包括的な評価設定は、最小限の事前確率で現実的な翻訳を生成でき、少数の画像でのみトレーニングできることを示しています。さらに、翻訳画像でトレーニングを行うと、トレーニング時にターゲットドメインが表示されることなく、テストされたすべてのプロキシタスクが大幅に改善されることがわかります。
Image-to-image (i2i) networks struggle to capture local changes because they do not affect the global scene structure. For example, translating from highway scenes to offroad, i2i networks easily focus on global color features but ignore obvious traits for humans like the absence of lane markings. In this paper, we leverage human knowledge about spatial domain characteristics which we refer to as 'local domains' and demonstrate its benefit for image-to-image translation. Relying on a simple geometrical guidance, we train a patch-based GAN on few source data and hallucinate a new unseen domain which subsequently eases transfer learning to target. We experiment on three tasks ranging from unstructured environments to adverse weather. Our comprehensive evaluation setting shows we are able to generate realistic translations, with minimal priors, and training only on a few images. Furthermore, when trained on our translations images we show that all tested proxy tasks are significantly improved, without ever seeing target domain at training.
updated: Thu Sep 09 2021 17:59:52 GMT+0000 (UTC)
published: Thu Sep 09 2021 17:59:52 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト