arXiv reaDer
制限された情報フローによる解きほぐされた監視されていない画像の翻訳
Disentangled Unsupervised Image Translation via Restricted Information Flow
教師なし画像から画像への変換方法は、2つのドメイン間で共有される構造を維持しながら、あるドメインの画像を別のドメインのもっともらしい例にマッピングすることを目的としています。多対多の設定では、ターゲットドメインからの追加のガイダンス例を使用して、生成されたイメージのドメイン固有の属性を決定します。属性アノテーションがない場合、メソッドはトレーニング中のデータから各ドメインに固有の要素を推測する必要があります。多くの最先端の方法では、必要な共有と特定の分割をアーキテクチャにハードコーディングしているため、問題の範囲が大幅に制限されています。この論文では、そのような帰納的なアーキテクチャのバイアスに依存しない新しい方法を提案し、翻訳の正直さの損失とドメイン固有の容量のペナルティを使用してネットワークを介した情報フローを制限することにより、データからどの属性がドメイン固有であるかを推測します埋め込み。提案された方法が、さまざまなドメイン固有の共有属性にまたがる2つの合成データセットと1つの自然データセットにわたって一貫して高い操作精度を達成することを示します。
Unsupervised image-to-image translation methods aim to map images from one domain into plausible examples from another domain while preserving structures shared across two domains. In the many-to-many setting, an additional guidance example from the target domain is used to determine domain-specific attributes of the generated image. In the absence of attribute annotations, methods have to infer which factors are specific to each domain from data during training. Many state-of-art methods hard-code the desired shared-vs-specific split into their architecture, severely restricting the scope of the problem. In this paper, we propose a new method that does not rely on such inductive architectural biases, and infers which attributes are domain-specific from data by constraining information flow through the network using translation honesty losses and a penalty on the capacity of domain-specific embedding. We show that the proposed method achieves consistently high manipulation accuracy across two synthetic and one natural dataset spanning a wide variety of domain-specific and shared attributes.
updated: Fri Nov 26 2021 00:27:54 GMT+0000 (UTC)
published: Fri Nov 26 2021 00:27:54 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト