arXiv reaDer
ID-Unet:ビュー合成のための反復的なソフトおよびハード変形
ID-Unet: Iterative Soft and Hard Deformation for View Synthesis
ビュー合成は通常、オートエンコーダーによって実行されます。このオートエンコーダーでは、エンコーダーがソースビュー画像を潜在的なコンテンツコードにマッピングし、デコーダーが条件に応じてそれをターゲットビュー画像に変換します。ただし、ソースコンテンツがこの設定で適切に保持されないことが多く、ビューの変換中に不要な変更が発生します。 Unetのようにスキップされた接続を追加すると問題は軽減されますが、ビューの適合性に失敗することがよくあります。この論文では、ソースからターゲットへの変形を反復的に実行することにより、新しいアーキテクチャを提案します。エンコーダーの複数のレイヤーの機能を単純に組み込むのではなく、ソフトおよびハードの変形モジュールを設計します。これにより、エンコーダーの機能がさまざまな解像度でターゲットビューにワープされ、詳細を補完する結果がデコーダーに提供されます。特に、現在のワーピングフローは、同じ解像度のフィーチャを位置合わせするためだけでなく、高解像度のフィーチャを粗く変形するための近似としても使用されます。次に、残留流が推定され、高解像度で適用されるため、変形は粗いものから細かいものへと蓄積されます。モデルをより適切に制約するために、中間フローとそのワープされた特徴に基づいて、大まかなターゲットビュー画像を合成します。広範なアブレーション研究と2つの異なるデータセットの最終結果は、提案されたモデルの有効性を示しています。
View synthesis is usually done by an autoencoder, in which the encoder maps a source view image into a latent content code, and the decoder transforms it into a target view image according to the condition. However, the source contents are often not well kept in this setting, which leads to unnecessary changes during the view translation. Although adding skipped connections, like Unet, alleviates the problem, but it often causes the failure on the view conformity. This paper proposes a new architecture by performing the source-to-target deformation in an iterative way. Instead of simply incorporating the features from multiple layers of the encoder, we design soft and hard deformation modules, which warp the encoder features to the target view at different resolutions, and give results to the decoder to complement the details. Particularly, the current warping flow is not only used to align the feature of the same resolution, but also as an approximation to coarsely deform the high resolution feature. Then the residual flow is estimated and applied in the high resolution, so that the deformation is built up in the coarse-to-fine fashion. To better constrain the model, we synthesize a rough target view image based on the intermediate flows and their warped features. The extensive ablation studies and the final results on two different data sets show the effectiveness of the proposed model.
updated: Wed Mar 03 2021 09:02:00 GMT+0000 (UTC)
published: Wed Mar 03 2021 09:02:00 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト