arXiv reaDer
Transframer:生成モデルを使用した任意のフレーム予測
Transframer: Arbitrary Frame Prediction with Generative Models
確率的フレーム予測に基づく画像モデリングとビジョンタスクのための汎用フレームワークを提示します。私たちのアプローチは、画像のセグメンテーションから、新しいビューの合成やビデオの補間まで、幅広いタスクを統合します。このフレームワークを、トランスフレーマーと呼ばれるアーキテクチャと組み合わせます。トランスフレーマーは、U-NetおよびTransformerコンポーネントを使用して、注釈付きコンテキストフレームを条件付け、スパースで圧縮された画像特徴のシーケンスを出力します。 Transframerは、さまざまなビデオ生成ベンチマークの最先端であり、数ショットのビュー合成で最も強力なモデルと競合し、明示的な幾何学的情報なしで単一の画像からコヒーレントな30秒のビデオを生成できます。単一のジェネラリストTransframerは、セマンティックセグメンテーション、画像分類、およびタスク固有のアーキテクチャコンポーネントを使用しないオプティカルフロー予測を含む、8つのタスクで同時に有望な結果を生成し、確率的画像モデルを使用してマルチタスクコンピュータービジョンに取り組むことができることを示します。私たちのアプローチは、原則として、注釈付きの画像形式データの条件付き構造を学習する必要がある幅広いアプリケーションに適用できます。
We present a general-purpose framework for image modelling and vision tasks based on probabilistic frame prediction. Our approach unifies a broad range of tasks, from image segmentation, to novel view synthesis and video interpolation. We pair this framework with an architecture we term Transframer, which uses U-Net and Transformer components to condition on annotated context frames, and outputs sequences of sparse, compressed image features. Transframer is the state-of-the-art on a variety of video generation benchmarks, is competitive with the strongest models on few-shot view synthesis, and can generate coherent 30 second videos from a single image without any explicit geometric information. A single generalist Transframer simultaneously produces promising results on 8 tasks, including semantic segmentation, image classification and optical flow prediction with no task-specific architectural components, demonstrating that multi-task computer vision can be tackled using probabilistic image models. Our approach can in principle be applied to a wide range of applications that require learning the conditional structure of annotated image-formatted data.
updated: Mon May 09 2022 17:02:49 GMT+0000 (UTC)
published: Thu Mar 17 2022 17:48:32 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト