arXiv reaDer
2 羽の鳥、1 つの石: 画像とビデオのスタイル転送の共同学習のための統合フレームワーク
Two Birds, One Stone: A Unified Framework for Joint Learning of Image and Video Style Transfers
現在の任意のスタイル転送モデルは、画像またはビデオのドメインに限定されています。満足のいく画像とビデオのスタイル転送を実現するには、必然的に、画像とビデオのドメインごとに別々のトレーニング プロセスを持つ 2 つの異なるモデルが必要になります。このホワイト ペーパーでは、画像とビデオの両方に対応する統合スタイル転送フレームワークである UniST を導入することで、これを排除できることを示します。 UniST の中核にあるのは、ドメイン インタラクション トランスフォーマー (DIT) です。これは、最初に特定のドメイン内のコンテキスト情報を調査し、次に共同学習のためにコンテキスト化されたドメイン情報を相互作用させます。特に、DIT は、画像スタイル転送タスクのビデオからの時間情報の探索を可能にし、一方、ビデオ スタイル転送の画像からリッチな外観テクスチャを許可するため、相互の利益につながります。従来のマルチヘッド自己注意の重い計算を考慮して、スタイル転送パフォーマンスを維持しながら計算効率を向上させる、DIT 用のシンプルで効果的な軸方向マルチヘッド自己注意 (AMSA) を提示します。 UniST の有効性を検証するために、画像とビデオの両方のスタイル転送タスクで広範な実験を行い、UniST が両方のタスクで最先端のアプローチに対して有利に機能することを示します。コードと結果が公開されます。
Current arbitrary style transfer models are limited to either image or video domains. In order to achieve satisfying image and video style transfers, two different models are inevitably required with separate training processes on image and video domains, respectively. In this paper, we show that this can be precluded by introducing UniST, a Unified Style Transfer framework for both images and videos. At the core of UniST is a domain interaction transformer (DIT), which first explores context information within the specific domain and then interacts contextualized domain information for joint learning. In particular, DIT enables exploration of temporal information from videos for the image style transfer task and meanwhile allows rich appearance texture from images for video style transfer, thus leading to mutual benefits. Considering heavy computation of traditional multi-head self-attention, we present a simple yet effective axial multi-head self-attention (AMSA) for DIT, which improves computational efficiency while maintains style transfer performance. To verify the effectiveness of UniST, we conduct extensive experiments on both image and video style transfer tasks and show that UniST performs favorably against state-of-the-art approaches on both tasks. Our code and results will be released.
updated: Sat Apr 22 2023 07:15:49 GMT+0000 (UTC)
published: Sat Apr 22 2023 07:15:49 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト