arXiv reaDer
CLICPフレームコーディングのための強化された再構成を備えた学習済みビデオコーデック
Learned Video Codec with Enriched Reconstruction for CLIC P-frame Coding
このホワイトペーパーでは、学習ベースのビデオコーデックを提案します。特に、学習済み画像圧縮のチャレンジ(CLIC、CVPRWorkshop)2020Pフレームコーディングに使用されます。具体的には、残差信号と動きベクトルをコーディングするために、Refine-Netを使用してコンプレッサーネットワークを設計しました。また、動き推定のために、階層的な注意ベースのME-Netを導入しました。設計を検証するために、モジュールとさまざまな入力形式について広範なアブレーション調査を実施しました。私たちのビデオコーデックは、CLIC P-frame Challengeで指定されたデコーダー側で完全な参照フレームを使用することにより、そのパフォーマンスを示しています。実験結果は、提案されたコーデックが品質メトリックの点でチャレンジのトップパフォーマーと非常に競争力があることを示しています。
This paper proposes a learning-based video codec, specifically used for Challenge on Learned Image Compression (CLIC, CVPRWorkshop) 2020 P-frame coding. More specifically, we designed a compressor network with Refine-Net for coding residual signals and motion vectors. Also, for motion estimation, we introduced a hierarchical, attention-based ME-Net. To verify our design, we conducted an extensive ablation study on our modules and different input formats. Our video codec demonstrates its performance by using the perfect reference frame at the decoder side specified by the CLIC P-frame Challenge. The experimental result shows that our proposed codec is very competitive with the Challenge top performers in terms of quality metrics.
updated: Mon Dec 14 2020 12:32:46 GMT+0000 (UTC)
published: Mon Dec 14 2020 12:32:46 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト