arXiv reaDer
用途の広いビデオコーディングのための深層学習ベースのモード内導出
Deep Learning-Based Intra Mode Derivation for Versatile Video Coding
イントラコーディングでは、事前定義された候補リストから最適なイントラモードを実現するために、レート歪み最適化(RDO)が実行されます。最適なイントラモードは、多くのコーディングビットが消費される残差信号に加えて、エンコードしてデコーダ側に送信する必要もあります。 Versatile Video Coding(VVC)でのイントラコーディングのパフォーマンスをさらに向上させるために、この論文では、ディープラーニングベースのイントラモード導出(DLIMD)と呼ばれるインテリジェントなイントラモード導出方法を提案します。具体的には、モード内導出のプロセスは、コーディングビット削減のためのモード内シグナリングのモジュールをスキップすることを目的としたマルチクラス分類タスクとして定式化されます。 DLIMDのアーキテクチャは、さまざまな量子化パラメータ設定と、単一のトレーニング済みモデルによって処理される非正方形のものを含む可変コーディングブロックに適応するように開発されています。既存の深層学習ベースの分類問題とは異なり、特徴学習ネットワークから学習した特徴に加えて、手作りの特徴もモード内導出ネットワークに供給されます。従来の方法と競合するために、ビデオコーデックで1つの追加のバイナリフラグを使用して、RDOで選択されたスキームを示します。広範な実験結果は、提案された方法が、VVCテストモデルのプラットフォーム上のY、U、およびVコンポーネントの平均で2.28%、1.74%、および2.18%のビットレート削減を達成できることを示しています。動作します。
In intra coding, Rate Distortion Optimization (RDO) is performed to achieve the optimal intra mode from a pre-defined candidate list. The optimal intra mode is also required to be encoded and transmitted to the decoder side besides the residual signal, where lots of coding bits are consumed. To further improve the performance of intra coding in Versatile Video Coding (VVC), an intelligent intra mode derivation method is proposed in this paper, termed as Deep Learning based Intra Mode Derivation (DLIMD). In specific, the process of intra mode derivation is formulated as a multi-class classification task, which aims to skip the module of intra mode signaling for coding bits reduction. The architecture of DLIMD is developed to adapt to different quantization parameter settings and variable coding blocks including non-square ones, which are handled by one single trained model. Different from the existing deep learning based classification problems, the hand-crafted features are also fed into the intra mode derivation network besides the learned features from feature learning network. To compete with traditional method, one additional binary flag is utilized in the video codec to indicate the selected scheme with RDO. Extensive experimental results reveal that the proposed method can achieve 2.28%, 1.74%, and 2.18% bit rate reduction on average for Y, U, and V components on the platform of VVC test model, which outperforms the state-of-the-art works.
updated: Fri Apr 08 2022 13:23:59 GMT+0000 (UTC)
published: Fri Apr 08 2022 13:23:59 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト