arXiv reaDer
データの過剰適合:コンテンツ対応機能変調によるコンパクトなニューラルビデオ配信
Overfitting the Data: Compact Neural Video Delivery via Content-aware Feature Modulation
インターネットビデオ配信は、過去数年間で驚異的な成長を遂げました。ただし、ビデオ配信システムの品質は、インターネットの帯域幅に大きく依存します。ディープニューラルネットワーク(DNN)は、最近、ビデオ配信の品質を向上させるために利用されています。これらのメソッドは、ビデオをチャンクに分割し、LRビデオチャンクと対応するコンテンツ対応モデルをクライアントにストリーミングします。クライアントはモデルの推論を実行して、LRチャンクを超解像します。その結果、ビデオを配信するために多数のモデルがストリーミングされます。このホワイトペーパーでは、最初に異なるチャンクのモデル間の関係を注意深く研究し、次にコンテンツ対応機能変調(CaFM)レイヤーとともに共同トレーニングフレームワークを巧みに設計して、ニューラルビデオ配信用にこれらのモデルを圧縮します。私たちの方法では、各ビデオチャンクはストリーミングされる元のパラメーターの1%未満しか必要とせず、さらに優れたSRパフォーマンスを実現します。この方法の利点を実証するために、さまざまなSRバックボーン、ビデオ時間の長さ、およびスケーリング係数にわたって広範な実験を実施します。その上、私たちの方法は、ビデオコーディングの新しいアプローチと見なすこともできます。私たちの主要な実験は、同じストレージコストで市販のH.264およびH.265標準と比較してより良いビデオ品質を達成し、提案された方法の大きな可能性を示しています。コードは次の場所で入手できます:https://github.com/Neural-video-delivery/CaFM-Pytorch-ICCV2021
Internet video delivery has undergone a tremendous explosion of growth over the past few years. However, the quality of video delivery system greatly depends on the Internet bandwidth. Deep Neural Networks (DNNs) are utilized to improve the quality of video delivery recently. These methods divide a video into chunks, and stream LR video chunks and corresponding content-aware models to the client. The client runs the inference of models to super-resolve the LR chunks. Consequently, a large number of models are streamed in order to deliver a video. In this paper, we first carefully study the relation between models of different chunks, then we tactfully design a joint training framework along with the Content-aware Feature Modulation (CaFM) layer to compress these models for neural video delivery. With our method, each video chunk only requires less than 1% of original parameters to be streamed, achieving even better SR performance. We conduct extensive experiments across various SR backbones, video time length, and scaling factors to demonstrate the advantages of our method. Besides, our method can be also viewed as a new approach of video coding. Our primary experiments achieve better video quality compared with the commercial H.264 and H.265 standard under the same storage cost, showing the great potential of the proposed method. Code is available at:https://github.com/Neural-video-delivery/CaFM-Pytorch-ICCV2021
updated: Fri Sep 17 2021 14:24:07 GMT+0000 (UTC)
published: Wed Aug 18 2021 15:34:11 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト