arXiv reaDer
ビデオ処理における機械学習の透過的応用に向けて
Towards Transparent Application of Machine Learning in Video Processing
ディープラーニングの飛躍的進歩のおかげで、より効率的なビデオ圧縮とビデオエンハンスメントのための機械学習技術が開発されました。人工知能(AI)の高度な形式と見なされる新しい技術は、これまで予期していなかった機能をもたらします。ただし、これらは通常、リソースを大量に消費するブラックボックスの形式で提供されます(複雑すぎて内部の動作に関する透明性がほとんどありません)。したがって、それらのアプリケーションは予測不可能であり、大規模な使用(ライブ放送など)では一般的に信頼性が低い可能性があります。この作業の目的は、ビデオ処理アプリケーションで学習したモデルを理解して最適化し、それらを組み込んだシステムをより信頼できる方法で使用できるようにすることです。これに関連して、提示された作業では、ビデオ制作および配信アプリケーションの機械学習を実装する際の透明性の向上を目的とした、学習モデルの簡素化の原則を紹介します。これらの原則は、ビデオ圧縮の例で示され、関連する深層学習モデルを単純化することでビットレートの節約と複雑さの軽減を実現する方法を示しています。
Machine learning techniques for more efficient video compression and video enhancement have been developed thanks to breakthroughs in deep learning. The new techniques, considered as an advanced form of Artificial Intelligence (AI), bring previously unforeseen capabilities. However, they typically come in the form of resource-hungry black-boxes (overly complex with little transparency regarding the inner workings). Their application can therefore be unpredictable and generally unreliable for large-scale use (e.g. in live broadcast). The aim of this work is to understand and optimise learned models in video processing applications so systems that incorporate them can be used in a more trustworthy manner. In this context, the presented work introduces principles for simplification of learned models targeting improved transparency in implementing machine learning for video production and distribution applications. These principles are demonstrated on video compression examples, showing how bitrate savings and reduced complexity can be achieved by simplifying relevant deep learning models.
updated: Thu May 27 2021 09:35:54 GMT+0000 (UTC)
published: Wed May 26 2021 17:24:23 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト