arXiv reaDer
学習主導の非可逆画像圧縮;包括的な調査
Learning-Driven Lossy Image Compression; A Comprehensive Survey
画像処理とコンピュータビジョン(CV)の分野では、機械学習(ML)アーキテクチャが広く適用されています。畳み込みニューラルネットワーク(CNN)は、さまざまな画像処理の問題を解決し、画像圧縮の問題を解決できます。帯域幅とメモリの制約により、画像の圧縮が必要です。有用で冗長で無関係な情報は、画像に見られる3つの異なる形式の情報です。このペーパーは、畳み込みオートエンコーダー(CAE)、変分オートエンコーダー(VAE)などのさまざまなオートエンコーダー(AE)、およびハイパープライアモデルを備えたAEを含むMLアーキテクチャを使用して、ほとんど損失のある画像圧縮を利用する最近の手法を調査することを目的としています。ニューラルネットワーク(RNN)、CNN、生成的敵対的ネットワーク(GAN)、主成分分析(PCA)、およびファジーはクラスタリングを意味します。すべてのアルゴリズムを、アーキテクチャに基づいていくつかのグループに分割します。この調査では、静止画像の圧縮について説明します。研究者のためのさまざまな発見が強調されており、研究者にとっての将来の方向性が考えられます。メモリ不足(OOM)、ストライプ領域歪み(SRD)、エイリアシング、およびフレームワークと中央処理装置(CPU)およびグラフィックス処理装置(GPU)との互換性などのオープンリサーチの問題について説明します。調査された圧縮ドメインの出版物の大部分は過去5年間のものであり、さまざまなアプローチを使用しています。
In the realm of image processing and computer vision (CV), machine learning (ML) architectures are widely applied. Convolutional neural networks (CNNs) solve a wide range of image processing issues and can solve image compression problem. Compression of images is necessary due to bandwidth and memory constraints. Helpful, redundant, and irrelevant information are three different forms of information found in images. This paper aims to survey recent techniques utilizing mostly lossy image compression using ML architectures including different auto-encoders (AEs) such as convolutional auto-encoders (CAEs), variational auto-encoders (VAEs), and AEs with hyper-prior models, recurrent neural networks (RNNs), CNNs, generative adversarial networks (GANs), principal component analysis (PCA) and fuzzy means clustering. We divide all of the algorithms into several groups based on architecture. We cover still image compression in this survey. Various discoveries for the researchers are emphasized and possible future directions for researchers. The open research problems such as out of memory (OOM), striped region distortion (SRD), aliasing, and compatibility of the frameworks with central processing unit (CPU) and graphics processing unit (GPU) simultaneously are explained. The majority of the publications in the compression domain surveyed are from the previous five years and use a variety of approaches.
updated: Sun Jan 23 2022 12:11:31 GMT+0000 (UTC)
published: Sun Jan 23 2022 12:11:31 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト