arXiv reaDer
SMR: 機械認識指向の画像およびビデオ圧縮のための Satisfied Machine Ratio Modeling
SMR: Satisfied Machine Ratio Modeling for Machine Recognition-Oriented Image and Video Compression
視覚認識のために、大量の画像やビデオが常に機械に送られています。ヒューマン ビジョン システム (HVS) と同様に、マシン ビジョン システム (MVS) は画質に敏感です。品質の低下が情報の損失や認識の失敗につながるからです。近年、MVS をターゲットとした画像処理、特に画像とビデオの圧縮が登場しました。ただし、既存の方法は、一般的なマシン コミュニティではなく、個々のマシンのみを対象としているため、すべてのタイプのマシンを満足させることはできません。さらに、MVS の特性が十分に活用されていないため、圧縮効率が制限されます。このホワイト ペーパーでは、これらの問題に対処するための新しい概念、Satisfied Machine Ratio (SMR) を紹介します。 SMR は、大量かつ多様なマシンの被験者から満足度スコアを収集して組み合わせることにより、マシンの観点から画質を統計的に測定します。このようなスコアは、MVS の特性を適切に考慮して取得されます。 SMR 研究用の 2,200 万を超える注釈付き画像を含む最初の大規模な SMR データセットを作成します。さらに、特定の圧縮画像またはビデオ フレームの SMR を予測するために、深層学習ベースのモデルが提案されています。広範な実験により、SMR モデルを使用すると、機械認識指向の画像およびビデオ圧縮のパフォーマンスが大幅に向上することが示されています。また、SMR モデルは、目に見えないマシン、圧縮フレームワーク、およびデータセットにうまく一般化されます。
Tons of images and videos are fed into machines for visual recognition all the time. Like human vision system (HVS), machine vision system (MVS) is sensitive to image quality, as quality degradation leads to information loss and recognition failure. In recent years, MVS-targeted image processing, particularly image and video compression, has emerged. However, existing methods only target an individual machine rather than the general machine community, thus cannot satisfy every type of machine. Moreover, the MVS characteristics are not well leveraged, which limits compression efficiency. In this paper, we introduce a new concept, Satisfied Machine Ratio (SMR), to address these issues. SMR statistically measures the image quality from the machine's perspective by collecting and combining satisfaction scores from a large quantity and variety of machine subjects, where such scores are obtained with MVS characteristics considered properly. We create the first large-scale SMR dataset that contains over 22 million annotated images for SMR studies. Furthermore, a deep learning-based model is proposed to predict the SMR for any given compressed image or video frame. Extensive experiments show that using the SMR model can significantly improve the performance of machine recognition-oriented image and video compression. And the SMR model generalizes well to unseen machines, compression frameworks, and datasets.
updated: Sun Nov 13 2022 03:16:36 GMT+0000 (UTC)
published: Sun Nov 13 2022 03:16:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト