arXiv reaDer
分析分類法における視覚的表現の再検討:圧縮の観点
Revisit Visual Representation in Analytics Taxonomy: A Compression Perspective
視覚分析は、大量の視覚信号を圧縮してマシンに供給する必要があるモノのインターネットでますます重要な役割を果たしています。しかし、そのようなビッグデータと制約された帯域幅容量に直面して、既存の画像/ビデオ圧縮方法は非常に低品質の表現につながりますが、既存の機能圧縮技術は低ビットレートの表現で多様な視覚分析アプリケーション/タスクをサポートできません。この論文では、圧縮された視覚表現で複数のマシンビジョン分析タスクをサポートするという新しい問題、つまり分析分類法における情報圧縮問題を提起し、研究します。異なるタスク間の固有の転送可能性を利用することにより、フレームワークは、高レベルのセマンティック関連タスクと中レベルのジオメトリ分析タスクの両方を含む、マシンビジョンタスクの多様なセットをサポートするために、低ビットレートでコンパクトで表現力豊かな表現を正常に構築します。表現にコンパクトさを課すために、コードブックベースのハイパープライアを提案します。これは、表現を低次元多様体にマッピングするのに役立ちます。深い視覚的特徴の信号構造によく適合するため、より正確なエントロピー推定が容易になり、圧縮効率が高くなります。提案されたフレームワークとコードブックベースのハイパープライアを使用して、さまざまなレベルの抽象化粒度を所有するさまざまなタスク機能の関係をさらに調査します。実験結果は、提案されたスキームを使用すると、既存の圧縮スキームと比較して、一連の多様なタスクを大幅に低いビットレートでサポートできることを示しています。
Visual analytics have played an increasingly critical role in the Internet of Things, where massive visual signals have to be compressed and fed into machines. But facing such big data and constrained bandwidth capacity, existing image/video compression methods lead to very low-quality representations, while existing feature compression techniques fail to support diversified visual analytics applications/tasks with low-bit-rate representations. In this paper, we raise and study the novel problem of supporting multiple machine vision analytics tasks with the compressed visual representation, namely, the information compression problem in analytics taxonomy. By utilizing the intrinsic transferability among different tasks, our framework successfully constructs compact and expressive representations at low bit-rates to support a diversified set of machine vision tasks, including both high-level semantic-related tasks and mid-level geometry analytic tasks. In order to impose compactness in the representations, we propose a codebook-based hyperprior, which helps map the representation into a low-dimensional manifold. As it well fits the signal structure of the deep visual feature, it facilitates more accurate entropy estimation, and results in higher compression efficiency. With the proposed framework and the codebook-based hyperprior, we further investigate the relationship of different task features owning different levels of abstraction granularity. Experimental results demonstrate that with the proposed scheme, a set of diversified tasks can be supported at a significantly lower bit-rate, compared with existing compression schemes.
updated: Wed Jun 16 2021 01:44:32 GMT+0000 (UTC)
published: Wed Jun 16 2021 01:44:32 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト