arXiv reaDer
全能の特徴学習を備えた機械の画像コーディング
Image Coding for Machines with Omnipotent Feature Learning
機械の画像コーディング(ICM)は、人間の知覚を満たすのではなく、AIタスク分析のために画像を圧縮することを目的としています。一般的(AIタスクの場合)とコンパクト(圧縮の場合)の両方である種類の機能を学習することは、その成功にとって極めて重要です。本論文では、圧縮も考慮しながら、普遍的な機能を学習することにより、ICMフレームワークの開発を試みます。このような機能を全能機能と呼び、対応するフレームワークをOmni-ICMと呼びます。自己教師あり学習(SSL)が機能の一般化を改善することを考慮して、圧縮タスクと統合してOmni-ICMフレームワークに統合し、全能の機能を学習します。ただし、SSLでのセマンティクスモデリングと圧縮での冗長性の削除を調整することは簡単ではないため、インスタンスの区別とエントロピーの最小化を共同最適化して、関連性の弱い情報を適応的にドロップすることにより、それらの間で新しい情報フィルタリング(IF)モジュールを設計します。 AIタスク(たとえば、テクスチャの冗長性)。以前のタスク固有のソリューションとは異なり、Omni-ICMは、共同トレーニングや追加の変換なしで、学習した全能の機能に基づいてAIタスク分析を直接サポートできます。シンプルで直感的ですが、Omni-ICMは、複数の基本的なビジョンタスクにおいて、既存の従来の学習ベースのコーデックを大幅に上回っています。
Image Coding for Machines (ICM) aims to compress images for AI tasks analysis rather than meeting human perception. Learning a kind of feature that is both general (for AI tasks) and compact (for compression) is pivotal for its success. In this paper, we attempt to develop an ICM framework by learning universal features while also considering compression. We name such features as omnipotent features and the corresponding framework as Omni-ICM. Considering self-supervised learning (SSL) improves feature generalization, we integrate it with the compression task into the Omni-ICM framework to learn omnipotent features. However, it is non-trivial to coordinate semantics modeling in SSL and redundancy removing in compression, so we design a novel information filtering (IF) module between them by co-optimization of instance distinguishment and entropy minimization to adaptively drop information that is weakly related to AI tasks (e.g., some texture redundancy). Different from previous task-specific solutions, Omni-ICM could directly support AI tasks analysis based on the learned omnipotent features without joint training or extra transformation. Albeit simple and intuitive, Omni-ICM significantly outperforms existing traditional and learning-based codecs on multiple fundamental vision tasks.
updated: Tue Jul 05 2022 10:13:11 GMT+0000 (UTC)
published: Tue Jul 05 2022 10:13:11 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト