arXiv reaDer
Transform and Bitstream Domain Image Classification
圧縮ドメイン内の画像の分類には、大きなメリットがあります。これらの利点には、分類システムのメモリと計算要件の削減が含まれます。このホワイトペーパーでは、概念実証として2つの方法を提案します。1つ目は、JPEG画像変換ドメイン(つまり、DCT変換データ)内で分類します。 2つ目は、JPEG圧縮バイナリビットストリームを直接分類します。これらの2つの方法は、Residual NetworkCNNと適応されたVisionTransformerを使用して実装されます。 Caltech C101データベースを分類する際に、これらの方法を使用して、それぞれ約70%と60%のトップ1精度が達成されました。これらの結果は、このデータベースの分類に関する最新技術(〜95%)に大きく遅れをとっていますが、直接ビットストリーム画像分類が初めて達成されたことを示しています。この作業は、直接ビットストリーム画像分類が可能であり、生のビットストリーム(有線または無線ネットワーク内)のファーストパスデータベーススクリーニングで、または計算、メモリ、および帯域幅の要件が厳しく制限されている場合に利用できることを確認します。
Classification of images within the compressed domain offers significant benefits. These benefits include reduced memory and computational requirements of a classification system. This paper proposes two such methods as a proof of concept: The first classifies within the JPEG image transform domain (i.e. DCT transform data); the second classifies the JPEG compressed binary bitstream directly. These two methods are implemented using Residual Network CNNs and an adapted Vision Transformer. Top-1 accuracy of approximately 70% and 60% were achieved using these methods respectively when classifying the Caltech C101 database. Although these results are significantly behind the state of the art for classification for this database (~95%), it illustrates the first time direct bitstream image classification has been achieved. This work confirms that direct bitstream image classification is possible and could be utilised in a first pass database screening of a raw bitstream (within a wired or wireless network) or where computational, memory and bandwidth requirements are severely restricted.
updated: Wed Oct 13 2021 14:18:58 GMT+0000 (UTC)
published: Wed Oct 13 2021 14:18:58 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト