arXiv reaDer
XCAT -- 異種グループ畳み込みと相互連結を使用した軽量量子化単一画像超解像
XCAT -- Lightweight Quantized Single Image Super-Resolution using Heterogeneous Group Convolutions and Cross Concatenation
XCAT というモバイル デバイス用の軽量な単一画像超解像ネットワークを提案します。 XCAT では、クロス連結 (HXBlock) を使用した異種グループ畳み込みブロックが導入されています。グループ畳み込みブロックへの入力チャネルの異種分割により、操作の数が削減され、相互連結により、カスケードされた HXBlock の中間入力テンソル間の情報フローが可能になります。 HXBlock 内の相互連結は、1x1 畳み込みなどのより高価な操作の使用を回避することもできます。高価なテンソル コピー操作をさらに防止するために、XCAT はトレーニング不可能な畳み込みカーネルを使用してサンプリング操作を適用します。整数量子化を念頭に置いて設計された XCAT は、強度ベースのデータ拡張など、トレーニングに関するいくつかの手法も利用します。整数量子化された XCAT は、Mali-G71 MP2 GPU で 320 ミリ秒、Synaptics Dolphin NPU で 30 ミリ秒 (NCHW) および 8.8 ミリ秒 (NHWC) でリアルタイムに動作し、リアルタイム アプリケーションに適しています。
We propose a lightweight, single image super-resolution network for mobile devices, named XCAT. XCAT introduces Heterogeneous Group Convolution Blocks with Cross Concatenations (HXBlock). The heterogeneous split of the input channels to the group convolution blocks reduces the number of operations, and cross concatenation allows for information flow between the intermediate input tensors of cascaded HXBlocks. Cross concatenations inside HXBlocks can also avoid using more expensive operations like 1x1 convolutions. To further prev ent expensive tensor copy operations, XCAT utilizes non-trainable convolution kernels to apply up sampling operations. Designed with integer quantization in mind, XCAT also utilizes several techniques on training, like intensity-based data augmentation. Integer quantized XCAT operates in real time on Mali-G71 MP2 GPU with 320ms, and on Synaptics Dolphin NPU with 30ms (NCHW) and 8.8ms (NHWC), suitable for real-time applications.
updated: Wed Aug 31 2022 06:57:40 GMT+0000 (UTC)
published: Wed Aug 31 2022 06:57:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト