arXiv reaDer
ThumbNet:1つのサムネイル画像に認識に必要なすべてが含まれています
ThumbNet: One Thumbnail Image Contains All You Need for Recognition
深い畳み込みニューラルネットワーク(CNN)はコンピュータービジョンタスクで大きな成功を収めていますが、その実際のアプリケーションは依然として、計算リソースの膨大な需要によって妨げられています。現在の作品は、ほとんどの場合、システムの複雑さに対する入力画像の影響を無視して、そのパラメーターまたはパラメーターによって発生する計算を削減することによってネットワークを圧縮しようとしています。 CNNの入力画像にかなりの冗長性が含まれているという事実に基づいて、このホワイトペーパーでは、ThumbNetと呼ばれる統合フレームワークを提案し、CNNモデルを1つのサムネイル画像で推論できるようにすることで、CNNモデルを同時に高速化および圧縮します。 ThumbNetをトレーニングする3つの効果的な戦略を提供します。そうすることで、ThumbNetは、大きな画像の元の入力ネットワークと同じように小さな画像で同じように機能する推論ネットワークを学習します。 ThumbNetを使用すると、計算とメモリの要件を大幅に削減できるサムネイル入力推論ネットワークを取得できるだけでなく、一般的な分類タスクのサムネイル画像を生成できる画像ダウンスケーラーも取得できます。広範な実験により、ThumbNetの有効性が示され、ThumbNetによって学習されたサムネイル入力推論ネットワークが、入力画像が16倍に縮小された場合でも、元の入力ネットワークの精度を適切に維持できることが示されています。
Although deep convolutional neural networks (CNNs) have achieved great success in computer vision tasks, its real-world application is still impeded by its voracious demand of computational resources. Current works mostly seek to compress the network by reducing its parameters or parameter-incurred computation, neglecting the influence of the input image on the system complexity. Based on the fact that input images of a CNN contain substantial redundancy, in this paper, we propose a unified framework, dubbed as ThumbNet, to simultaneously accelerate and compress CNN models by enabling them to infer on one thumbnail image. We provide three effective strategies to train ThumbNet. In doing so, ThumbNet learns an inference network that performs equally well on small images as the original-input network on large images. With ThumbNet, not only do we obtain the thumbnail-input inference network that can drastically reduce computation and memory requirements, but also we obtain an image downscaler that can generate thumbnail images for generic classification tasks. Extensive experiments show the effectiveness of ThumbNet, and demonstrate that the thumbnail-input inference network learned by ThumbNet can adequately retain the accuracy of the original-input network even when the input images are downscaled 16 times.
updated: Thu Dec 03 2020 12:32:20 GMT+0000 (UTC)
published: Wed Apr 10 2019 07:44:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト