arXiv reaDer
CondenseNeXt:組み込みシステム向けの超効率的なディープニューラルネットワーク
CondenseNeXt: An Ultra-Efficient Deep Neural Network for Embedded Systems
リソースが制限された最新の組み込みシステムやモバイルデバイスの出現により、機械学習を目的とした非常に効率的なディープニューラルネットワークに対する大きな需要があります。また、データが処理されて外部サーバーに保存される場合、一般の人々のプライバシーと機密性に対する懸念も高まっており、ローカル組み込みシステムでのリアルタイム推論のためのこのような効率的なニューラルネットワークの開発の必要性がさらに高まっています。このホワイトペーパーで紹介する作業の範囲は、畳み込みニューラルネットワークを使用した画像分類に限定されています。畳み込みニューラルネットワーク(CNN)は、イメージセンサーによってキャプチャされた視覚画像の分析に広く使用されているディープニューラルネットワーク(DNN)のクラスであり、情報を抽出して、入力データのリアルタイム推論のために意味のある表現に変換するように設計されています。 。この論文では、組み込みシステムでのリアルタイム推論のために既存のCNNアーキテクチャのパフォーマンスを改善するために、深層畳み込みニューラルネットワークアーキテクチャのネオテリックバリアントを提案します。 CondenseNeXtと呼ばれるこのアーキテクチャは、3.0 MB未満のトレーニング済みモデルサイズと精度のバランスを維持しながら、ネットワークのトレーニングに必要なトレーニング可能なパラメータとFLOPを削減することにより、ベースラインニューラルネットワークアーキテクチャであるCondenseNetと比較して非常に効率的であることを示します。トレードオフにより、前例のない計算効率が得られます。
Due to the advent of modern embedded systems and mobile devices with constrained resources, there is a great demand for incredibly efficient deep neural networks for machine learning purposes. There is also a growing concern of privacy and confidentiality of user data within the general public when their data is processed and stored in an external server which has further fueled the need for developing such efficient neural networks for real-time inference on local embedded systems. The scope of our work presented in this paper is limited to image classification using a convolutional neural network. A Convolutional Neural Network (CNN) is a class of Deep Neural Network (DNN) widely used in the analysis of visual images captured by an image sensor, designed to extract information and convert it into meaningful representations for real-time inference of the input data. In this paper, we propose a neoteric variant of deep convolutional neural network architecture to ameliorate the performance of existing CNN architectures for real-time inference on embedded systems. We show that this architecture, dubbed CondenseNeXt, is remarkably efficient in comparison to the baseline neural network architecture, CondenseNet, by reducing trainable parameters and FLOPs required to train the network whilst maintaining a balance between the trained model size of less than 3.0 MB and accuracy trade-off resulting in an unprecedented computational efficiency.
updated: Wed Dec 01 2021 18:20:52 GMT+0000 (UTC)
published: Wed Dec 01 2021 18:20:52 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト