arXiv reaDer
ディープニューラルネットワークによる効率的な視覚認識:最近の進歩と新しい方向性に関する調査
Efficient Visual Recognition with Deep Neural Networks: A Survey on Recent Advances and New Directions
視覚認識は現在、コンピュータービジョン、パターン認識、さらには人工知能の一般的な分野で最も重要で活発な研究分野の1つです。それは非常に基本的な重要性と強い産業ニーズを持っています。ディープニューラルネットワーク(DNN)は、大量のトレーニングデータと新しい強力な計算リソースの助けを借りて、多くの具体的なタスクでのパフォーマンスを大幅に向上させました。認識の正確さは通常、新しい進歩の最初の関心事ですが、効率は実際にはかなり重要であり、学術研究と産業用途の両方にとって重要な場合があります。さらに、効率性の機会と課題に関する洞察に満ちた見解も、コミュニティ全体に強く求められています。 DNNの効率問題に関する一般的な調査はさまざまな観点から行われてきましたが、私たちの知る限り、体系的に視覚認識に焦点を当てたものはほとんどなく、どの進歩がそれに適用可能であり、他に何を懸念すべきかは不明です。 。この論文では、DNN関連の視覚認識アプローチの効率を改善するための新しい可能な方向性に関する提案とともに、最近の進歩のレビューを提示します。モデルだけでなくデータの観点からも調査し(既存の調査には当てはまりません)、最も調査されている3つのデータタイプ(画像、ビデオ、ポイント)に焦点を当てます。この論文は、貴重な参考資料として役立ち、視覚認識の問題に取り組む研究者と実践者の両方に刺激を与えることができる包括的な調査を通じて体系的な要約を提供しようとしています。
Visual recognition is currently one of the most important and active research areas in computer vision, pattern recognition, and even the general field of artificial intelligence. It has great fundamental importance and strong industrial needs. Deep neural networks (DNNs) have largely boosted their performances on many concrete tasks, with the help of large amounts of training data and new powerful computation resources. Though recognition accuracy is usually the first concern for new progresses, efficiency is actually rather important and sometimes critical for both academic research and industrial applications. Moreover, insightful views on the opportunities and challenges of efficiency are also highly required for the entire community. While general surveys on the efficiency issue of DNNs have been done from various perspectives, as far as we are aware, scarcely any of them focused on visual recognition systematically, and thus it is unclear which progresses are applicable to it and what else should be concerned. In this paper, we present the review of the recent advances with our suggestions on the new possible directions towards improving the efficiency of DNN-related visual recognition approaches. We investigate not only from the model but also the data point of view (which is not the case in existing surveys), and focus on three most studied data types (images, videos and points). This paper attempts to provide a systematic summary via a comprehensive survey which can serve as a valuable reference and inspire both researchers and practitioners who work on visual recognition problems.
updated: Thu Sep 09 2021 02:47:15 GMT+0000 (UTC)
published: Mon Aug 30 2021 08:19:34 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト