A Comprehensive Analysis of Deep Regression
ディープラーニングはデータサイエンスに革命をもたらし、最近、その人気は急激に高まり、ディープネットワークを使用する論文の量も増えました。人間の姿勢推定などのビジョンタスクは、この傾向から逃れませんでした。多数の深いモデルがあり、ネットワークアーキテクチャまたはデータの前処理における小さな変更と、最適化手順の確率論的な性質により、特に異なる結果が生成され、他のものを大幅に上回るメソッドをふるい分けることが非常に困難になります。 。この状況は、バニラディープ回帰の系統的評価と統計分析を実行する現在の研究、すなわち、線形回帰の最上層を持つ畳み込みニューラルネットワークに動機を与えます。これは、深い回帰手法の最初の包括的な分析です。 4つの視覚問題について実験を行い、パフォーマンスの中央値の信頼区間と、結果の統計的有意性(ある場合)を報告します。驚くべきことに、さまざまなデータ前処理手順による変動性は、ネットワークアーキテクチャの変更による変動性を上回っています。私たちの結果は、一般に、適切に調整された汎用ネットワーク(例:VGG-16またはResNet-50)が、より複雑な方法に頼ることなく、最先端の技術に近い結果をもたらすことができるという仮説を補強します。アドホック回帰モデル。
Deep learning revolutionized data science, and recently its popularity has grown exponentially, as did the amount of papers employing deep networks. Vision tasks, such as human pose estimation, did not escape from this trend. There is a large number of deep models, where small changes in the network architecture, or in the data pre-processing, together with the stochastic nature of the optimization procedures, produce notably different results, making extremely difficult to sift methods that significantly outperform others. This situation motivates the current study, in which we perform a systematic evaluation and statistical analysis of vanilla deep regression, i.e. convolutional neural networks with a linear regression top layer. This is the first comprehensive analysis of deep regression techniques. We perform experiments on four vision problems, and report confidence intervals for the median performance as well as the statistical significance of the results, if any. Surprisingly, the variability due to different data pre-processing procedures generally eclipses the variability due to modifications in the network architecture. Our results reinforce the hypothesis according to which, in general, a general-purpose network (e.g. VGG-16 or ResNet-50) adequately tuned can yield results close to the state-of-the-art without having to resort to more complex and ad-hoc regression models.
updated: Thu Sep 24 2020 15:10:03 GMT+0000 (UTC)
published: Thu Mar 22 2018 16:46:39 GMT+0000 (UTC)
