近年、畳み込みニューラルネットワーク(CNN)は、コンピュータービジョンの最先端技術に大幅な進歩をもたらしました。分類タスクの場合、CNNは確率論的出力を広く採用しており、予測に追加の信頼を提供することの重要性を示しています。ただし、このような確率論的手法は、CNNを使用した回帰問題の解決にはあまり適用できません。なぜなら、回帰には、制約のない連続変数、多くの場合、多変量ターゲット変数の学習が含まれるためです。 CNNが確率的回帰問題に対処するための確率分布のパラメーターを学習するのを容易にする確率的パラメトリック回帰損失(PROPEL)を提案します。 PROPELは完全に区別可能であるため、既存の最適化アルゴリズムを使用して、既存のCNN回帰アーキテクチャのエンドツーエンドのトレーニングに簡単に組み込むことができます。提案された方法は、より高次元の多変量回帰問題に一般化可能であると同時に、複雑な制約のない確率の学習を可能にするため、柔軟性があります。 PROPELベースのCNNを使用して、未校正のカラー画像から手と頭の向きを学習する問題に対処します。私たちの実験的な検証と既存のCNN回帰損失関数との比較は、PROPELが確率的回帰を有効にすることでCNNの精度を向上させ、必要なモデルパラメーターを10倍に大幅に削減し、既存の現状と比較して一般化を向上させることを示していますアート。
In recent years, Convolutional Neural Networks (CNNs) have enabled significant advancements to the state-of-the-art in computer vision. For classification tasks, CNNs have widely employed probabilistic output and have shown the significance of providing additional confidence for predictions. However, such probabilistic methodologies are not widely applicable for addressing regression problems using CNNs, as regression involves learning unconstrained continuous and, in many cases, multi-variate target variables. We propose a PRObabilistic Parametric rEgression Loss (PROPEL) that facilitates CNNs to learn parameters of probability distributions for addressing probabilistic regression problems. PROPEL is fully differentiable and, hence, can be easily incorporated for end-to-end training of existing CNN regression architectures using existing optimization algorithms. The proposed method is flexible as it enables learning complex unconstrained probabilities while being generalizable to higher dimensional multi-variate regression problems. We utilize a PROPEL-based CNN to address the problem of learning hand and head orientation from uncalibrated color images. Our experimental validation and comparison with existing CNN regression loss functions show that PROPEL improves the accuracy of a CNN by enabling probabilistic regression, while significantly reducing required model parameters by 10 ×, resulting in improved generalization as compared to the existing state-of-the-art.