arXiv reaDer
知識蒸留アプローチを使用した単一画像のキャリブレーション
Single image calibration using knowledge distillation approaches
最近の深層学習ベースのキャリブレーション方法は、単一の画像から外部および内部のカメラ パラメーターを予測できますが、それらの一般化は、トレーニング データ サンプルの数と分布によって制限されたままです。膨大な計算量とスペースが必要なため、畳み込みニューラル ネットワーク (CNN) をリソースに制約のある環境に実装することはできません。この課題により、以前に学習したデータのパフォーマンスを維持しながら新しいデータをトレーニングすることで、CNN を徐々に学習するようになりました。私たちのアプローチは、新しいデータ分布のためにネットワークを更新するときに知識を保持するために、さまざまな増分学習戦略を使用してカメラ パラメーター (焦点距離、ピッチ、ロール) を自動的に推定する CNN アーキテクチャに基づいています。正確には、4 つの一般的な増分学習、つまり LwF 、iCaRL、LU CIR、および BiC を、それらの損失関数を回帰問題に変更することによって適応させます。 299008 の屋内および屋外の画像を含む 2 つのデータセットで評価します。実験結果は重要であり、どちらの方法がカメラのキャリブレーション推定に適しているかが示されました。
Although recent deep learning-based calibration methods can predict extrinsic and intrinsic camera parameters from a single image, their generalization remains limited by the number and distribution of training data samples. The huge computational and space requirement prevents convolutional neural networks (CNNs) from being implemented in resource-constrained environments. This challenge motivated us to learn a CNN gradually, by training new data while maintaining performance on previously learned data. Our approach builds upon a CNN architecture to automatically estimate camera parameters (focal length, pitch, and roll) using different incremental learning strategies to preserve knowledge when updating the network for new data distributions. Precisely, we adapt four common incremental learning, namely: LwF , iCaRL, LU CIR, and BiC by modifying their loss functions to our regression problem. We evaluate on two datasets containing 299008 indoor and outdoor images. Experiment results were significant and indicated which method was better for the camera calibration estimation.
updated: Mon Dec 05 2022 15:59:35 GMT+0000 (UTC)
published: Mon Dec 05 2022 15:59:35 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト