arXiv reaDer
知識の蒸留による軽量深度推定の強化
Boosting Light-Weight Depth Estimation Via Knowledge Distillation
単眼深度推定 (MDE) メソッドは、多くの場合、モデルの複雑さと推論パフォーマンスの間のトレードオフにより、計算コストが高すぎるか、十分に正確ではありません。この論文では、最小限の計算リソースを使用して深度マップを正確に推定できる軽量ネットワークを提案します。これは、モデルの複雑さを最大限に軽減するコンパクトなモデル アーキテクチャを設計することで達成されます。軽量ネットワークのパフォーマンスを向上させるために、知識蒸留 (KD) 技術を採用しています。大規模なネットワークを、ターゲット ドメインの深度マップを正確に推定する専門教師と見なします。軽量ネットワークである学生は、教師の予測を模倣するようにトレーニングされます。ただし、この KD プロセスは、教師と生徒の間のモデル容量のギャップが大きいため、困難で不十分な場合があります。これに対処するために、ラベルのない補助データを使用して KD を導き、生徒が教師の予測からよりよく学習できるようにすることを提案します。このアプローチは、教師と生徒の間のギャップを埋めるのに役立ち、結果としてデータ駆動型の学習が改善されます。私たちの広範な実験は、私たちの方法が最先端の方法に匹敵するパフォーマンスを達成する一方で、それらのパラメーターのわずか1%を使用することを示しています.さらに、私たちの方法は、推論の精度、計算効率、および一般化可能性に関して、以前の軽量の方法よりも優れています。
Monocular depth estimation (MDE) methods are often either too computationally expensive or not accurate enough due to the trade-off between model complexity and inference performance. In this paper, we propose a lightweight network that can accurately estimate depth maps using minimal computing resources. We achieve this by designing a compact model architecture that maximally reduces model complexity. To improve the performance of our lightweight network, we adopt knowledge distillation (KD) techniques. We consider a large network as an expert teacher that accurately estimates depth maps on the target domain. The student, which is the lightweight network, is then trained to mimic the teacher's predictions. However, this KD process can be challenging and insufficient due to the large model capacity gap between the teacher and the student. To address this, we propose to use auxiliary unlabeled data to guide KD, enabling the student to better learn from the teacher's predictions. This approach helps fill the gap between the teacher and the student, resulting in improved data-driven learning. Our extensive experiments show that our method achieves comparable performance to state-of-the-art methods while using only 1% of their parameters. Furthermore, our method outperforms previous lightweight methods regarding inference accuracy, computational efficiency, and generalizability.
updated: Sun Apr 16 2023 06:41:31 GMT+0000 (UTC)
published: Thu May 13 2021 08:42:42 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト