Autonomous Aerial Cinematography In Unstructured Environments With Learned Artistic Decision-Making
  空撮は、エンターテイメント、スポーツ、セキュリティなどのライブでダイナミックなカメラの視点を必要とする産業に革命を起こしています。ただし、障害物の存在下で移動するターゲットを撮影しながらドローンを安全に操縦することは非常に負担が大きく、多くの場合、複数の熟練した人間のオペレーターが必要です。したがって、ジオメトリとシーンコンテキストの両方をリアルタイムで判断できる自律型の撮影技師が求められています。既存のアプローチでは、この問題のすべての側面に対処しているわけではありません。ターゲットをローカライズするために高精度のモーションキャプチャシステムまたはGPSタグを必要とするか、環境の以前のマップに依存するか、短時間の視野を計画するか、飛行前に指定された芸術的なガイドラインのみに従ってください。この作業では、問題全体に対処し、リアルタイム航空写真撮影用の完全なシステムを提案します。 (2)オクルージョン推定のための3D符号付き距離マッピング。 (3)長時間のカメラの動きに対する効率的な軌道最適化。 (4)学習ベースの芸術的ショット選択。シミュレーションと実地実験の両方で、非構造化環境を移動する動的ターゲットを撮影することにより、システムを広範囲に評価します。私たちの結果は、私たちのシステムが制限のある仮定なしに現実世界で確実に動作できることを示しています。また、設計のトレードオフが他の関連アプリケーションに一般化できることを期待して、各モジュールの詳細な分析と議論も提供します。完全なシステムのビデオは、にあります。
Aerial cinematography is revolutionizing industries that require live and dynamic camera viewpoints such as entertainment, sports, and security. However, safely piloting a drone while filming a moving target in the presence of obstacles is immensely taxing, often requiring multiple expert human operators. Hence, there is demand for an autonomous cinematographer that can reason about both geometry and scene context in real-time. Existing approaches do not address all aspects of this problem; they either require high-precision motion-capture systems or GPS tags to localize targets, rely on prior maps of the environment, plan for short time horizons, or only follow artistic guidelines specified before flight. In this work, we address the problem in its entirety and propose a complete system for real-time aerial cinematography that for the first time combines: (1) vision-based target estimation; (2) 3D signed-distance mapping for occlusion estimation; (3) efficient trajectory optimization for long time-horizon camera motion; and (4) learning-based artistic shot selection. We extensively evaluate our system both in simulation and in field experiments by filming dynamic targets moving through unstructured environments. Our results indicate that our system can operate reliably in the real world without restrictive assumptions. We also provide in-depth analysis and discussions for each module, with the hope that our design tradeoffs can generalize to other related applications. Videos of the complete system can be found at:
