UAV の組み込みシステム上のリアルタイム検出システム用の統合パイプライン アーキテクチャを紹介します。ニューラル アーキテクチャは、コンピュータ ビジョンの業界標準となっています。ただし、既存の作業のほとんどは、実行時のパフォーマンスとのトレードオフとして、より高い精度を達成するために、より深い層を連結することにのみ焦点を当てています。このネットワークのパイプラインは、自律測量と活動報告という新たな UAV アプリケーションのために、空中歩行者の検出と活動認識に関するドメイン固有の知識を活用できます。特に、当社のパイプライン アーキテクチャは時間に敏感な方法で動作し、さまざまな空中方向からの歩行者を高精度で検出し、複数のアクティビティの認識に新しいアテンション マップを使用し、時間情報と組み合わせてその検出を改良します。数値的には、組み込みシステム上でのモデルの精度と高速な推論速度を実証します。私たちは、実際のオープンフィールド環境に完全なライブ フィードを備えたプロトタイプ ハードウェアを経験的に導入しました。
We present a unified pipeline architecture for a real-time detection system on an embedded system for UAVs. Neural architectures have been the industry standard for computer vision. However, most existing works focus solely on concatenating deeper layers to achieve higher accuracy with run-time performance as the trade-off. This pipeline of networks can exploit the domain-specific knowledge on aerial pedestrian detection and activity recognition for the emerging UAV applications of autonomous surveying and activity reporting. In particular, our pipeline architectures operate in a time-sensitive manner, have high accuracy in detecting pedestrians from various aerial orientations, use a novel attention map for multi-activities recognition, and jointly refine its detection with temporal information. Numerically, we demonstrate our model's accuracy and fast inference speed on embedded systems. We empirically deployed our prototype hardware with full live feeds in a real-world open-field environment.