リアルタイムのオブジェクトの姿勢推定と追跡は困難ですが、新しい拡張現実 (AR) アプリケーションには不可欠です。一般に、最先端の方法では、実際に満足のいく結果が得られるディープ ニューラル ネットワークを使用してこの問題に対処します。それにもかかわらず、これらの方法は計算コストが高いため、実際のアプリケーションが通常行われるモバイル デバイスには適していません。さらに、AR メガネなどのヘッドマウント ディスプレイでは、乗り物酔いを避けるために少なくとも 90~FPS が必要であり、これが問題をさらに複雑にしています。モバイルデバイス用の柔軟なフレームレートのオブジェクトポーズ推定および追跡システムを提案します。これは、クライアント サーバー アーキテクチャを備えた単眼の視覚慣性ベースのシステムです。クライアント側では慣性計測ユニット (IMU) の姿勢伝播が高速追跡のために実行され、サーバー側では RGB 画像ベースの 3D 姿勢推定が実行されて正確な姿勢が取得されます。その後、姿勢は視覚化のためにクライアント側に送信されます。 -慣性融合では、ドリフトを減らすためにバイアス自己修正メカニズムを提案します。また、追跡の失敗と誤った姿勢推定を検出するための姿勢検査アルゴリズムも提案します。高速ネットワークで接続された当社のシステムは、最大 120 FPS の柔軟なフレーム レートをサポートし、ローエンド デバイスでの高精度のリアルタイム トラッキングを保証します。シミュレーションと現実世界の実験の両方で、この方法が正確で堅牢なオブジェクト追跡を実現することが示されています。
Real-time object pose estimation and tracking is challenging but essential for emerging augmented reality (AR) applications. In general, state-of-the-art methods address this problem using deep neural networks which indeed yield satisfactory results. Nevertheless, the high computational cost of these methods makes them unsuitable for mobile devices where real-world applications usually take place. In addition, head-mounted displays such as AR glasses require at least 90~FPS to avoid motion sickness, which further complicates the problem. We propose a flexible-frame-rate object pose estimation and tracking system for mobile devices. It is a monocular visual-inertial-based system with a client-server architecture. Inertial measurement unit (IMU) pose propagation is performed on the client side for high speed tracking, and RGB image-based 3D pose estimation is performed on the server side to obtain accurate poses, after which the pose is sent to the client side for visual-inertial fusion, where we propose a bias self-correction mechanism to reduce drift. We also propose a pose inspection algorithm to detect tracking failures and incorrect pose estimation. Connected by high-speed networking, our system supports flexible frame rates up to 120 FPS and guarantees high precision and real-time tracking on low-end devices. Both simulations and real world experiments show that our method achieves accurate and robust object tracking.