多くの最新のロボットシステムは、幾何学的に豊富なため、主なセンシングモダリティとしてLiDARを採用しています。ローリングシャッターLiDARは特に一般的であり、レーザーのアレイが回転するベースからシーンをスキャンします。ポイントはパケットのストリームとして放出され、それぞれが360°のカバレッジのセクターをカバーします。最新の知覚アルゴリズムは、データを処理する前に完全なスイープが構築されるのを待機します。これにより、追加の遅延が発生します。通常の10HzLiDARの場合、これは100msになります。結果として、出力が生成されるまでに、それはもはや世界の状態を正確に反映していません。ロボット工学アプリケーションは最小限の反応時間を必要とし、安全上重要な状況が発生した場合に操作を迅速に計画できるため、これには課題があります。このホワイトペーパーでは、StrObeを提案します。これは、LiDARパケットを取り込み、完全なスイープが構築されるのを待たずに検出ストリームを送信することで、レイテンシを最小限に抑える新しいアプローチです。 StrObeは以前のパケットからの計算を再利用し、新しい証拠が入ってくると、メモリとして機能するシーンの潜在的な空間表現を繰り返し更新し、正確な低遅延の知覚をもたらします。大規模な実世界のデータセットでのアプローチの有効性を示し、レイテンシーを考慮した場合、StrObeが最先端のパフォーマンスをはるかに上回り、従来の設定のパフォーマンスと一致することを示しています。
Many modern robotics systems employ LiDAR as their main sensing modality due to its geometrical richness. Rolling shutter LiDARs are particularly common, in which an array of lasers scans the scene from a rotating base. Points are emitted as a stream of packets, each covering a sector of the 360° coverage. Modern perception algorithms wait for the full sweep to be built before processing the data, which introduces an additional latency. For typical 10Hz LiDARs this will be 100ms. As a consequence, by the time an output is produced, it no longer accurately reflects the state of the world. This poses a challenge, as robotics applications require minimal reaction times, such that maneuvers can be quickly planned in the event of a safety-critical situation. In this paper we propose StrObe, a novel approach that minimizes latency by ingesting LiDAR packets and emitting a stream of detections without waiting for the full sweep to be built. StrObe reuses computations from previous packets and iteratively updates a latent spatial representation of the scene, which acts as a memory, as new evidence comes in, resulting in accurate low-latency perception. We demonstrate the effectiveness of our approach on a large scale real-world dataset, showing that StrObe far outperforms the state-of-the-art when latency is taken into account, and matches the performance in the traditional setting.