arXiv reaDer
ロバストで適応性のあるモーション予測に向けて:因果的表現の視点
Towards Robust and Adaptive Motion Forecasting: A Causal Representation Perspective
観察データから行動パターンを学習することは、動き予測への事実上のアプローチでした。しかし、現在のパラダイムには2つの欠点があります。それは、共変量シフトの下で脆弱であるということと、知識の伝達が非効率的であるということです。この作業では、因果表現の観点からこれらの課題に対処することを提案します。最初に、モーション予測の因果的形式を紹介します。これは、潜在変数の3つのグループ、つまり不変メカニズム、スタイル交絡因子、および疑似機能を使用した動的プロセスとして問題をキャストします。次に、各グループを個別に扱う学習フレームワークを紹介します。(i)異なる場所から収集されたデータセットをマージする一般的な方法とは異なり、モデルに疑似相関を抑制するように促す不変性の損失によって、それらの微妙な違いを利用します。 (ii)因果グラフを近似するために、不変メカニズムとスタイル交絡因子の表現を因数分解するモジュラーアーキテクチャを考案します。 (iii)スタイル表現の構造を強制するだけでなく、テスト時の改良のための自己監視信号としても機能するスタイルの一貫性の喪失を導入します。合成データセットと実際のデータセットでの実験結果は、提案された3つのコンポーネントが、学習したモーション表現の堅牢性と再利用性を大幅に向上させ、分布外の一般化とローショット転送のための以前の最先端のモーション予測モデルを上回っていることを示しています。
Learning behavioral patterns from observational data has been a de-facto approach to motion forecasting. Yet, the current paradigm suffers from two shortcomings: brittle under covariate shift and inefficient for knowledge transfer. In this work, we propose to address these challenges from a causal representation perspective. We first introduce a causal formalism of motion forecasting, which casts the problem as a dynamic process with three groups of latent variables, namely invariant mechanisms, style confounders, and spurious features. We then introduce a learning framework that treats each group separately: (i) unlike the common practice of merging datasets collected from different locations, we exploit their subtle distinctions by means of an invariance loss encouraging the model to suppress spurious correlations; (ii) we devise a modular architecture that factorizes the representations of invariant mechanisms and style confounders to approximate a causal graph; (iii) we introduce a style consistency loss that not only enforces the structure of style representations but also serves as a self-supervisory signal for test-time refinement on the fly. Experiment results on synthetic and real datasets show that our three proposed components significantly improve the robustness and reusability of the learned motion representations, outperforming prior state-of-the-art motion forecasting models for out-of-distribution generalization and low-shot transfer.
updated: Mon Nov 29 2021 18:59:09 GMT+0000 (UTC)
published: Mon Nov 29 2021 18:59:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト