arXiv reaDer
失敗から目標を学ぶ
Learning Goals from Failure
ビデオで観察可能な人間の行動の背後にある目標を予測するフレームワークを紹介します。発達心理学の証拠に動機付けられて、私たちは意図しない行動のビデオを活用して、直接の監督なしで目標のビデオ表現を学びます。私たちのアプローチは、低レベルの動きと高レベルのアクション機能の両方を表すコンテキスト軌道としてビデオをモデル化します。実験と視覚化は、訓練されたモデルが意図しない行動のビデオで根本的な目標を予測できることを示しています。また、モデルの勾配信号を利用して潜在的な軌道を調整することにより、意図しないアクションを「自動的に修正」する方法を提案します。モデルは最小限の監視でトレーニングされますが、正常に実行された目標の大規模な(監視された)データセットでトレーニングされたベースラインと競合するか、それを上回ります。これは、意図しないアクションを観察することが、ビデオの目標について学習するために重要であることを示しています。プロジェクトページ:https://aha.cs.columbia.edu/
We introduce a framework that predicts the goals behind observable human action in video. Motivated by evidence in developmental psychology, we leverage video of unintentional action to learn video representations of goals without direct supervision. Our approach models videos as contextual trajectories that represent both low-level motion and high-level action features. Experiments and visualizations show our trained model is able to predict the underlying goals in video of unintentional action. We also propose a method to "automatically correct" unintentional action by leveraging gradient signals of our model to adjust latent trajectories. Although the model is trained with minimal supervision, it is competitive with or outperforms baselines trained on large (supervised) datasets of successfully executed goals, showing that observing unintentional action is crucial to learning about goals in video. Project page: https://aha.cs.columbia.edu/
updated: Sun Dec 13 2020 01:44:08 GMT+0000 (UTC)
published: Sun Jun 28 2020 17:16:49 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト