arXiv reaDer
将来の画像類似性学習によるモデルベースの行動クローニング
Model-based Behavioral Cloning with Future Image Similarity Learning
  視覚的模倣学習フレームワークを提示します。これにより、ロボットの試行なしで、エキスパートサンプルのみに基づいてロボットアクションポリシーを学習できます。現実世界の環境でのロボット探査とポリシーに基づく試験は、多くの場合、費用がかかる/危険な場合があります。ラベルのないサンプル動画とアクションで構成される専門家の軌跡のコレクションのみで将来のシーン予測モデルを学習し、将来の画像の類似性を使用して一般化されたアクションクローニングを有効にすることにより、この問題に対処する新しいアプローチを提示します。ロボットは、アクションを実行した結果を視覚的に予測することを学習し、予測された将来の画像が専門家の画像にどれだけ似ているかを評価することでポリシーを取得します。確率的アクション条件付き畳み込みオートエンコーダーを開発し、ロボット学習のために将来の画像をどのように活用するかを示します。障害物の有無にかかわらず地上移動ロボットを使用して、シミュレートされた現実の環境で実験を行い、モデルを複数のベースライン手法と比較します。
We present a visual imitation learning framework that enables learning of robot action policies solely based on expert samples without any robot trials. Robot exploration and on-policy trials in a real-world environment could often be expensive/dangerous. We present a new approach to address this problem by learning a future scene prediction model solely on a collection of expert trajectories consisting of unlabeled example videos and actions, and by enabling generalized action cloning using future image similarity. The robot learns to visually predict the consequences of taking an action, and obtains the policy by evaluating how similar the predicted future image is to an expert image. We develop a stochastic action-conditioned convolutional autoencoder, and present how we take advantage of future images for robot learning. We conduct experiments in simulated and real-life environments using a ground mobility robot with and without obstacles, and compare our models to multiple baseline methods.
updated: Tue Oct 08 2019 01:32:54 GMT+0000 (UTC)
published: Tue Oct 08 2019 01:32:54 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト