arXiv reaDer
自動調整されたSimからRealへの転送
Auto-Tuned Sim-to-Real Transfer
シミュレーションでトレーニングされたポリシーは、シミュレータが現実世界のダイナミクスと視覚的特性を正確にキャプチャできない「現実のギャップ」のために、現実世界に転送されたときに失敗することがよくあります。ドメインのランダム化など、この問題に取り組む現在のアプローチでは、保守的すぎず、シミュレーションから実際への転送に対して堅牢なポリシーを学習するために、システムパラメータをランダム化する量を決定するための事前の知識とエンジニアリングが必要です。報酬を定義したり状態を推定したりすることなく、実世界の生のRGB画像のみを使用して、実世界に一致するようにシミュレータシステムパラメータを自動的に調整する方法を提案します。私たちの重要な洞察は、パラメーターの自動調整を検索問題として再構成することです。ここでは、シミュレーションシステムパラメーターを繰り返しシフトして、実際のシステムパラメーターに近づけます。一連の観測とアクション、および一連のシステムパラメータが与えられた場合に、与えられたパラメータが観測の生成に使用される実際のパラメータよりも高いか低いかを予測する検索パラメータモデル(SPM)を提案します。シムからシムへの転送とシムからリアルへの転送の両方で、複数のロボット制御タスクでこの方法を評価し、ナイーブドメインのランダム化よりも大幅に改善されていることを示しています。 https://yuqingd.github.io/autotuned-sim2real/でビデオとコードをプロジェクトします
Policies trained in simulation often fail when transferred to the real world due to the `reality gap' where the simulator is unable to accurately capture the dynamics and visual properties of the real world. Current approaches to tackle this problem, such as domain randomization, require prior knowledge and engineering to determine how much to randomize system parameters in order to learn a policy that is robust to sim-to-real transfer while also not being too conservative. We propose a method for automatically tuning simulator system parameters to match the real world using only raw RGB images of the real world without the need to define rewards or estimate state. Our key insight is to reframe the auto-tuning of parameters as a search problem where we iteratively shift the simulation system parameters to approach the real-world system parameters. We propose a Search Param Model (SPM) that, given a sequence of observations and actions and a set of system parameters, predicts whether the given parameters are higher or lower than the true parameters used to generate the observations. We evaluate our method on multiple robotic control tasks in both sim-to-sim and sim-to-real transfer, demonstrating significant improvement over naive domain randomization. Project videos and code at https://yuqingd.github.io/autotuned-sim2real/
updated: Thu May 20 2021 17:58:26 GMT+0000 (UTC)
published: Thu Apr 15 2021 17:59:55 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト