arXiv reaDer
PREGAN:弱くペアになった画像スタイルの翻訳のためのポーズのランダム化と推定
PREGAN: Pose Randomization and Estimation for Weakly Paired Image Style Translation
データ注釈なしでさまざまな条件下でトレーニング済みモデルを利用することは、ロボットアプリケーションにとって魅力的です。この目標に向けて、メソッドの1つのクラスは、画像スタイルを別の環境からモデルがトレーニングされる環境に変換することです。この論文では、2つの画像のコンテンツがポーズのエラーと整列する、スタイル変換の弱いペアの設定を提案します。これらの画像は、晴れた日や霧の夜から、LiDARやステレオカメラなど、重複する領域を共有するさまざまな条件のさまざまなセンサーによって取得できます。この設定は、次の点でより実用的であると考えています。(i)ペアのデータよりもラベル付けが簡単。 (ii)対になっていないデータよりも優れた解釈可能性と詳細検索。このような画像間で翻訳するために、2つの画像をランダムなポーズで意図的に変換することによってスタイルトランスレータをトレーニングし、スタイルが整列しているほど、より良い推定結果はです。このような敵対的なトレーニングは、ネットワークにスタイルの翻訳を学習させ、他のバリエーションに巻き込まれることを回避します。最後に、PREGANは、シミュレーションと実際に収集されたデータの両方で検証され、有効性が示されます。ダウンストリームタスク、分類、道路セグメンテーション、オブジェクト検出、および機能マッチングの結果は、実際のアプリケーションの可能性を示しています。 https://github.com/wrld/PRoGAN
Utilizing the trained model under different conditions without data annotation is attractive for robot applications. Towards this goal, one class of methods is to translate the image style from another environment to the one on which models are trained. In this paper, we propose a weakly-paired setting for the style translation, where the content in the two images is aligned with errors in poses. These images could be acquired by different sensors in different conditions that share an overlapping region, e.g. with LiDAR or stereo cameras, from sunny days or foggy nights. We consider this setting to be more practical with: (i) easier labeling than the paired data; (ii) better interpretability and detail retrieval than the unpaired data. To translate across such images, we propose PREGAN to train a style translator by intentionally transforming the two images with a random pose, and to estimate the given random pose by differentiable non-trainable pose estimator given that the more aligned in style, the better the estimated result is. Such adversarial training enforces the network to learn the style translation, avoiding being entangled with other variations. Finally, PREGAN is validated on both simulated and real-world collected data to show the effectiveness. Results on down-stream tasks, classification, road segmentation, object detection, and feature matching show its potential for real applications. https://github.com/wrld/PRoGAN
updated: Sun Jan 17 2021 07:18:56 GMT+0000 (UTC)
published: Sat Oct 31 2020 16:11:11 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト