グラフィックスエンジンによってレンダリングされた合成画像は、ディープネットワークをトレーニングするための有望なソースです。ただし、グラフィックスベースの生成パイプラインは3D形状の選択やカメラの配置などの多数の設計上の決定を必要とするため、実際の画像でネットワークが適切に機能するようにトレーニングできるようにすることは困難です。この作業では、「ハイブリッドグラデーション」と呼ばれるものに基づいて3Dトレーニングデータの生成を最適化する新しい方法を提案します。設計決定を実数ベクトルとしてパラメーター化し、近似勾配と分析勾配を組み合わせて、このベクトルに関するネットワークパフォーマンスのハイブリッド勾配を取得します。単一の画像から表面の法線、深度、または固有の分解を推定するタスクに関するアプローチを評価します。標準的なベンチマークでの実験は、特に計算効率の点で、3Dトレーニングデータの生成を最適化することで、私たちのアプローチが従来の技術よりも優れていることを示しています。
Synthetic images rendered by graphics engines are a promising source for training deep networks. However, it is challenging to ensure that they can help train a network to perform well on real images, because a graphics-based generation pipeline requires numerous design decisions such as the selection of 3D shapes and the placement of the camera. In this work, we propose a new method that optimizes the generation of 3D training data based on what we call "hybrid gradient". We parametrize the design decisions as a real vector, and combine the approximate gradient and the analytical gradient to obtain the hybrid gradient of the network performance with respect to this vector. We evaluate our approach on the task of estimating surface normal, depth or intrinsic decomposition from a single image. Experiments on standard benchmarks show that our approach can outperform the prior state of the art on optimizing the generation of 3D training data, particularly in terms of computational efficiency.