2Dおよび3D形状を生成するプログラムを推測することは、リバースエンジニアリングや編集などにとって重要です。ペア(形状、プログラム)データは多くのドメインですぐに利用できないため、このタスクを実行するためのモデルのトレーニングは複雑であり、正確な教師あり学習は実行不可能です。ただし、割り当てられたプログラムラベルまたは形状分布のいずれかの精度を損なうことにより、ペアのデータを取得することは可能です。ウェイクスリープメソッドは、形状プログラムの生成モデルからのサンプルを使用して、実際の形状の分布を概算します。セルフトレーニングでは、形状は認識モデルを通過します。認識モデルは、それらの形状の「疑似ラベル」として扱われるプログラムを予測します。これらのアプローチに関連して、プログラムの疑似ラベルが実行された出力形状とペアになり、近似的な形状分布を犠牲にしてラベルの不一致を回避する、プログラム推論に固有の新しい自己トレーニングバリアントを紹介します。これらのレジームを単一の概念フレームワークの下でグループ化することを提案します。このフレームワークでは、疑似ラベルまたは近似分布(PLAD)のいずれかから供給される最尤更新を使用してトレーニングが実行されます。これらの手法を、複数の2Dおよび3D形状プログラム推論ドメインで評価します。ポリシー勾配強化学習と比較して、PLAD手法がより正確な形状プログラムを推測し、大幅に速く収束することを示します。最後に、単一モデルのトレーニング内でさまざまなPLADメソッドからの更新を組み合わせることを提案し、このアプローチが個々の手法よりも優れていることを確認します。
Inferring programs which generate 2D and 3D shapes is important for reverse engineering, editing, and more. Training models to perform this task is complicated because paired (shape, program) data is not readily available for many domains, making exact supervised learning infeasible. However, it is possible to get paired data by compromising the accuracy of either the assigned program labels or the shape distribution. Wake-sleep methods use samples from a generative model of shape programs to approximate the distribution of real shapes. In self-training, shapes are passed through a recognition model, which predicts programs that are treated as "pseudo-labels" for those shapes. Related to these approaches, we introduce a novel self-training variant unique to program inference, where program pseudo-labels are paired with their executed output shapes, avoiding label mismatch at the cost of an approximate shape distribution. We propose to group these regimes under a single conceptual framework, where training is performed with maximum likelihood updates sourced from either Pseudo-Labels or an Approximate Distribution (PLAD). We evaluate these techniques on multiple 2D and 3D shape program inference domains. Compared with policy gradient reinforcement learning, we show that PLAD techniques infer more accurate shape programs and converge significantly faster. Finally, we propose to combine updates from different PLAD methods within the training of a single model, and find that this approach outperforms any individual technique.