arXiv reaDer
逆手続きファサードモデリングのための洗練された窓構造の半教師あり敵対的認識
Semi-Supervised Adversarial Recognition of Refined Window Structures for Inverse Procedural Façade Modeling
深層学習の方法はデータを大量に消費することで有名であり、多数のラベル付きサンプルが必要です。残念ながら、大量のインタラクティブなサンプルラベリングの取り組みにより、特に異種サンプルを必要とする3Dモデリングタスクでのディープラーニング手法の適用が劇的に妨げられています。ファサードの学習された3Dモデリングのためのデータ注釈の作業を軽減するために、この論文は、逆手続き型モデリングに埋め込まれた半教師あり敵認識戦略を提案しました。テクスチャードLOD-2(Level-of-Details)モデルから始めて、古典的な畳み込みニューラルネットワークを使用して、タイプを認識し、画像パッチからウィンドウのパラメーターを推定します。次に、ウィンドウのタイプとパラメーターが手続き型文法にアセンブルされます。シンプルな手続き型エンジンが既存の3Dモデリングソフトウェア内に構築され、きめの細かいウィンドウジオメトリを生成します。いくつかのラベル付けされたサンプルから有用なモデルを取得するために、生成的敵対的ネットワークを活用して、半教師ありの方法で特徴抽出器をトレーニングします。敵対的なトレーニング戦略では、ラベルのないデータを悪用して、トレーニングフェーズをより安定させることもできます。公開されているファサード画像データセットを使用した実験により、提案されたトレーニング戦略では、同じネットワーク構造で分類精度が約10%向上し、パラメータ推定が50%向上することがわかりました。さらに、さまざまなファサードスタイルを特徴とする目に見えないデータに対してテストすると、パフォーマンスの向上がより顕著になります。
Deep learning methods are notoriously data-hungry, which requires a large number of labeled samples. Unfortunately, the large amount of interactive sample labeling efforts has dramatically hindered the application of deep learning methods, especially for 3D modeling tasks, which require heterogeneous samples. To alleviate the work of data annotation for learned 3D modeling of facades, this paper proposed a semi-supervised adversarial recognition strategy embedded in inverse procedural modeling. Beginning with textured LOD-2 (Level-of-Details) models, we use the classical convolutional neural networks to recognize the types and estimate the parameters of windows from image patches. The window types and parameters are then assembled into procedural grammar. A simple procedural engine is built inside an existing 3D modeling software, producing fine-grained window geometries. To obtain a useful model from a few labeled samples, we leverage the generative adversarial network to train the feature extractor in a semi-supervised manner. The adversarial training strategy can also exploit unlabeled data to make the training phase more stable. Experiments using publicly available facade image datasets reveal that the proposed training strategy can obtain about 10% improvement in classification accuracy and 50% improvement in parameter estimation under the same network structure. In addition, performance gains are more pronounced when testing against unseen data featuring different facade styles.
updated: Sat Jan 22 2022 06:34:48 GMT+0000 (UTC)
published: Sat Jan 22 2022 06:34:48 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト