arXiv reaDer
CoSE:構成的ストローク埋め込み
CoSE: Compositional Stroke Embeddings
ストロークベースの描画タスクなどの複雑な自由形式構造の生成モデルを提示します。以前のアプローチは、基本的なオブジェクトや手書きのテキストの描画にシーケンスベースのモデルに依存していましたが、図などの複雑な構造に構成できるストロークのコレクションとして描画を扱うモデルを提案します(フローチャートなど)。このアプローチの中核には、可変長のストロークを固定次元の潜在空間に投影する新しいオートエンコーダがあります。この表現空間により、潜在空間で動作するリレーショナルモデルは、ストローク間の関係をより適切にキャプチャし、後続のストロークを予測できます。提案されたアプローチが、個々のストロークの外観、およびより大きな図の描画の構成構造をモデル化できることを定性的および定量的に示します。私たちのアプローチは、図の自動補完などのインタラクティブなユースケースに適しています。コードとモデルはhttps://eth-ait.github.io/coseで公開されています。
We present a generative model for complex free-form structures such as stroke-based drawing tasks. While previous approaches rely on sequence-based models for drawings of basic objects or handwritten text, we propose a model that treats drawings as a collection of strokes that can be composed into complex structures such as diagrams (e.g., flow-charts). At the core of the approach lies a novel autoencoder that projects variable-length strokes into a latent space of fixed dimension. This representation space allows a relational model, operating in latent space, to better capture the relationship between strokes and to predict subsequent strokes. We demonstrate qualitatively and quantitatively that our proposed approach is able to model the appearance of individual strokes, as well as the compositional structure of larger diagram drawings. Our approach is suitable for interactive use cases such as auto-completing diagrams. We make code and models publicly available at https://eth-ait.github.io/cose.
updated: Mon Nov 30 2020 18:50:51 GMT+0000 (UTC)
published: Wed Jun 17 2020 15:22:54 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト