arXiv reaDer
平面ジオメトリ図の解析
Plane Geometry Diagram Parsing
ジオメトリ図の解析は、ジオメトリの問題解決において重要な役割を果たします。この場合、複雑なレイアウトとプリミティブ間の関係のために、プリミティブの抽出と関係の解析は依然として困難です。本論文では、深層学習とグラフ推論に基づく強力なダイアグラムパーサーを提案します。具体的には、修正インスタンスセグメンテーション方法を提案して幾何学的プリミティブを抽出し、グラフニューラルネットワーク(GNN)を利用して、幾何学的特徴と事前知識を組み込んだ関係解析とプリミティブ分類を実現します。すべてのモジュールは、PGDPNetと呼ばれるエンドツーエンドモデルに統合され、すべてのサブタスクを同時に実行します。さらに、プリミティブレベルの注釈を付けたPGDP5Kという名前の新しい大規模なジオメトリダイアグラムデータセットを構築します。 PGDP5Kと既存のデータセットIMP-Geometry3Kでの実験は、私たちのモデルが4つのサブタスクで最先端の方法を著しく上回っていることを示しています。コード、データセット、付録の資料はhttps://github.com/mingliangzhang2018/PGDPで入手できます。
Geometry diagram parsing plays a key role in geometry problem solving, wherein the primitive extraction and relation parsing remain challenging due to the complex layout and between-primitive relationship. In this paper, we propose a powerful diagram parser based on deep learning and graph reasoning. Specifically, a modified instance segmentation method is proposed to extract geometric primitives, and the graph neural network (GNN) is leveraged to realize relation parsing and primitive classification incorporating geometric features and prior knowledge. All the modules are integrated into an end-to-end model called PGDPNet to perform all the sub-tasks simultaneously. In addition, we build a new large-scale geometry diagram dataset named PGDP5K with primitive level annotations. Experiments on PGDP5K and an existing dataset IMP-Geometry3K show that our model outperforms state-of-the-art methods in four sub-tasks remarkably. Our code, dataset and appendix material are available at https://github.com/mingliangzhang2018/PGDP.
updated: Thu May 19 2022 07:47:01 GMT+0000 (UTC)
published: Thu May 19 2022 07:47:01 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト