arXiv reaDer
Digitize-PID:配管図と計装図の自動デジタル化
Digitize-PID: Automatic Digitization of Piping and Instrumentation Diagrams
数十年にわたって石油やガスなどの製造業や機械産業で広く使用されているスキャンされた配管および計装図(P&ID)のデジタル化は、動的在庫管理および最新のCADツールと互換性のあるスマートP&IDの作成における重大なボトルネックになっています。これまで、P&IDシートは、スキャンしてPDFとして保存する前に、設計段階で手動で生成されてきました。現在のデジタル化イニシアチブは手動処理を伴うため、非常に時間がかかり、労働集約的で、エラーが発生しやすくなっています。画像処理、機械、ディープラーニング技術の進歩のおかげで、P&IDデジタル化に関する新しい研究が行われています。ただし、既存のソリューションは、P&IDの規模、サイズ、ノイズのばらつき、図面内の複雑さと混雑、図面の解釈に必要なドメイン知識のために、いくつかの課題に直面しています。これにより、Digitize-PIDと呼ばれる現在のソリューションが動機付けられます。これは、パイプ、シンボル、テキスト情報などのP&IDからコアコンポーネントを検出するためのエンドツーエンドのパイプラインで構成され、その後、相互に関連付けられ、最終的には出力の検証と修正が行われます。固有のドメイン知識に基づくデータ。この論文では、新しく効率的なカーネルベースのライン検出と、きめ細かい深い認識技術に基づいて複雑なシンボルを検出するための2段階の方法を紹介します。さらに、さまざまな種類のノイズと複雑な記号を組み込んで、500個のP&IDの注釈付き合成データセットDataset-P&IDを作成しました。これは、一般に公開されています(現在、公開P&IDデータセットはありません)。この合成データセットと12枚のP&IDシートの実際の匿名化されたプライベートデータセットで提案された方法を評価します。結果は、Digitize-PIDが既存の最先端のP&IDデジタル化よりも優れていることを示しています。
Digitization of scanned Piping and Instrumentation diagrams(P&ID), widely used in manufacturing or mechanical industries such as oil and gas over several decades, has become a critical bottleneck in dynamic inventory management and creation of smart P&IDs that are compatible with the latest CAD tools. Historically, P&ID sheets have been manually generated at the design stage, before being scanned and stored as PDFs. Current digitization initiatives involve manual processing and are consequently very time consuming, labour intensive and error-prone.Thanks to advances in image processing, machine and deep learning techniques there are emerging works on P&ID digitization. However, existing solutions face several challenges owing to the variation in the scale, size and noise in the P&IDs, sheer complexity and crowdedness within drawings, domain knowledge required to interpret the drawings. This motivates our current solution called Digitize-PID which comprises of an end-to-end pipeline for detection of core components from P&IDs like pipes, symbols and textual information, followed by their association with each other and eventually, the validation and correction of output data based on inherent domain knowledge. A novel and efficient kernel-based line detection and a two-step method for detection of complex symbols based on a fine-grained deep recognition technique is presented in the paper. In addition, we have created an annotated synthetic dataset, Dataset-P&ID, of 500 P&IDs by incorporating different types of noise and complex symbols which is made available for public use (currently there exists no public P&ID dataset). We evaluate our proposed method on this synthetic dataset and a real-world anonymized private dataset of 12 P&ID sheets. Results show that Digitize-PID outperforms the existing state-of-the-art for P&ID digitization.
updated: Wed Sep 08 2021 17:32:49 GMT+0000 (UTC)
published: Wed Sep 08 2021 17:32:49 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト