分子構造認識は、分子画像をそのグラフ構造に変換するタスクです。化学文献に示されている描画スタイルと慣習には大きな違いがあるため、この作業を自動化する上で大きな課題となっています。この論文では、分子構造を構築するために、原子と結合をそれらの幾何学的レイアウトとともに明示的に予測する新しい画像からグラフへの生成モデルである MolScribe を提案します。私たちのモデルは、象徴的な化学的制約を柔軟に組み込んで、キラリティーを認識し、省略された構造を拡張します。ドメインシフトに対するモデルの堅牢性を強化するためのデータ拡張戦略をさらに開発します。合成画像と現実的な分子画像の両方の実験で、MolScribe は以前のモデルよりも大幅に優れており、公開ベンチマークで 76 ~ 93% の精度を達成しています。化学者は、MolScribe の予測を、その信頼性の推定と入力画像との原子レベルの位置合わせによって情報を得て、簡単に検証することもできます。 MolScribe は、Python および Web インターフェイス (https://github.com/thomas0809/MolScribe) を通じて公開されています。
Molecular structure recognition is the task of translating a molecular image into its graph structure. Significant variation in drawing styles and conventions exhibited in chemical literature poses a significant challenge for automating this task. In this paper, we propose MolScribe, a novel image-to-graph generation model that explicitly predicts atoms and bonds, along with their geometric layouts, to construct the molecular structure. Our model flexibly incorporates symbolic chemistry constraints to recognize chirality and expand abbreviated structures. We further develop data augmentation strategies to enhance the model robustness against domain shifts. In experiments on both synthetic and realistic molecular images, MolScribe significantly outperforms previous models, achieving 76-93% accuracy on public benchmarks. Chemists can also easily verify MolScribe's prediction, informed by its confidence estimation and atom-level alignment with the input image. MolScribe is publicly available through Python and web interfaces: https://github.com/thomas0809/MolScribe.