Compound Figure Separation of Biomedical Images with Side Loss
教師なし学習アルゴリズム(自己監視学習、自動エンコーダー、対照学習など)により、深層学習モデルは、大規模なラベルなしデータから効果的な画像表現を学習できます。医療画像分析では、注釈のないデータでさえ、個々のラボで取得するのが難しい場合があります。幸いなことに、以前の科学出版物から生物医学画像データを取得するための効率的なアクセスを提供するために、全国レベルの努力がなされてきました。たとえば、NIHは、大規模な画像データベースに無料でアクセスできるOpen-i検索エンジンを発表しました。ただし、科学出版物の画像は、サブプロットを含むかなりの量の複合図で構成されています。個々のサブプロットを抽出してキュレートするために、特に最近の深層学習の進歩に伴い、多くの異なる複合図形分離アプローチが開発されました。ただし、以前のアプローチでは通常、検出モデルをトレーニングするためにリソースの広範なバウンディングボックスアノテーションが必要でした。この論文では、個々の画像からの弱い分類注釈を使用する単純な複合図形分離(SimCFS)フレームワークを提案します。私たちの技術的貢献は3つあります。(1)複合図形分離用に設計された新しいサイドロスを導入します。 (2)ハードケースをシミュレートするためのクラス内画像拡張方法を導入します。 (3)提案されたフレームワークは、リソースの広範なバウンディングボックス注釈を必要とせずに、新しいクラスの画像への効率的な展開を可能にします。その結果から、SimCFSはImageCLEF2016複合図形分離データベースで新しい最先端のパフォーマンスを達成しました。 SimCFSのソースコードは、で公開されています。
Unsupervised learning algorithms (e.g., self-supervised learning, auto-encoder, contrastive learning) allow deep learning models to learn effective image representations from large-scale unlabeled data. In medical image analysis, even unannotated data can be difficult to obtain for individual labs. Fortunately, national-level efforts have been made to provide efficient access to obtain biomedical image data from previous scientific publications. For instance, NIH has launched the Open-i search engine that provides a large-scale image database with free access. However, the images in scientific publications consist of a considerable amount of compound figures with subplots. To extract and curate individual subplots, many different compound figure separation approaches have been developed, especially with the recent advances in deep learning. However, previous approaches typically required resource extensive bounding box annotation to train detection models. In this paper, we propose a simple compound figure separation (SimCFS) framework that uses weak classification annotations from individual images. Our technical contribution is three-fold: (1) we introduce a new side loss that is designed for compound figure separation; (2) we introduce an intra-class image augmentation method to simulate hard cases; (3) the proposed framework enables an efficient deployment to new classes of images, without requiring resource extensive bounding box annotations. From the results, the SimCFS achieved a new state-of-the-art performance on the ImageCLEF 2016 Compound Figure Separation Database. The source code of SimCFS is made publicly available at
updated: Mon Jul 19 2021 07:16:32 GMT+0000 (UTC)
published: Mon Jul 19 2021 07:16:32 GMT+0000 (UTC)
