arXiv reaDer
ForamViT-GAN: 微小古生物学的画像解析のための深層学習における新しいパラダイムの探索
ForamViT-GAN: Exploring New Paradigms in Deep Learning for Micropaleontological Image Analysis
地球科学における微古生物学は、過去の環境および気候条件を再構築するために、地質学的記録を通じて微化石 (有孔虫など) の進化を研究することに焦点を当てています。この分野は、微化石の特徴の視覚的認識に大きく依存しているため、微化石の識別と分類を自動化および最適化するために、コンピューター ビジョン テクノロジ、特に深層畳み込みニューラル ネットワーク (CNN) に適しています。ただし、微古生物学における深層学習の適用は、高品質で高解像度のラベル付き化石画像の利用が限られていることと、専門家が必要とする多大な手動のラベル付け作業によって妨げられています。これらの課題に対処するために、階層型ビジョン トランスフォーマーとスタイルベースの敵対的生成ネットワーク アルゴリズムを組み合わせた新しい深層学習ワークフローを提案し、微古生物学の現実的な高解像度のラベル付きデータセットを大量に効率的に取得して合成的に生成します。私たちの研究は、このワークフローが高い信号対雑音比 (39.1 dB) の高解像度画像と、14.88 のフレシェ開始距離類似性スコアを持つ現実的な合成画像を生成できることを示しています。さらに、私たちのワークフローは、モデルのベンチマークや、化石の分類やセグメンテーションなど、さまざまなダウンストリーム ビジュアル タスクのために大量の自己ラベル付きデータセットを提供します。初めて、生成された画像と合成画像の両方で、異なる有孔虫チャンバーの少数ショットセマンティックセグメンテーションを高精度で実行しました。この新しいメタ学習アプローチは、高解像度で大量のラベル付きデータセットが利用できる場合にのみ可能です。当社の深層学習ベースのワークフローは、微古生物学的研究やその他の視覚に依存する地質学的分析の進歩と最適化に有望です。
Micropaleontology in geosciences focuses on studying the evolution of microfossils (e.g., foraminifera) through geological records to reconstruct past environmental and climatic conditions. This field heavily relies on visual recognition of microfossil features, making it suitable for computer vision technology, specifically deep convolutional neural networks (CNNs), to automate and optimize microfossil identification and classification. However, the application of deep learning in micropaleontology is hindered by limited availability of high-quality, high-resolution labeled fossil images and the significant manual labeling effort required by experts. To address these challenges, we propose a novel deep learning workflow combining hierarchical vision transformers with style-based generative adversarial network algorithms to efficiently acquire and synthetically generate realistic high-resolution labeled datasets of micropaleontology in large volumes. Our study shows that this workflow can generate high-resolution images with a high signal-to-noise ratio (39.1 dB) and realistic synthetic images with a Frechet inception distance similarity score of 14.88. Additionally, our workflow provides a large volume of self-labeled datasets for model benchmarking and various downstream visual tasks, including fossil classification and segmentation. For the first time, we performed few-shot semantic segmentation of different foraminifera chambers on both generated and synthetic images with high accuracy. This novel meta-learning approach is only possible with the availability of high-resolution, high-volume labeled datasets. Our deep learning-based workflow shows promise in advancing and optimizing micropaleontological research and other visual-dependent geological analyses.
updated: Sun Apr 09 2023 18:49:38 GMT+0000 (UTC)
published: Sun Apr 09 2023 18:49:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト