顕微鏡画像上でプランクティック有孔虫の殻を分類する問題に、初めてディープメトリック学習を適用します。この種認識タスクは、過去の気候を再構築するための重要な情報源であり、科学の柱です。文献にあるすべての有孔虫CNN認識パイプラインは、人間の専門家向けの視覚化オプションがなく、開集合の問題に適用できないブラックボックス分類器を生成します。ここでは、これらのパイプラインに対してメトリック学習のベンチマークを行い、表現型のプランクティック有孔虫の形態空間の最初の科学的可視化を作成し、トレーニング中に見えない種をクラスター化するためにメトリック学習を使用できることを示します。メトリック学習は、このドメインで公開されているすべてのCNNベースの最先端のベンチマークよりも優れていることを示しています。 35の現代のプランクティック有孔虫種のEndlessForams公共図書館の34,640の専門家注釈付き画像で私たちのアプローチを評価します。このデータに関する私たちの結果は、保留されたテストデータでエキスパートラベルを再現する際に92%の精度(0.84 F1スコアで)を示し、トレーニングで種をクラスター化する際に66.5%の精度(0.70 F1スコアで)を示しています。メトリック学習はこのドメインに非常に効果的であり、微小化石同定の専門家によるループ自動化に向けた重要なツールとして機能すると結論付けています。キーコード、ネットワークの重み、およびデータ分割は、完全な再現性のためにこのペーパーで公開されています。
We apply deep metric learning for the first time to the prob-lem of classifying planktic foraminifer shells on microscopic images. This species recognition task is an important information source and scientific pillar for reconstructing past climates. All foraminifer CNN recognition pipelines in the literature produce black-box classifiers that lack visualisation options for human experts and cannot be applied to open set problems. Here, we benchmark metric learning against these pipelines, produce the first scientific visualisation of the phenotypic planktic foraminifer morphology space, and demonstrate that metric learning can be used to cluster species unseen during training. We show that metric learning out-performs all published CNN-based state-of-the-art benchmarks in this domain. We evaluate our approach on the 34,640 expert-annotated images of the Endless Forams public library of 35 modern planktic foraminifera species. Our results on this data show leading 92% accuracy (at 0.84 F1-score) in reproducing expert labels on withheld test data, and 66.5% accuracy (at 0.70 F1-score) when clustering species never encountered in training. We conclude that metric learning is highly effective for this domain and serves as an important tool towards expert-in-the-loop automation of microfossil identification. Key code, network weights, and data splits are published with this paper for full reproducibility.