自動認識用の注釈付き細菌(AGAR)データセットは、寒天プレート上で培養された微生物コロニーの画像データベースです。これには、2つの異なるカメラを使用してさまざまな照明条件下で撮影された、単一または混合培養としての5つの異なる微生物の18000枚の写真が含まれています。すべての画像は「カウント可能」、「カウント不可能」、「空」に分類され、「カウント可能」クラスは微生物学者によってコロニーの位置と種の識別(合計336442コロニー)でラベル付けされています。この調査では、データセット自体とその開発プロセスについて説明します。第2部では、オブジェクト検出用に選択されたディープニューラルネットワークアーキテクチャ、つまりFasterR-CNNとCascadeR-CNNのパフォーマンスをAGARデータセットで評価しました。結果は、ペトリ皿の写真に基づいて微生物の局在化と分類のプロセスを自動化するディープラーニング手法の大きな可能性を確認しました。さらに、AGARは、この種とサイズの最初の公開されたデータセットであり、機械学習モデルの将来の開発を容易にします。これらの研究で使用されたデータはhttps://agar.neurosys.com/で見つけることができます。
The Annotated Germs for Automated Recognition (AGAR) dataset is an image database of microbial colonies cultured on agar plates. It contains 18000 photos of five different microorganisms as single or mixed cultures, taken under diverse lighting conditions with two different cameras. All the images are classified into "countable", "uncountable", and "empty", with the "countable" class labeled by microbiologists with colony location and species identification (336442 colonies in total). This study describes the dataset itself and the process of its development. In the second part, the performance of selected deep neural network architectures for object detection, namely Faster R-CNN and Cascade R-CNN, was evaluated on the AGAR dataset. The results confirmed the great potential of deep learning methods to automate the process of microbe localization and classification based on Petri dish photos. Moreover, AGAR is the first publicly available dataset of this kind and size and will facilitate the future development of machine learning models. The data used in these studies can be found at https://agar.neurosys.com/.