Data-Efficient Classification of Birdcall Through Convolutional Neural Networks Transfer Learning
  深層学習畳み込みニューラルネットワーク(CNN)モデルは強力な分類モデルですが、大量のトレーニングデータが必要です。鳥の音響学などのニッチな分野では、多数のトレーニングサンプルを入手するのは高価で困難です。限られた数のトレーニングサンプルでデータを分類する1つの方法は、転送学習を使用することです。この研究では、ResNet-50 CNNを使用して、より大きなベースデータセット(46クラスの2814サンプル)からより小さなターゲットデータセット(10クラスの351サンプル)への転送学習を使用したバードコール分類の有効性を評価しました。 5倍の交差検証で、ターゲットデータセットで79%の平均検証精度を得ました。 ImageNetでトレーニングされたCNNからプロジェクト固有の非常に小さなクラスと画像のセットに学習を移行する方法論は、基本データセットがImageNetの役割を効果的に果たしたスペクトログラム画像のドメインに拡張されました。
Deep learning Convolutional Neural Network (CNN) models are powerful classification models but require a large amount of training data. In niche domains such as bird acoustics, it is expensive and difficult to obtain a large number of training samples. One method of classifying data with a limited number of training samples is to employ transfer learning. In this research, we evaluated the effectiveness of birdcall classification using transfer learning from a larger base dataset (2814 samples in 46 classes) to a smaller target dataset (351 samples in 10 classes) using the ResNet-50 CNN. We obtained 79% average validation accuracy on the target dataset in 5-fold cross-validation. The methodology of transfer learning from an ImageNet-trained CNN to a project-specific and a much smaller set of classes and images was extended to the domain of spectrogram images, where the base dataset effectively played the role of the ImageNet.
updated: Tue Sep 17 2019 00:16:16 GMT+0000 (UTC)
published: Tue Sep 17 2019 00:16:16 GMT+0000 (UTC)
