Similarity Learning Networks for Animal Individual Re-Identification -- Beyond the Capabilities of a Human Observer
ディープラーニングは、大量のラベル付きデータが利用可能な場合に、コンピュータービジョンタスクに取り組むための標準的な方法論になりました。従来のディープラーニングアプローチが実行できない領域の1つは、モデルが1つの例だけを見て新しいカテゴリを正しく分類する必要があるワンショット学習タスクです。そのような領域の1つは、動物の再識別であり、カメラトラップの画像から種の個体数の推定を自動化する方法としてグローバルに使用できるコンピュータービジョンのアプリケーションです。私たちの仕事は、類似性比較ネットワークの動物の再識別への適用と、ドメイン間で一般化する深い畳み込みニューラルネットワークの機能の両方を示しています。種間での動物の再同定方法を検討した研究はほとんどありません。ここでは、AlexNet、VGG-19、DenseNet201、MobileNetV2、およびInceptionV3アーキテクチャに基づいて、平均平均精度(mAP)@ 1およびmAP @ 5を考慮した2つの類似性比較手法(シャムとトリプレットロス)を比較します。人間、チンパンジー、ザトウクジラ、ショウジョウバエ、シベリアトラの5つの異なる種に対応する5つのデータセットを検討します。それぞれに独自の課題があります。トリプレットの損失がすべての種のシャムの対応物を上回ったことを示しています。種固有の変更がない場合、我々の結果は、類似性比較ネットワークが動物の再識別のタスクで人間のパフォーマンスレベルを超えるパフォーマンスレベルに到達できることを示しています。研究者が再遭遇時に動物個体を再特定する能力は、個体群動態およびコミュニティ/行動生態学の研究における幅広い質問に取り組むための基本です。私たちの期待は、類似性比較ネットワークが、カメラトラップデータからの動物の再識別に革命を起こす可能性のある大きなトレンドの始まりであることです。
Deep learning has become the standard methodology to approach computer vision tasks when large amounts of labeled data are available. One area where traditional deep learning approaches fail to perform is one-shot learning tasks where a model must correctly classify a new category after seeing only one example. One such domain is animal re-identification, an application of computer vision which can be used globally as a method to automate species population estimates from camera trap images. Our work demonstrates both the application of similarity comparison networks to animal re-identification, as well as the capabilities of deep convolutional neural networks to generalize across domains. Few studies have considered animal re-identification methods across species. Here, we compare two similarity comparison methodologies: Siamese and Triplet-Loss, based on the AlexNet, VGG-19, DenseNet201, MobileNetV2, and InceptionV3 architectures considering mean average precision (mAP)@1 and mAP@5. We consider five data sets corresponding to five different species: humans, chimpanzees, humpback whales, fruit flies, and Siberian tigers, each with their own unique set of challenges. We demonstrate that Triplet Loss outperformed its Siamese counterpart for all species. Without any species-specific modifications, our results demonstrate that similarity comparison networks can reach a performance level beyond that of humans for the task of animal re-identification. The ability for researchers to re-identify an animal individual upon re-encounter is fundamental for addressing a broad range of questions in the study of population dynamics and community/behavioural ecology. Our expectation is that similarity comparison networks are the beginning of a major trend that could stand to revolutionize animal re-identification from camera trap data.
updated: Wed Jul 01 2020 15:53:15 GMT+0000 (UTC)
published: Thu Feb 21 2019 19:52:23 GMT+0000 (UTC)
