カメラ トラップは、生息地や行動のために以前はほとんど観察できなかった多くの種の動物研究に革命をもたらしました。それらは通常、トリガーされたときに短い一連の画像を撮影する木に固定されたカメラです。深層学習は、分類群または空の画像に従って画像分類を自動化するための作業負荷を克服する可能性を秘めています。ただし、標準的なディープ ニューラル ネットワーク分類器は、動物が高解像度画像のごく一部を表すことが多いため、失敗します。そのため、この課題に適した Weakly Object Detection Faster-RCNN+FPN という名前のワークフローを提案します。このモデルは、画像ごとに動物分類群のラベルのみを必要とし、手動の境界ボックスの注釈を必要としないため、監視が弱いです。まず、複数のフレームからのモーションを使用して、弱教師付きバウンディング ボックス アノテーションを自動的に実行します。次に、この弱い教師を使用して Faster-RCNN+FPN モデルをトレーニングします。パプア ニューギニアとミズーリ州の生物多様性モニタリング キャンペーンからの 2 つのデータセットを使用して、簡単に再現可能なテストベッドで実験結果が得られました。
Camera traps have revolutionized the animal research of many species that were previously nearly impossible to observe due to their habitat or behavior. They are cameras generally fixed to a tree that take a short sequence of images when triggered. Deep learning has the potential to overcome the workload to automate image classification according to taxon or empty images. However, a standard deep neural network classifier fails because animals often represent a small portion of the high-definition images. That is why we propose a workflow named Weakly Object Detection Faster-RCNN+FPN which suits this challenge. The model is weakly supervised because it requires only the animal taxon label per image but doesn't require any manual bounding box annotations. First, it automatically performs the weakly-supervised bounding box annotation using the motion from multiple frames. Then, it trains a Faster-RCNN+FPN model using this weak supervision. Experimental results have been obtained with two datasets from a Papua New Guinea and Missouri biodiversity monitoring campaign, then on an easily reproducible testbed.