ATRW: A Benchmark for Amur Tiger Re-identification in the Wild
絶滅危惧種の個体数と動きを監視することは、野生生物の会話にとって重要なタスクです。従来のタグ付け方法は大規模な個体群に対応していませんが、コンピュータービジョン方法をカメラセンサーデータに適用するには、野生生物の正確な数と移動軌跡を取得するための再識別(re-ID)アルゴリズムが必要です。ただし、既存のre-IDメソッドは主に、ポーズのバリエーションが制限され、キャプチャ環境が制約されている人と車を対象としています。このホワイトペーパーでは、新しい大規模データセットであるアムールトラの野生の再識別(ATRW)データセットを紹介することでギャップを埋めようとしています。 ATRWには、92頭のアムールトラからの8,000を超えるビデオクリップが含まれており、バウンディングボックス、ポーズキーポイント、およびトラのID注釈が付いています。典型的なre-IDデータセットとは対照的に、トラは制約のないポーズと照明条件の多様なセットでキャプチャされます。一連のベースラインアルゴリズムを使用して、ATRWがre-IDの難しいデータセットであることを示します。最後に、トラの大きなポーズの変化を処理するためにディープニューラルネットワークに正確なポーズパーツモデリングを導入し、既存のre-IDメソッドよりも大幅にパフォーマンスが向上する、トラの再識別の新しい方法を提案します。データセットはで公開されています。
Monitoring the population and movements of endangered species is an important task to wildlife conversation. Traditional tagging methods do not scale to large populations, while applying computer vision methods to camera sensor data requires re-identification (re-ID) algorithms to obtain accurate counts and moving trajectory of wildlife. However, existing re-ID methods are largely targeted at persons and cars, which have limited pose variations and constrained capture environments. This paper tries to fill the gap by introducing a novel large-scale dataset, the Amur Tiger Re-identification in the Wild (ATRW) dataset. ATRW contains over 8,000 video clips from 92 Amur tigers, with bounding box, pose keypoint, and tiger identity annotations. In contrast to typical re-ID datasets, the tigers are captured in a diverse set of unconstrained poses and lighting conditions. We demonstrate with a set of baseline algorithms that ATRW is a challenging dataset for re-ID. Lastly, we propose a novel method for tiger re-identification, which introduces precise pose parts modeling in deep neural networks to handle large pose variation of tigers, and reaches notable performance improvement over existing re-ID methods. The dataset is public available at .
updated: Sat Oct 31 2020 17:46:09 GMT+0000 (UTC)
published: Thu Jun 13 2019 10:16:30 GMT+0000 (UTC)
