arXiv reaDer
APT-36K:動物のポーズの推定と追跡のための大規模なベンチマーク
APT-36K: A Large-scale Benchmark for Animal Pose Estimation and Tracking
動物のポーズの推定と追跡(APT)は、一連のビデオフレームから動物のキーポイントを検出および追跡するための基本的なタスクです。以前の動物関連のデータセットは、動物の追跡または単一フレームの動物のポーズ推定のいずれかに焦点を当てており、両方の側面に焦点を当てることはありません。 APTデータセットの欠如は、ビデオベースの動物のポーズの推定と追跡方法の開発と評価を妨げ、野生生物保護における動物の行動の理解など、実際のアプリケーションを制限します。このギャップを埋めるために、私たちは最初のステップを作成し、APT-36K、つまり動物のポーズの推定と追跡のための最初の大規模なベンチマークを提案します。具体的には、APT-36Kは、30の動物種から収集およびフィルタリングされた2,400のビデオクリップで構成され、各ビデオに15フレームが含まれ、合計で36,000フレームになります。手動の注釈と注意深い再確認の後、すべての動物のインスタンスに高品質のキーポイントと追跡の注釈が提供されます。 APT-36Kに基づいて、次の3つのトラックでいくつかの代表的なモデルのベンチマークを行います。(1)ドメイン内およびドメイン間転送学習設定での単一フレームでの教師あり動物ポーズ推定、(2)見えないものの種間ドメイン一般化テスト動物、および(3)動物追跡による動物の姿勢推定。実験結果に基づいて、いくつかの経験的洞察を得て、APT-36Kが貴重な動物のポーズ推定と追跡ベンチマークを提供し、将来の研究のための新しい課題と機会を提供することを示します。コードとデータセットは、https://github.com/pandorgan/APT-36Kで公開されます。
Animal pose estimation and tracking (APT) is a fundamental task for detecting and tracking animal keypoints from a sequence of video frames. Previous animal-related datasets focus either on animal tracking or single-frame animal pose estimation, and never on both aspects. The lack of APT datasets hinders the development and evaluation of video-based animal pose estimation and tracking methods, limiting real-world applications, e.g., understanding animal behavior in wildlife conservation. To fill this gap, we make the first step and propose APT-36K, i.e., the first large-scale benchmark for animal pose estimation and tracking. Specifically, APT-36K consists of 2,400 video clips collected and filtered from 30 animal species with 15 frames for each video, resulting in 36,000 frames in total. After manual annotation and careful double-check, high-quality keypoint and tracking annotations are provided for all the animal instances. Based on APT-36K, we benchmark several representative models on the following three tracks: (1) supervised animal pose estimation on a single frame under intra- and inter-domain transfer learning settings, (2) inter-species domain generalization test for unseen animals, and (3) animal pose estimation with animal tracking. Based on the experimental results, we gain some empirical insights and show that APT-36K provides a valuable animal pose estimation and tracking benchmark, offering new challenges and opportunities for future research. The code and dataset will be made publicly available at https://github.com/pandorgan/APT-36K.
updated: Thu Oct 13 2022 01:47:35 GMT+0000 (UTC)
published: Sun Jun 12 2022 07:18:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト