arXiv reaDer
集約されたデータセットで順次トレーニングされたエンドツーエンドの個人検索
End-to-end Person Search Sequentially Trained on Aggregated Dataset
ビデオ監視アプリケーションでは、人物検索は、人物を検出し、再識別(re-ID)の目的でシルエットから特徴を抽出するという難しいタスクです。単一の深い畳み込みニューラルネットワークアーキテクチャを介して検出と特徴抽出のステップを共同で計算する新しいエンドツーエンドモデルを提案します。人々の共通点と特異性を共同で記述するために2つのタスク間で機能マップを共有すると、実行時間が短縮されます。これは、実際のアプリケーションで役立ちます。最先端の精度に到達することに加えて、このマルチタスクモデルは、タスクごとに順次トレーニングできるため、入力データセットタイプが広く受け入れられます。実際、コストのかかるID注釈なしでより多くの歩行者検出データセットを集約すると、共有機能マップがより一般的になり、re-IDの精度が向上することを示しています。さらに、これらのブーストされた共有機能マップにより、データセット間のシナリオに対してより堅牢なre-ID機能が実現します。
In video surveillance applications, person search is a challenging task consisting in detecting people and extracting features from their silhouette for re-identification (re-ID) purpose. We propose a new end-to-end model that jointly computes detection and feature extraction steps through a single deep Convolutional Neural Network architecture. Sharing feature maps between the two tasks for jointly describing people commonalities and specificities allows faster runtime, which is valuable in real-world applications. In addition to reaching state-of-the-art accuracy, this multi-task model can be sequentially trained task-by-task, which results in a broader acceptance of input dataset types. Indeed, we show that aggregating more pedestrian detection datasets without costly identity annotations makes the shared feature maps more generic, and improves re-ID precision. Moreover, these boosted shared feature maps result in re-ID features more robust to a cross-dataset scenario.
updated: Mon Jan 24 2022 11:22:15 GMT+0000 (UTC)
published: Mon Jan 24 2022 11:22:15 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト