arXiv reaDer
MTCNET:群衆数推定のためのマルチタスク学習パラダイム
MTCNET: Multi-task Learning Paradigm for Crowd Count Estimation
群衆密度とカウント推定のために、MTCNet(Multi-Task Crowd Network)と呼ばれるマルチタスク学習(MTL)パラダイムベースのディープニューラルネットワークアーキテクチャを提案します。群衆数の推定は、不均一なスケール変動と個々の画像の任意の視点のために困難です。提案モデルには2つの関連タスクがあり、主なタスクとして群集密度推定が、補助タスクとして群集数グループ分類があります。補助タスクは、関連するスケール関連情報をキャプチャして、メインタスクのパフォーマンスを向上させるのに役立ちます。メインタスクモデルは、2つのブロックで構成されています。特徴抽出用のVGG-16フロントエンドと密度マップ生成用の拡張された畳み込みニューラルネットワークです。補助タスクモデルは、メインタスクと同じフロントエンドを共有し、その後にCNN分類器が続きます。提案されたネットワークは、データ拡張を使用せずに、ShanghaiTechデータセットの最新の方法よりも5.8%および14.9%低い平均絶対誤差(MAE)を達成します。また、このモデルは、UCF_CC_50データセットで10.5%低いMAEで優れています。
We propose a Multi-Task Learning (MTL) paradigm based deep neural network architecture, called MTCNet (Multi-Task Crowd Network) for crowd density and count estimation. Crowd count estimation is challenging due to the non-uniform scale variations and the arbitrary perspective of an individual image. The proposed model has two related tasks, with Crowd Density Estimation as the main task and Crowd-Count Group Classification as the auxiliary task. The auxiliary task helps in capturing the relevant scale-related information to improve the performance of the main task. The main task model comprises two blocks: VGG-16 front-end for feature extraction and a dilated Convolutional Neural Network for density map generation. The auxiliary task model shares the same front-end as the main task, followed by a CNN classifier. Our proposed network achieves 5.8% and 14.9% lower Mean Absolute Error (MAE) than the state-of-the-art methods on ShanghaiTech dataset without using any data augmentation. Our model also outperforms with 10.5% lower MAE on UCF_CC_50 dataset.
updated: Fri Aug 23 2019 03:30:53 GMT+0000 (UTC)
published: Fri Aug 23 2019 03:30:53 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト