arXiv reaDer
畳み込みニューラルネットワークを使用した高密度オブジェクトのカウントと検索
Counting and Locating High-Density Objects Using Convolutional Neural Network
このホワイトペーパーでは、高密度画像内のオブジェクトをカウントおよび特定するための畳み込みニューラルネットワーク(CNN)アプローチについて説明します。私たちの知る限りでは、これは、フィーチャマップの拡張と信頼マップのマルチステージリファインメントに基づく最初のオブジェクトのカウントと位置特定の方法です。提案された方法は、木と車の2つのカウントデータセットで評価されました。ツリーデータセットの場合、このメソッドは2.05の平均絶対誤差(MAE)、2.87の二乗平均平方根誤差(RMSE)、および0.986の決定係数(R ^ 2)を返しました。車のデータセット(CARPKおよびPUCPR +)の場合、私たちの方法は最先端の方法よりも優れていました。これらのデータセットでは、私たちのアプローチは、それぞれ4.45と3.16のMAE、6.18と4.39のRMSE、および0.975と0.999のR ^ 2を達成しました。提案された方法は、高いオブジェクト密度を処理するのに適しており、オブジェクトをカウントおよび検索するための最先端のパフォーマンスを返します。
This paper presents a Convolutional Neural Network (CNN) approach for counting and locating objects in high-density imagery. To the best of our knowledge, this is the first object counting and locating method based on a feature map enhancement and a Multi-Stage Refinement of the confidence map. The proposed method was evaluated in two counting datasets: tree and car. For the tree dataset, our method returned a mean absolute error (MAE) of 2.05, a root-mean-squared error (RMSE) of 2.87 and a coefficient of determination (R^2) of 0.986. For the car dataset (CARPK and PUCPR+), our method was superior to state-of-the-art methods. In the these datasets, our approach achieved an MAE of 4.45 and 3.16, an RMSE of 6.18 and 4.39, and an R^2 of 0.975 and 0.999, respectively. The proposed method is suitable for dealing with high object-density, returning a state-of-the-art performance for counting and locating objects.
updated: Mon Feb 08 2021 17:17:10 GMT+0000 (UTC)
published: Mon Feb 08 2021 17:17:10 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト