arXiv reaDer
領域の分解と組み立てに基づくオブジェクトの検出
Object Detection based on Region Decomposition and Assembly
領域ベースのオブジェクト検出は、画像内の1つ以上のカテゴリのオブジェクト領域を推測します。深層学習と領域提案法の最近の進歩により、畳み込みニューラルネットワーク(CNN)に基づくオブジェクト検出器が繁栄し、有望な検出結果を提供しています。ただし、オクルージョンや不正確な領域提案によって引き起こされるオブジェクトCNN機能の識別性が低いため、検出精度が低下することがよくあります。したがって、本論文では、より正確な物体検出のために、領域分解およびアセンブリ検出器(R-DAD)を提案します。提案されたR-DADでは、最初にオブジェクト領域を複数の小さな領域に分解します。オブジェクトの外観全体とパーツの詳細を一緒にキャプチャするために、オブジェクト領域全体と分解された領域内のCNN特徴を抽出します。次に、マルチリージョン機能をリージョンアセンブリブロックと段階的に組み合わせることにより、オブジェクトとそのパーツ間のセマンティック関係を学習し、オブジェクトの分類とローカリゼーションに組み合わせた高レベルのセマンティック機能を使用します。さらに、より正確な地域提案のために、さまざまなスケールのオブジェクト提案を生成できるマルチスケール提案レイヤーを提案します。 R-DADをいくつかの特徴抽出器に統合し、最近の畳み込み検出器と比較して、PASCAL07 / 12およびMSCOCO18で明確なパフォーマンスの向上を証明します。
Region-based object detection infers object regions for one or more categories in an image. Due to the recent advances in deep learning and region proposal methods, object detectors based on convolutional neural networks (CNNs) have been flourishing and provided the promising detection results. However, the detection accuracy is degraded often because of the low discriminability of object CNN features caused by occlusions and inaccurate region proposals. In this paper, we therefore propose a region decomposition and assembly detector (R-DAD) for more accurate object detection. In the proposed R-DAD, we first decompose an object region into multiple small regions. To capture an entire appearance and part details of the object jointly, we extract CNN features within the whole object region and decomposed regions. We then learn the semantic relations between the object and its parts by combining the multi-region features stage by stage with region assembly blocks, and use the combined and high-level semantic features for the object classification and localization. In addition, for more accurate region proposals, we propose a multi-scale proposal layer that can generate object proposals of various scales. We integrate the R-DAD into several feature extractors, and prove the distinct performance improvement on PASCAL07/12 and MSCOCO18 compared to the recent convolutional detectors.
updated: Mon Nov 16 2020 04:30:17 GMT+0000 (UTC)
published: Thu Jan 24 2019 04:09:10 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト