Vehicle Re-identification: exploring feature fusion using multi-stream convolutional networks
 この作業は、重複しないカメラのネットワークを介した車両の再識別の問題に対処します。私たちの主な貢献として、利用可能な最も特徴的かつ永続的な機能の2つを同時に使用する新しい2ストリーム畳み込みニューラルネットワーク(CNN)を提案します:車両の外観とそのナンバープレート。これは、主要な問題、類似のデザインの車両または非常に近いナンバープレート識別子によって引き起こされる誤警報に取り組む試みです。最初のネットワークストリームでは、2つの異なるカメラで記録された低解像度の車両パッチのペアを使用するシャムCNNによって形状の類似性が識別されます。 2番目のストリームでは、光学文字認識(OCR)にCNNを使用して、高解像度のナンバープレートパッチのペアからテキスト情報、信頼スコア、および文字列の類似性を抽出します。次に、両方のストリームの機能が、決定のために完全に接続された一連のレイヤーによってマージされます。この作業の一環として、約3,000台の車両にまたがる3時間以上のビデオで車両の再識別のための重要なデータセットを作成しました。実験では、それぞれ99.6%、99.2%、99.4%の精度、再現率、Fスコアを達成しました。別の貢献として、同じ機能を探索するが、追加のストリームと時間情報を使用する3つの代替アーキテクチャについて説明し、比較します。提案されたアーキテクチャ、トレーニングされたモデル、およびデータセットはで公開されています。
This work addresses the problem of vehicle re-identification through a network of non-overlapping cameras. As our main contribution, we propose a novel two-stream convolutional neural network (CNN) that simultaneously uses two of the most distinctive and persistent features available: the vehicle appearance and its license plate. This is an attempt to tackle a major problem, false alarms caused by vehicles with similar design or by very close license plate identifiers. In the first network stream, shape similarities are identified by a Siamese CNN that uses a pair of low-resolution vehicle patches recorded by two different cameras. In the second stream, we use a CNN for optical character recognition (OCR) to extract textual information, confidence scores, and string similarities from a pair of high-resolution license plate patches. Then, features from both streams are merged by a sequence of fully connected layers for decision. As part of this work, we created an important dataset for vehicle re-identification with more than three hours of videos spanning almost 3,000 vehicles. In our experiments, we achieved a precision, recall and F -score values of 99.6%, 99.2% and 99.4%, respectively. As another contribution, we discuss and compare three alternative architectures that explore the same features but using additional streams and temporal information. The proposed architectures, trained models, and dataset are publicly available at .
updated: Wed May 06 2020 11:43:28 GMT+0000 (UTC)
published: Wed Nov 13 2019 15:23:04 GMT+0000 (UTC)
