arXiv reaDer
自然言語ベースの車両検索のための言語とビジョンの接続
Connecting Language and Vision for Natural Language-Based Vehicle Retrieval
車両検索は、AI シティの観点から効率的な交通管理のための基本的なタスクの 1 つです。既存の手法のほとんどは、車両の再識別や車両の追跡など、画像ベースの車両マッチングに焦点を当てています。この論文では、1 つの新しいモダリティ、つまり言語記述を適用して、対象の車両を検索し、現実世界のシナリオでこのタスクの可能性を探ります。自然言語ベースの車両検索は、視覚と言語モダリティの両方をきめ細かく理解するという 1 つの新しい課題を提起します。言語と視覚を結び付けるために、最先端の視覚モデルをトランスフォーマーベースの言語モデルと一緒にエンドツーエンドでトレーニングすることを提案します。ネットワーク構造の設計とトレーニング戦略を除いて、この作業ではいくつかの最適化目標も再検討されます。定性的および定量的実験により、提案された方法の有効性が検証されます。私たちの提案した方法は、第 5 回 AI シティ チャレンジで 1 位を獲得し、プライベート テスト セットで 18.69% の MRR 精度の競争力のあるパフォーマンスをもたらしました。この作業が、実世界の車両検索システムで言語記述を効果的かつ効率的に使用することに関する将来の研究の道を開くことを願っています。コードは https://github.com/ShuaiBai623/AIC2021-T5-CLV で入手できます。
Vehicle search is one basic task for the efficient traffic management in terms of the AI City. Most existing practices focus on the image-based vehicle matching, including vehicle re-identification and vehicle tracking. In this paper, we apply one new modality, i.e., the language description, to search the vehicle of interest and explore the potential of this task in the real-world scenario. The natural language-based vehicle search poses one new challenge of fine-grained understanding of both vision and language modalities. To connect language and vision, we propose to jointly train the state-of-the-art vision models with the transformer-based language model in an end-to-end manner. Except for the network structure design and the training strategy, several optimization objectives are also re-visited in this work. The qualitative and quantitative experiments verify the effectiveness of the proposed method. Our proposed method has achieved the 1st place on the 5th AI City Challenge, yielding competitive performance 18.69% MRR accuracy on the private test set. We hope this work can pave the way for the future study on using language description effectively and efficiently for real-world vehicle retrieval systems. The code will be available at https://github.com/ShuaiBai623/AIC2021-T5-CLV.
updated: Mon May 31 2021 11:42:03 GMT+0000 (UTC)
published: Mon May 31 2021 11:42:03 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト