自然言語(NL)の説明は、都市規模の交通パターンや車両関連のイベントを理解および検出するために構築されたシステムと対話するための最も便利な、または唯一の方法です。このホワイトペーパーでは、広く採用されているCityFlowベンチマークを、車両ターゲットの自然言語記述で拡張し、CityFlow-NLベンチマークを紹介します。 CityFlow-NLには、車両ターゲットの5,000を超える一意で正確なNL記述が含まれており、私たちの知る限り、NL記述データセットを使用した最大規模の追跡になります。さらに、データセットは、マルチオブジェクトトラッキング、NL記述による検索、およびイベントの時間的ローカリゼーションの交差点での調査を容易にします。
Natural Language (NL) descriptions can be the most convenient or the only way to interact with systems built to understand and detect city scale traffic patterns and vehicle-related events. In this paper, we extend the widely adopted CityFlow Benchmark with natural language descriptions for vehicle targets and introduce the CityFlow-NL Benchmark. The CityFlow-NL contains more than 5,000 unique and precise NL descriptions of vehicle targets, making it the largest-scale tracking with NL descriptions dataset to our knowledge. Moreover, the dataset facilitates research at the intersection of multi-object tracking, retrieval by NL descriptions, and temporal localization of events.