arXiv reaDer
ビデオのアクティブ学習のための時間的コヒーレンス
Temporal Coherence for Active Learning in Videos
  自動運転システムでは、トレーニングに膨大な量のデータが必要です。このデータの手動注釈は、人的資源を伴うため、時間がかかり、法外に高価です。したがって、この学習を容易にし、データ注釈をより管理しやすくするための代替手段として、能動学習が登場しました。この論文では、時間的コヒーレンスを活用することにより、ビデオ内のオブジェクト検出のための新しいアクティブ学習アプローチを紹介します。私たちの積極的な学習基準は、偽陽性と偽陰性に関するエラーの推定数に基づいています。オブジェクト検出器によって取得された検出は、グラフのノードを定義するために使用され、ノードを一時的にリンクするために前後に追跡されます。このグラフィカルモデルで定義されたエネルギー関数を最小化すると、偽陽性と偽陰性の両方の推定値が得られます。さらに、道路シーンでのビデオオブジェクト検出のためのアクティブラーニングを評価するために特別に設計されたSYNTHIA-ALと呼ばれる合成ビデオデータセットを紹介します。最後に、2つのデータセットでテストされたアクティブな学習ベースラインよりも、このアプローチが優れていることを示します。
Autonomous driving systems require huge amounts of data to train. Manual annotation of this data is time-consuming and prohibitively expensive since it involves human resources. Therefore, active learning emerged as an alternative to ease this effort and to make data annotation more manageable. In this paper, we introduce a novel active learning approach for object detection in videos by exploiting temporal coherence. Our active learning criterion is based on the estimated number of errors in terms of false positives and false negatives. The detections obtained by the object detector are used to define the nodes of a graph and tracked forward and backward to temporally link the nodes. Minimizing an energy function defined on this graphical model provides estimates of both false positives and false negatives. Additionally, we introduce a synthetic video dataset, called SYNTHIA-AL, specially designed to evaluate active learning for video object detection in road scenes. Finally, we show that our approach outperforms active learning baselines tested on two datasets.
updated: Fri Aug 30 2019 14:20:36 GMT+0000 (UTC)
published: Fri Aug 30 2019 14:20:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト