arXiv reaDer
タリスマン:劣モジュラ相互情報量を使用したまれなクラスとスライスによるオブジェクト検出のためのターゲットを絞った能動学習
TALISMAN: Targeted Active Learning for Object Detection with Rare Classes and Slices using Submodular Mutual Information
ディープニューラルネットワークベースのオブジェクト検出器は、自動運転車、生物医学イメージングなどのさまざまなドメインで大きな成功を収めています。それらの成功は、対象のドメインからの大量のデータに依存することが知られています。ディープモデルは、全体的な精度の点で優れたパフォーマンスを発揮することがよくありますが、まれでありながら重要なデータスライスのパフォーマンスに苦労することがよくあります。たとえば、「夜間のオートバイ」や「夜間の自転車」などのデータスライスはまれですが、自動運転アプリケーションにとって非常に重要なスライスであり、そのようなまれなスライスの誤検知は、不運な障害や事故につながる可能性があります。アクティブラーニング(AL)は、ループ内の人間を使用してトレーニングデータセットを段階的かつ適応的に構築するためのよく知られたパラダイムです。ただし、現在のALベースの取得関数は、画像の不確実性スコアまたはグローバル記述子に基づいているため、まれなスライスを含む実際のデータセットに対処するための設備が整っていません。劣モジュラ相互情報量を使用して、ターゲットアクティブラーニングまたはまれなスライスを使用したオブジェクト検出のための新しいフレームワークであるTALISMANを提案します。私たちの方法は、関心領域(RoI)の特徴を使用してインスタンス化された劣モジュラ相互情報関数を使用して、まれなスライスでデータポイントを効率的にターゲットにして取得します。フレームワークは、標準のPASCAL VOC07 + 12と、実際の自動運転データセットであるBDD100Kで評価されます。 TALISMANは、まれなスライスの平均精度とmAPの点で、他の方法よりも優れていることがわかります。
Deep neural networks based object detectors have shown great success in a variety of domains like autonomous vehicles, biomedical imaging, etc. It is known that their success depends on a large amount of data from the domain of interest. While deep models often perform well in terms of overall accuracy, they often struggle in performance on rare yet critical data slices. For example, data slices like "motorcycle at night" or "bicycle at night" are often rare but very critical slices for self-driving applications and false negatives on such rare slices could result in ill-fated failures and accidents. Active learning (AL) is a well-known paradigm to incrementally and adaptively build training datasets with a human in the loop. However, current AL based acquisition functions are not well-equipped to tackle real-world datasets with rare slices, since they are based on uncertainty scores or global descriptors of the image. We propose TALISMAN, a novel framework for Targeted Active Learning or object detectIon with rare slices using Submodular MutuAl iNformation. Our method uses the submodular mutual information functions instantiated using features of the region of interest (RoI) to efficiently target and acquire data points with rare slices. We evaluate our framework on the standard PASCAL VOC07+12 and BDD100K, a real-world self-driving dataset. We observe that TALISMAN outperforms other methods by in terms of average precision on rare slices, and in terms of mAP.
updated: Tue Nov 30 2021 23:17:53 GMT+0000 (UTC)
published: Tue Nov 30 2021 23:17:53 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト