arXiv reaDer
適応型セルフトレーニングによるクロスドメインオブジェクト検出
Cross-Domain Object Detection via Adaptive Self-Training
オブジェクト検出におけるドメイン適応の問題に取り組みます。この問題では、ソース(監視のあるドメイン)とターゲットドメイン(監視のない対象のドメイン)の間に大幅なドメインシフトがあります。広く採用されているドメイン適応方法として、自己トレーニングの教師と学生のフレームワーク(学生モデルは教師モデルから生成された疑似ラベルから学習します)は、ターゲットドメインで顕著な精度の向上をもたらしました。ただし、ソースドメインへの偏りのために、教師から生成される大量の低品質の疑似ラベル(誤検知など)に依然として悩まされています。この問題に対処するために、ドメインシフトに対処するために相互学習中に敵対的学習と弱く強いデータ拡張を活用するAdaptive Unbiased Teacher(AUT)と呼ばれる自己トレーニングフレームワークを提案します。具体的には、学生モデルで特徴レベルの敵対的トレーニングを採用し、ソースドメインとターゲットドメインから抽出された特徴が同様の統計を共有するようにします。これにより、学生モデルはドメイン不変の機能をキャプチャできます。さらに、ターゲットドメインの教師モデルと両方のドメインの学生モデルの間で、弱く強い拡張と相互学習を適用します。これにより、教師モデルは、ドメインシフトに悩まされることなく、生徒モデルから徐々に恩恵を受けることができます。 AUTは、既存のすべてのアプローチ、さらにはOracle(完全に監視された)モデルよりも大幅に優れていることを示しています。たとえば、Foggy Cityscape(Clipart1K)で50.9%(49.3%)のmAPを達成しました。これは、以前の最先端技術とOracleよりもそれぞれ9.2%(5.2%)と8.2%(11.0%)高くなっています。
We tackle the problem of domain adaptation in object detection, where there is a significant domain shift between a source (a domain with supervision) and a target domain (a domain of interest without supervision). As a widely adopted domain adaptation method, the self-training teacher-student framework (a student model learns from pseudo labels generated from a teacher model) has yielded remarkable accuracy gain on the target domain. However, it still suffers from the large amount of low-quality pseudo labels (e.g., false positives) generated from the teacher due to its bias toward the source domain. To address this issue, we propose a self-training framework called Adaptive Unbiased Teacher (AUT) leveraging adversarial learning and weak-strong data augmentation during mutual learning to address domain shift. Specifically, we employ feature-level adversarial training in the student model, ensuring features extracted from the source and target domains share similar statistics. This enables the student model to capture domain-invariant features. Furthermore, we apply weak-strong augmentation and mutual learning between the teacher model on the target domain and the student model on both domains. This enables the teacher model to gradually benefit from the student model without suffering domain shift. We show that AUT demonstrates superiority over all existing approaches and even Oracle (fully supervised) models by a large margin. For example, we achieve 50.9% (49.3%) mAP on Foggy Cityscape (Clipart1K), which is 9.2% (5.2%) and 8.2% (11.0%) higher than previous state-of-the-art and Oracle, respectively
updated: Thu Nov 25 2021 18:50:15 GMT+0000 (UTC)
published: Thu Nov 25 2021 18:50:15 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト