arXiv reaDer
オンライン ドメイン適応オブジェクト検出に向けて
Towards Online Domain Adaptive Object Detection
既存のオブジェクト検出モデルは、トレーニング データとテスト データの両方が同じソース ドメインからサンプリングされることを前提としています。この仮定は、これらの検出器が実際のアプリケーションに展開され、新しい視覚領域に遭遇する場合には当てはまりません。教師なしドメイン適応 (UDA) メソッドは、通常、ドメイン シフトによって引き起こされる悪影響を軽減するために使用されます。既存の UDA メソッドはオフラインで動作し、モデルは最初にターゲット ドメインに合わせて調整され、次に実際のアプリケーションに展開されます。ただし、このオフライン適応戦略は、モデルが新しいドメイン シフトに頻繁に遭遇するため、実際のアプリケーションには適していません。したがって、継続的なオンライン方法で展開時に発生するこれらのドメイン シフトを一般化する、実行可能な UDA メソッドを開発することが重要になります。この目的のために、オンライン設定でターゲットドメインの一般化を適応させ、改善する新しい統合適応フレームワークを提案します。特に、MemXformer を紹介します。MemXformer はクロスアテンション トランスフォーマー ベースのメモリ モジュールであり、メモリ内のアイテムがドメイン シフトを利用し、ターゲット ディストリビューションの典型的なパターンを記録します。さらに、MemXformer は強力な正と負のペアを生成して、ターゲット固有の表現学習を強化する新しい対照的な損失を導きます。さまざまな検出ベンチマークに関する実験は、提案された戦略がオンラインとオフラインの両方の設定で最先端のパフォーマンスを生み出すことができることを示しています.私たちの知る限り、これはオブジェクト検出のオンラインおよびオフラインの適応設定に対処する最初の作業です。 https://github.com/Vibashan/memXformer-online-da のコード
Existing object detection models assume both the training and test data are sampled from the same source domain. This assumption does not hold true when these detectors are deployed in real-world applications, where they encounter new visual domain. Unsupervised Domain Adaptation (UDA) methods are generally employed to mitigate the adverse effects caused by domain shift. Existing UDA methods operate in an offline manner where the model is first adapted towards the target domain and then deployed in real-world applications. However, this offline adaptation strategy is not suitable for real-world applications as the model frequently encounters new domain shifts. Hence, it becomes critical to develop a feasible UDA method that generalizes to these domain shifts encountered during deployment time in a continuous online manner. To this end, we propose a novel unified adaptation framework that adapts and improves generalization on the target domain in online settings. In particular, we introduce MemXformer - a cross-attention transformer-based memory module where items in the memory take advantage of domain shifts and record prototypical patterns of the target distribution. Further, MemXformer produces strong positive and negative pairs to guide a novel contrastive loss, which enhances target specific representation learning. Experiments on diverse detection benchmarks show that the proposed strategy can produce state-of-the-art performance in both online and offline settings. To the best of our knowledge, this is the first work to address online and offline adaptation settings for object detection. Code at https://github.com/Vibashan/memXformer-online-da
updated: Fri Oct 21 2022 22:29:13 GMT+0000 (UTC)
published: Mon Apr 11 2022 17:47:22 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト