arXiv reaDer
PIT:クロスFoVドメイン適応のための位置不変変換
PIT: Position-Invariant Transform for Cross-FoV Domain Adaptation
クロスドメインオブジェクト検出とセマンティックセグメンテーションは、最近目覚ましい進歩を遂げています。既存のアプローチは主に、背景、照明、天気の変化などの外部環境に起因するドメインシフトを考慮しますが、異なるカメラ固有のパラメータは一般に異なるドメインに表示され、ドメイン適応への影響はほとんど調査されていません。このホワイトペーパーでは、視野(FoV)ギャップが、ソースドメインとターゲットドメインの間に顕著なインスタンスの外観の違いを引き起こすことを確認します。さらに、2つのドメイン間のFoVギャップが、FoVが増加する場合(ソースFoV <ターゲットFoV)とFoVが減少する場合の両方でドメイン適応パフォーマンスを損なうことを発見しました。観察に動機付けられて、異なるドメインの画像をより適切に位置合わせするために、位置不変変換(PIT)を提案します。また、変換/位置合わせされた画像を元の画像空間にマッピングするための逆PITを導入し、トレーニングプロセスを加速するための損失再重み付け戦略を設計します。私たちの方法は、無視できる計算オーバーヘッドをもたらしながら、既存のクロスドメイン検出/セグメンテーションフレームワークに簡単にプラグインできます。広範な実験により、私たちの方法は、最先端の技術のために、クロスドメインオブジェクト検出とセグメンテーションの両方のパフォーマンスを確実に向上させることができることが実証されています。私たちのコードはhttps://github.com/sheepooo/PIT-Position-Invariant-Transformで入手できます。
Cross-domain object detection and semantic segmentation have witnessed impressive progress recently. Existing approaches mainly consider the domain shift resulting from external environments including the changes of background, illumination or weather, while distinct camera intrinsic parameters appear commonly in different domains, and their influence for domain adaptation has been very rarely explored. In this paper, we observe that the Field of View (FoV) gap induces noticeable instance appearance differences between the source and target domains. We further discover that the FoV gap between two domains impairs domain adaptation performance under both the FoV-increasing (source FoV < target FoV) and FoV-decreasing cases. Motivated by the observations, we propose the Position-Invariant Transform (PIT) to better align images in different domains. We also introduce a reverse PIT for mapping the transformed/aligned images back to the original image space and design a loss re-weighting strategy to accelerate the training process. Our method can be easily plugged into existing cross-domain detection/segmentation frameworks while bringing about negligible computational overhead. Extensive experiments demonstrate that our method can soundly boost the performance on both cross-domain object detection and segmentation for state-of-the-art techniques. Our code is available at https://github.com/sheepooo/PIT-Position-Invariant-Transform.
updated: Mon Aug 16 2021 15:16:47 GMT+0000 (UTC)
published: Mon Aug 16 2021 15:16:47 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト