arXiv reaDer
Cross-Domain CutMix による少数ショットの適応型オブジェクト検出
Few-shot Adaptive Object Detection with Cross-Domain CutMix
オブジェクト検出では、データ量とコストはトレードオフの関係にあり、特定のドメインで大量のデータを収集するのは労力がかかります。したがって、事前トレーニングには既存の大規模データセットが使用されます。ただし、ターゲットドメインがソースドメインと大幅に異なる場合、従来の転移学習とドメイン適応はドメインギャップを埋めることができません。大領域ギャップ問題を解決できるデータ合成法を提案する.この方法では、ターゲット画像の一部がソース画像に貼り付けられ、貼り付けられた領域の位置は、オブジェクト バウンディング ボックスの情報を利用して調整されます。さらに、敵対的学習を導入して、元の領域か貼り付けられた領域かを識別します。提案された方法は、多数のソース画像といくつかのターゲットドメイン画像でトレーニングします。提案された方法は、RGB画像がソースドメインであり、熱赤外線画像がターゲットドメインである非常に異なるドメインの問題設定で、従来の方法よりも高い精度を達成します。同様に、提案手法はシミュレーション画像から実画像の場合でもより高い精度を実現します。
In object detection, data amount and cost are a trade-off, and collecting a large amount of data in a specific domain is labor intensive. Therefore, existing large-scale datasets are used for pre-training. However, conventional transfer learning and domain adaptation cannot bridge the domain gap when the target domain differs significantly from the source domain. We propose a data synthesis method that can solve the large domain gap problem. In this method, a part of the target image is pasted onto the source image, and the position of the pasted region is aligned by utilizing the information of the object bounding box. In addition, we introduce adversarial learning to discriminate whether the original or the pasted regions. The proposed method trains on a large number of source images and a few target domain images. The proposed method achieves higher accuracy than conventional methods in a very different domain problem setting, where RGB images are the source domain, and thermal infrared images are the target domain. Similarly, the proposed method achieves higher accuracy in the cases of simulation images to real images.
updated: Wed Aug 31 2022 01:26:10 GMT+0000 (UTC)
published: Wed Aug 31 2022 01:26:10 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト