arXiv reaDer
道路シーン分析のための物理的に許容可能な偏光データの拡張
Physically-admissible polarimetric data augmentation for road-scene analysis
偏光イメージングは、ディープラーニングとともに、シーン分析を含むさまざまなタスクでパフォーマンスが向上していることを示しています。ただし、トレーニングデータセットのサイズが小さいため、その堅牢性が疑問視される場合があります。この問題はデータ拡張によって解決できますが、偏光モダリティは、従来のデータ拡張技術では対処できない物理的な実現可能性の制約を受けます。この問題に対処するために、ペアになっていないデータのみに依存する深い生成モデルに基づく画像変換技術であるCycleGANを使用して、大きなラベル付き道路シーンデータセットを偏光ドメインに転送することを提案します。 CycleGAN損失とともに、偏光画像の物理的制約を処理するいくつかの補助損失項を設計します。このソリューションの効率は、生成されたリアルな偏光画像によって車のパフォーマンスと歩行者検出を最大9%向上させることができる、道路シーンのオブジェクト検出タスクで実証されています。結果として生じる制約されたCycleGANは公開され、誰でも独自の偏光画像を生成できるようになります。
Polarimetric imaging, along with deep learning, has shown improved performances on different tasks including scene analysis. However, its robustness may be questioned because of the small size of the training datasets. Though the issue could be solved by data augmentation, polarization modalities are subject to physical feasibility constraints unaddressed by classical data augmentation techniques. To address this issue, we propose to use CycleGAN, an image translation technique based on deep generative models that solely relies on unpaired data, to transfer large labeled road scene datasets to the polarimetric domain. We design several auxiliary loss terms that, alongside the CycleGAN losses, deal with the physical constraints of polarimetric images. The efficiency of this solution is demonstrated on road scene object detection tasks where generated realistic polarimetric images allow to improve performances on cars and pedestrian detection up to 9%. The resulting constrained CycleGAN is publicly released, allowing anyone to generate their own polarimetric images.
updated: Wed Jun 15 2022 10:04:43 GMT+0000 (UTC)
published: Wed Jun 15 2022 10:04:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト