arXiv reaDer
OOD-CV: A Benchmark for Robustness to Out-of-Distribution Shifts of Individual Nuisances in Natural Images
実際のシナリオでビジョンアルゴリズムの堅牢性を強化することは困難です。 1つの理由は、既存の堅牢性ベンチマークは、合成データに依存するか、個々の妨害要因の影響を無視するため、制限されていることです。 OOD-CVを紹介します。これは、ポーズ、形状、テクスチャ、コンテキスト、気象条件の観点から10のオブジェクトカテゴリの分布外の例を含み、画像分類、オブジェクト検出、および3Dポーズのベンチマークモデルを可能にするベンチマークデータセットです。推定。この新しいデータセットに加えて、一般的なベースライン手法を使用した広範な実験に貢献します。これにより、次のことが明らかになります。1.いくつかの妨害要因は、ビジョンタスクにもよりますが、他の要因と比較してパフォーマンスにはるかに強い悪影響を及ぼします。 2.堅牢性を強化するための現在のアプローチは、わずかな効果しかなく、堅牢性を低下させることさえあります。 3.畳み込みアーキテクチャとトランスアーキテクチャの間に大きな違いは見られません。私たちのデータセットは、堅牢性を研究するための豊富なテストベッドを提供し、この分野の研究を推進するのに役立つと信じています。
Enhancing the robustness of vision algorithms in real-world scenarios is challenging. One reason is that existing robustness benchmarks are limited, as they either rely on synthetic data or ignore the effects of individual nuisance factors. We introduce OOD-CV, a benchmark dataset that includes out-of-distribution examples of 10 object categories in terms of pose, shape, texture, context and the weather conditions, and enables benchmarking models for image classification, object detection, and 3D pose estimation. In addition to this novel dataset, we contribute extensive experiments using popular baseline methods, which reveal that: 1. Some nuisance factors have a much stronger negative effect on the performance compared to others, also depending on the vision task. 2. Current approaches to enhance robustness have only marginal effects, and can even reduce robustness. 3. We do not observe significant differences between convolutional and transformer architectures. We believe our dataset provides a rich testbed to study robustness and will help push forward research in this area.
updated: Thu Oct 06 2022 08:19:03 GMT+0000 (UTC)
published: Mon Nov 29 2021 06:18:46 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト