arXiv reaDer
ロビン:実世界の分布外シフトにおける個々の迷惑に対するロバスト性のベンチマーク
ROBIN : A Benchmark for Robustness to Individual Nuisancesin Real-World Out-of-Distribution Shifts
実際のシナリオで堅牢性を強化することは、非常に困難であることが証明されています。 1つの理由は、既存のロバストネスベンチマークは、合成データに依存するか、データセット間の一般化としてロバスト性を測定するだけであり、したがって個々の迷惑要因の影響を無視するため、制限されているためです。この作業では、実世界の画像の個々の妨害に対する視覚アルゴリズムの堅牢性を診断するためのベンチマークデータセットであるROBINを紹介します。 ROBINは、PASCAL VOC 2012およびImageNetデータセットの10の厳密なカテゴリに基づいて構築されており、オブジェクトの3Dポーズ、形状、テクスチャ、コンテキスト、および気象条件の配布外の例が含まれています。 ROBINには豊富な注釈が付けられており、画像分類、オブジェクト検出、および3Dポーズ推定のベンチマークモデルを有効にします。いくつかの一般的なベースラインの結果を提供し、いくつかの興味深い観察を行います。1。いくつかの厄介な要因は、他の要因と比較して、パフォーマンスにはるかに強い悪影響を及ぼします。さらに、OODnuisanceの悪影響は、下流のビジョンタスクに依存します。 2.強力なデータ拡張を使用してOODの堅牢性を強化する現在のアプローチは、実際のOODシナリオではわずかな影響しかなく、場合によってはOODのパフォーマンスを低下させることさえあります。 3. OODの堅牢性に関して、畳み込みアーキテクチャとトランスアーキテクチャの間に大きな違いは見られません。私たちのデータセットは、視覚アルゴリズムのOODの堅牢性を研究するための豊富なテストベッドを提供し、この分野の研究を大幅に推進するのに役立つと信じています。
Enhancing the robustness in real-world scenarios has been proven very challenging. One reason is that existing robustness benchmarks are limited, as they either rely on synthetic data or they simply measure robustness as generalization between datasets and hence ignore the effects of individual nuisance factors. In this work, we introduce ROBIN, a benchmark dataset for diagnosing the robustness of vision algorithms to individual nuisances in real-world images. ROBIN builds on 10 rigid categories from the PASCAL VOC 2012 and ImageNet datasets and includes out-of-distribution examples of the objects 3D pose, shape, texture, context and weather conditions. ROBIN is richly annotated to enable benchmark models for image classification, object detection, and 3D pose estimation. We provide results for a number of popular baselines and make several interesting observations: 1. Some nuisance factors have a much stronger negative effect on the performance compared to others. Moreover, the negative effect of an OODnuisance depends on the downstream vision task. 2. Current approaches to enhance OOD robustness using strong data augmentation have only marginal effects in real-world OOD scenarios, and sometimes even reduce the OOD performance. 3. We do not observe any significant differences between convolutional and transformer architectures in terms of OOD robustness. We believe our dataset provides a rich testbed to study the OOD robustness of vision algorithms and will help to significantly push forward research in this area.
updated: Mon Nov 29 2021 06:18:46 GMT+0000 (UTC)
published: Mon Nov 29 2021 06:18:46 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト