arXiv reaDer
3Dの一般的な破損とデータ拡張
3D Common Corruptions and Data Augmentation
モデルの堅牢性を評価するための破損として使用できる一連の画像変換と、ニューラルネットワークをトレーニングするためのデータ拡張メカニズムを紹介します。提案された変換の主な違いは、Common Corruptionsなどの既存のアプローチとは異なり、シーンのジオメトリが変換に組み込まれているため、現実の世界で発生する可能性が高い破損につながることです。また、一連のセマンティック破損(例:自然オブジェクトのオクルージョン)も紹介します。これらの変換が「効率的」(オンザフライで計算可能)、「拡張可能」(ほとんどの画像データセットに適用可能)であり、既存のモデルの脆弱性を明らかにし、「3D」として使用するとモデルをより堅牢にすることができることを示しますデータ拡張のメカニズム。いくつかのタスクとデータセットの評価は、3D情報をベンチマークとトレーニングに組み込むことで、堅牢性の研究に有望な方向性を開くことを示唆しています。
We introduce a set of image transformations that can be used as corruptions to evaluate the robustness of models as well as data augmentation mechanisms for training neural networks. The primary distinction of the proposed transformations is that, unlike existing approaches such as Common Corruptions, the geometry of the scene is incorporated in the transformations -- thus leading to corruptions that are more likely to occur in the real world. We also introduce a set of semantic corruptions (e.g. natural object occlusions). We show these transformations are `efficient' (can be computed on-the-fly), `extendable' (can be applied on most image datasets), expose vulnerability of existing models, and can effectively make models more robust when employed as `3D data augmentation' mechanisms. The evaluations on several tasks and datasets suggest incorporating 3D information into benchmarking and training opens up a promising direction for robustness research.
updated: Fri Apr 29 2022 13:08:19 GMT+0000 (UTC)
published: Wed Mar 02 2022 22:31:16 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト