Built-in Elastic Transformations for Improved Robustness
特に弾性変形、オクルージョン、ガウスノイズなどの自然摂動に対して、ニューラルビジュアル分類器の畳み込みでロバスト性を構築することに焦点を当てています。既存のCNNは、クリーンな画像で卓越したパフォーマンスを示しますが、自然に発生する摂動に対処することはできません。この論文では、オブジェクトの(局所的な)視点の変化を近似する弾性摂動から始めます。 CNNで目に見えない視点を統合する目的で、固定された弾性摂動基底関数とトレーニング可能な重みの組み合わせとしてフィルターをパラメーター化することにより、弾性増強畳み込み(EAConv)を提示します。 CIFAR-10およびSTL-10データセットで、目に見えないオクルージョンとガウス摂動に対するメソッドの一般的な堅牢性が向上する一方で、データ拡張を実行せずにクリーンな画像のパフォーマンスがわずかに向上することを示します。
We focus on building robustness in the convolutions of neural visual classifiers, especially against natural perturbations like elastic deformations, occlusions and Gaussian noise. Existing CNNs show outstanding performance on clean images, but fail to tackle naturally occurring perturbations. In this paper, we start from elastic perturbations, which approximate (local) view-point changes of the object. We present elastically-augmented convolutions (EAConv) by parameterizing filters as a combination of fixed elastically-perturbed bases functions and trainable weights for the purpose of integrating unseen viewpoints in the CNN. We show on CIFAR-10 and STL-10 datasets that the general robustness of our method on unseen occlusion and Gaussian perturbations improves, while even improving the performance on clean images slightly without performing any data augmentation.
updated: Tue Jul 20 2021 10:16:38 GMT+0000 (UTC)
published: Tue Jul 20 2021 10:16:38 GMT+0000 (UTC)
