arXiv reaDer
CNN はパッチで学習することで次元の呪いを回避する
CNNs Avoid Curse of Dimensionality by Learning on Patches
多数のコンピューター ビジョン タスクにおける畳み込みニューラル ネットワーク (CNN) の成功とその並外れた一般化パフォーマンスにもかかわらず、CNN の一般化エラーを予測するためのいくつかの試みは、これまで事後分析に限定されていました。ディープ ニューラル ネットワークの汎化パフォーマンスを説明する先験的な理論では、畳み込みの側面がほとんど無視されており、画像の次元が数千単位である画像分類などのコンピューター ビジョン タスクで CNN が次元の呪いを克服できるように見える理由が特定されていません。私たちの仕事は、CNN が画像パッチのドメインで動作するという仮説の下で、画像分類における CNN の一般化パフォーマンスを説明しようとします。私たちの研究は、CNN の汎化誤差のアプリオリな誤差限界を導き出すことを認識している最初の研究であり、私たちの理論を支持する定量的証拠と定性的証拠の両方を提示しています。私たちのパッチベースの理論は、カットアウト、カットミックス、ランダムクロッピングなどのデータ拡張技術が CNN の一般化エラーを改善するのに効果的である理由についても説明しています。
Despite the success of convolutional neural networks (CNNs) in numerous computer vision tasks and their extraordinary generalization performances, several attempts to predict the generalization errors of CNNs have only been limited to a posteriori analyses thus far. A priori theories explaining the generalization performances of deep neural networks have mostly ignored the convolutionality aspect and do not specify why CNNs are able to seemingly overcome curse of dimensionality on computer vision tasks like image classification where the image dimensions are in thousands. Our work attempts to explain the generalization performance of CNNs on image classification under the hypothesis that CNNs operate on the domain of image patches. Ours is the first work we are aware of to derive an a priori error bound for the generalization error of CNNs and we present both quantitative and qualitative evidences in the support of our theory. Our patch-based theory also offers explanation for why data augmentation techniques like Cutout, CutMix and random cropping are effective in improving the generalization error of CNNs.
updated: Wed Apr 12 2023 17:33:41 GMT+0000 (UTC)
published: Sun May 22 2022 06:22:27 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト