arXiv reaDer
異なるV1脳モデルバリアントを組み合わせて、CNNの画像破損に対するロバスト性を向上させる
Combining Different V1 Brain Model Variants to Improve Robustness to Image Corruptions in CNNs
一部の畳み込みニューラルネットワーク(CNN)は、オブジェクト分類において人間の視覚能力を上回っていますが、さまざまなタイプの一般的なノイズパターンで破損した画像内のオブジェクトを認識するのに苦労することが多く、このモデルファミリーの主な制限が浮き彫りになります。最近、CNNの前面で一次視覚野(V1)をシミュレートすると、これらの画像の摂動に対するロバスト性がわずかに向上することが示されています。この調査では、V1モデルのさまざまなバリアントが特定の破損タイプに対して利益を示すという観察から始めます。次に、アンサンブル手法を使用して新しいモデルを構築します。この手法では、複数の個別モデルを異なるV1フロントエンドバリアントと組み合わせます。モデルアンサンブルは、個々のモデルの長所を活用して、すべての破損カテゴリにわたって堅牢性を大幅に向上させ、基本モデルを平均38%上回っています。最後に、蒸留を使用すると、アンサンブルモデルの知識をV1フロントエンドを備えた単一のモデルに部分的に圧縮できることを示します。ここで使用されるアンサンブルおよび蒸留技術は生物学的に妥当なものではありませんが、ここに示す結果は、V1のさまざまな神経回路の特定の強度を組み合わせることにより、広範囲の摂動に対するCNNの堅牢性を向上させることができることを示しています。
While some convolutional neural networks (CNNs) have surpassed human visual abilities in object classification, they often struggle to recognize objects in images corrupted with different types of common noise patterns, highlighting a major limitation of this family of models. Recently, it has been shown that simulating a primary visual cortex (V1) at the front of CNNs leads to small improvements in robustness to these image perturbations. In this study, we start with the observation that different variants of the V1 model show gains for specific corruption types. We then build a new model using an ensembling technique, which combines multiple individual models with different V1 front-end variants. The model ensemble leverages the strengths of each individual model, leading to significant improvements in robustness across all corruption categories and outperforming the base model by 38% on average. Finally, we show that using distillation, it is possible to partially compress the knowledge in the ensemble model into a single model with a V1 front-end. While the ensembling and distillation techniques used here are hardly biologically-plausible, the results presented here demonstrate that by combining the specific strengths of different neuronal circuits in V1 it is possible to improve the robustness of CNNs for a wide range of perturbations.
updated: Wed Oct 20 2021 16:35:09 GMT+0000 (UTC)
published: Wed Oct 20 2021 16:35:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト