arXiv reaDer
CNNフィルターDB:トレーニングされた畳み込みフィルターの経験的調査
CNN Filter DB: An Empirical Investigation of Trained Convolutional Filters
現在、畳み込みニューラルネットワーク(CNN)の転送可能性と堅牢性に関する多くの理論的および実際的に関連する質問は未解決のままです。進行中の研究努力はさまざまな角度からこれらの問題に取り組んでいますが、ほとんどのコンピュータビジョン関連のケースでは、これらのアプローチは画像データの分布シフトの影響の調査に一般化できます。このコンテキストでは、トレーニングされたCNNモデルの学習された重みのシフトを研究することを提案します。ここでは、主に使用される3x3畳み込みフィルターカーネルの分布のプロパティに焦点を当てます。さまざまなデータセット、アーキテクチャ、ビジョンタスクを使用して、トレーニングを受けた数百のCNNから14億を超えるフィルターを含むデータセットを収集し、公開しました。提案されたデータセットの最初のユースケースでは、実用的なアプリケーションのために公開されている多くの事前トレーニング済みモデルの関連性の高いプロパティを示すことができます。I)メタパラメーターの異なる軸に沿ったトレーニング済みフィルター間の分布シフト(またはその欠如)を分析します。 、データセット、タスク、アーキテクチャ、またはレイヤーの深さの視覚的なカテゴリのように。これらの結果に基づいて、モデルの事前トレーニングは、サイズと分散の条件を満たす場合、任意のデータセットで成功する可能性があると結論付けます。 II)事前にトレーニングされたモデルの多くに縮退フィルターが含まれているため、堅牢性が低下し、ターゲットアプリケーションの微調整に適していないことを示します。データとプロジェクトのウェブサイト:https://github.com/paulgavrikov/cnn-filter-db
Currently, many theoretical as well as practically relevant questions towards the transferability and robustness of Convolutional Neural Networks (CNNs) remain unsolved. While ongoing research efforts are engaging these problems from various angles, in most computer vision related cases these approaches can be generalized to investigations of the effects of distribution shifts in image data. In this context, we propose to study the shifts in the learned weights of trained CNN models. Here we focus on the properties of the distributions of dominantly used 3x3 convolution filter kernels. We collected and publicly provide a dataset with over 1.4 billion filters from hundreds of trained CNNs, using a wide range of datasets, architectures, and vision tasks. In a first use case of the proposed dataset, we can show highly relevant properties of many publicly available pre-trained models for practical applications: I) We analyze distribution shifts (or the lack thereof) between trained filters along different axes of meta-parameters, like visual category of the dataset, task, architecture, or layer depth. Based on these results, we conclude that model pre-training can succeed on arbitrary datasets if they meet size and variance conditions. II) We show that many pre-trained models contain degenerated filters which make them less robust and less suitable for fine-tuning on target applications. Data & Project website: https://github.com/paulgavrikov/cnn-filter-db
updated: Sat Apr 09 2022 20:30:13 GMT+0000 (UTC)
published: Tue Mar 29 2022 08:25:42 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト