arXiv reaDer
NDの長距離依存性のための汎用CNNに向けて
Towards a General Purpose CNN for Long Range Dependencies in ND
畳み込みニューラルネットワーク(CNN)の使用は、効率的で効果的な機械学習フレームワークをもたらす一連の望ましいモデルプロパティにより、ディープラーニングで広く使用されています。ただし、パフォーマンスの高いCNNアーキテクチャは、入力の長さ、解像度、次元などの考慮事項を組み込むために、特定のタスクに合わせて調整する必要があります。この作業では、Continuous Convolutional Neural Network(CCNN)を使用して、問題固有のCNNアーキテクチャの必要性を克服します。これは、構造なしで任意の解像度、次元、長さのデータのタスクに使用できる連続畳み込みカーネルを備えた単一のCNNアーキテクチャです。変更します。連続畳み込みカーネルは、すべてのレイヤーで長距離依存関係をモデル化し、現在のCNNアーキテクチャで必要なダウンサンプリングレイヤーとタスク依存の深さの必要性を排除します。シーケンシャル(1D)およびビジュアルデータ(2D)の幅広いタスクセットに同じCCNNを適用することにより、アプローチの一般性を示します。私たちのCCNNは競争力があり、検討されているすべてのタスクで現在の最先端技術を上回っていることがよくあります。
The use of Convolutional Neural Networks (CNNs) is widespread in Deep Learning due to a range of desirable model properties which result in an efficient and effective machine learning framework. However, performant CNN architectures must be tailored to specific tasks in order to incorporate considerations such as the input length, resolution, and dimentionality. In this work, we overcome the need for problem-specific CNN architectures with our Continuous Convolutional Neural Network (CCNN): a single CNN architecture equipped with continuous convolutional kernels that can be used for tasks on data of arbitrary resolution, dimensionality and length without structural changes. Continuous convolutional kernels model long range dependencies at every layer, and remove the need for downsampling layers and task-dependent depths needed in current CNN architectures. We show the generality of our approach by applying the same CCNN to a wide set of tasks on sequential (1D) and visual data (2D). Our CCNN performs competitively and often outperforms the current state-of-the-art across all tasks considered.
updated: Tue Jul 05 2022 09:50:20 GMT+0000 (UTC)
published: Tue Jun 07 2022 15:48:02 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト