A New Channel Boosted Convolutional Neural Network using Transfer Learning
深い畳み込みニューラルネットワーク(CNN)でのチャネルブースティングの新しいアーキテクチャの強化について説明します。このチャネルブースティングのアイデアは、CNNのチャネルディメンション(複数の入力チャネルからの学習)と転移学習(TL)の両方を利用します。 TLは2つの異なる段階で利用されます。チャネルの生成と利用。提案された方法論では、ディープCNNは、元のチャネルに加えて、トレーニング済みのディープニューラルネットワークからTLを通じて利用可能なさまざまなチャネルによってブーストされます。次に、CNNの深いアーキテクチャは、差別的なパターンを学習するために、元のチャネルとブーストされたチャネルを活用します。テレコムでのチャーン予測は、データの次元が高く、性質が不均衡であるため、困難な作業です。したがって、チャーン予測データは、提案されたチャネルブーストCNN(CB CNN)のパフォーマンスを評価するために使用されます。最初のフェーズでは、スタック型オートエンコーダを使用して有益な識別機能を抽出し、次に2番目のフェーズでは、これらの機能を元の機能と組み合わせて、チャネルブースト画像を形成します。最後に、事前トレーニング済みのCNNによって得られた知識は、TLを使用することによって利用されます。結果は有望であり、チャーナーと非チャーナーのわずかな違いさえも見分けることにより、複雑な分類問題を学習するチャネルブースティングコンセプトの能力を示しています。提案された作業は、CNNアーキテクチャの革新的な再構築によりネットワークの代表的な容量が増加する可能性があるという最近のCNNアーキテクチャの進化から観察された概念を検証します。
We present a novel architectural enhancement of Channel Boosting in a deep convolutional neural network (CNN). This idea of Channel Boosting exploits both the channel dimension of CNN (learning from multiple input channels) and Transfer learning (TL). TL is utilized at two different stages; channel generation and channel exploitation. In the proposed methodology, a deep CNN is boosted by various channels available through TL from already trained Deep Neural Networks, in addition to its original channel. The deep architecture of CNN then exploits the original and boosted channels down the stream for learning discriminative patterns. Churn prediction in telecom is a challenging task due to the high dimensionality and imbalanced nature of the data. Therefore, churn prediction data is used to evaluate the performance of the proposed Channel Boosted CNN (CB CNN). In the first phase, informative discriminative features are being extracted using a stacked autoencoder, and then in the second phase, these features are combined with the original features to form Channel Boosted images. Finally, the knowledge gained by a pretrained CNN is exploited by employing TL. The results are promising and show the ability of the Channel Boosting concept in learning complex classification problems by discerning even minute differences in churners and nonchurners. The proposed work validates the concept observed from the evolution of recent CNN architectures that the innovative restructuring of a CNN architecture may increase the networks representative capacity.
updated: Sat Jul 04 2020 19:56:44 GMT+0000 (UTC)
published: Mon Apr 23 2018 16:02:35 GMT+0000 (UTC)
