arXiv reaDer
異種ニューラル ネットワークのモデル融合のためのクロスレイヤー アラインメントについて
On Cross-Layer Alignment for Model Fusion of Heterogeneous Neural Networks
OTFusion と呼ばれる最適なトランスポートを介したレイヤーごとのモデル融合は、ソフト ニューロンの関連付けを適用して、さまざまな事前トレーニング済みネットワークを統合し、計算リソースを節約します。 OTFusion は成功を収めていますが、入力ネットワークに同じ数のレイヤーが必要です。この問題に対処するために、CLAFusion という名前の新しいモデル融合フレームワークを提案します。これは、異種ニューラル ネットワークと呼ばれる異なるレイヤー数のニューラル ネットワークをクロスレイヤー アライメントによって融合します。アンバランス割り当て問題であるクロスレイヤーアライメント問題は、動的計画法を使用して効率的に解決できます。クロスレイヤーの配置に基づいて、私たちのフレームワークは、レイヤー単位のモデル融合を適用する前に、ニューラル ネットワークのレイヤー数のバランスを取ります。私たちの実験は、追加の微調整プロセスを備えた CLAFusion が、CIFAR10、CIFAR100、および Tiny-ImageNet データセットの残差ネットワークの精度を向上させることを示しています。さらに、教師と生徒の設定に適用する際のモデルの圧縮と知識の蒸留のための実際の使用法を探ります。
Layer-wise model fusion via optimal transport, named OTFusion, applies soft neuron association for unifying different pre-trained networks to save computational resources. While enjoying its success, OTFusion requires the input networks to have the same number of layers. To address this issue, we propose a novel model fusion framework, named CLAFusion, to fuse neural networks with a different number of layers, which we refer to as heterogeneous neural networks, via cross-layer alignment. The cross-layer alignment problem, which is an unbalanced assignment problem, can be solved efficiently using dynamic programming. Based on the cross-layer alignment, our framework balances the number of layers of neural networks before applying layer-wise model fusion. Our experiments indicate that CLAFusion, with an extra finetuning process, improves the accuracy of residual networks on the CIFAR10, CIFAR100, and Tiny-ImageNet datasets. Furthermore, we explore its practical usage for model compression and knowledge distillation when applying to the teacher-student setting.
updated: Mon Feb 20 2023 04:41:24 GMT+0000 (UTC)
published: Fri Oct 29 2021 05:02:23 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト