arXiv reaDer
デバイス上の事前トレーニング済みモデルを高速に適応させるためのワンショット プルーニング
One-Shot Pruning for Fast-adapting Pre-trained Models on Devices
大規模な事前トレーニング済みモデルは、下流のタスクの解決に目覚ましい成功を収めています。それにもかかわらず、これらのモデルを低機能のデバイスに展開するには、モデルの枝刈りなどの効果的なアプローチが依然として必要です。ただし、下流の各タスクまたはデバイスのリソースが限られているため、モデルを最初から枝刈りすることは実際的な課題となる可能性があります。この問題に取り組むために、類似タスクの枝刈りされた知識を活用して、新しいタスクの事前トレーニングされたモデルからサブネットワークを抽出する、スケーラブルなワンショット枝刈り手法を紹介します。具体的には、類似タスクの枝刈りモデルを使用してスコアマスクを作成し、新しいタスクの事前トレーニング済みモデル内のタスク固有のフィルター/ノードを特定します。このマスクに基づいて、1 ラウンドの枝刈りを実行して、わずか数回のトレーニング反復で新しいタスクに迅速に適応できる適切なサイズのサブネットワークを抽出します。私たちの実験分析は、さまざまなデータセットを使用した畳み込みニューラル ネットワーク (CNN) およびビジョン トランスフォーマー (ViT) に対する提案手法の有効性を示しています。提案された方法は、メモリ制約が異なる多様なダウンストリーム タスクを処理する場合、精度と効率の点で一般的なプルーニング ベースライン方法よりも一貫して優れています。
Large-scale pre-trained models have been remarkably successful in resolving downstream tasks. Nonetheless, deploying these models on low-capability devices still requires an effective approach, such as model pruning. However, pruning the model from scratch can pose a practical challenge given the limited resources of each downstream task or device. To tackle this issue, we present a scalable one-shot pruning method that leverages pruned knowledge of similar tasks to extract a sub-network from the pre-trained model for a new task. Specifically, we create a score mask using the pruned models of similar tasks to identify task-specific filters/nodes in the pre-trained model for the new task. Based on this mask, we conduct a single round of pruning to extract a suitably-sized sub-network that can quickly adapt to the new task with only a few training iterations. Our experimental analysis demonstrates the effectiveness of the proposed method on the convolutional neural networks (CNNs) and vision transformers (ViT) with various datasets. The proposed method consistently outperforms popular pruning baseline methods in terms of accuracy and efficiency when dealing with diverse downstream tasks with different memory constraints.
updated: Mon Jul 10 2023 06:44:47 GMT+0000 (UTC)
published: Mon Jul 10 2023 06:44:47 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト