arXiv reaDer
TinyTL: アクティベーションを減らし、効率的なオンデバイス学習のためのトレーニングできないパラメーター
TinyTL: Reduce Activations, Not Trainable Parameters for Efficient On-Device Learning
オンデバイス学習により、エッジ デバイスは AI モデルを新しいデータに継続的に適応させることができます。これには、エッジ デバイスの厳しいメモリ制約に適合するために小さなメモリ フットプリントが必要です。既存の作業では、トレーニング可能なパラメーターの数を減らすことでこの問題を解決しています。ただし、主要なボトルネックはパラメーターではなくアクティベーションであるため、これは直接メモリの節約につながるわけではありません。この作業では、メモリ効率の高いオンデバイス学習のための Tiny-Transfer-Learning (TinyTL) を紹介します。 TinyTL はバイアス モジュールのみを学習している間、重みをフリーズするため、中間のアクティベーションを保存する必要はありません。適応能力を維持するために、新しいメモリ効率の良いバイアス モジュールであるライト残差モジュールを導入し、わずか 3.8% のメモリ オーバーヘッドを追加する小さな残差特徴マップを学習することで特徴抽出器を改良します。広範な実験により、TinyTL は、完全なネットワークを微調整する場合と比較して、精度の低下がほとんどなく、メモリを大幅に (最大 6.5 倍) 節約できることが示されています。最後のレイヤーを微調整する場合と比較して、TinyTL は、メモリ オーバーヘッドがほとんどなく、大幅な精度の向上 (最大 34.1%) を提供します。さらに、特徴抽出器の適応と組み合わせることで、TinyTL は、完全な Inception-V3 を微調整する場合と比較して、精度を犠牲にすることなく 7.3 ~ 12.9 倍のメモリ節約を実現します。
On-device learning enables edge devices to continually adapt the AI models to new data, which requires a small memory footprint to fit the tight memory constraint of edge devices. Existing work solves this problem by reducing the number of trainable parameters. However, this doesn't directly translate to memory saving since the major bottleneck is the activations, not parameters. In this work, we present Tiny-Transfer-Learning (TinyTL) for memory-efficient on-device learning. TinyTL freezes the weights while only learns the bias modules, thus no need to store the intermediate activations. To maintain the adaptation capacity, we introduce a new memory-efficient bias module, the lite residual module, to refine the feature extractor by learning small residual feature maps adding only 3.8% memory overhead. Extensive experiments show that TinyTL significantly saves the memory (up to 6.5x) with little accuracy loss compared to fine-tuning the full network. Compared to fine-tuning the last layer, TinyTL provides significant accuracy improvements (up to 34.1%) with little memory overhead. Furthermore, combined with feature extractor adaptation, TinyTL provides 7.3-12.9x memory saving without sacrificing accuracy compared to fine-tuning the full Inception-V3.
updated: Sun Jun 06 2021 01:23:16 GMT+0000 (UTC)
published: Wed Jul 22 2020 18:39:53 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト