arXiv reaDer
複数ドメイン学習のためのメモリ効率の良い適応的注意
Memory Efficient Adaptive Attention For Multiple Domain Learning
新しいドメインでCNNを最初からトレーニングするには、通常、多数のラベル付き画像と計算が必要ですが、これは低電力ハードウェアには適していません。これらの要件を減らす1つの方法は、CNNアーキテクチャをモジュール化し、事前トレーニング後に、より重いモジュール、つまり下位層の重みを凍結することです。最近の研究では、新しいドメインで完全に微調整されたCNNの精度に一致させるために必要なトレーニング可能なパラメーターの数を減らす、代替のモジュラーアーキテクチャとスキームが提案されています。私たちの研究は、訓練可能なパラメータの数を桁違いにさらに減らすことが可能であることを示唆しています。さらに、複数ドメイン学習の新しいモジュール化手法を、固定モジュールとトレーニング可能なモジュールの間に必要な相互接続の数、必要なトレーニングサンプルの数、必要な計算の順序、堅牢性など、他の現実的な指標でも比較する必要があることを提案します。トレーニングデータの部分的な誤ったラベル付け。これらすべての基準で、提案されたアーキテクチャは、現在の最先端技術よりも優れているか、それに匹敵します。
Training CNNs from scratch on new domains typically demands large numbers of labeled images and computations, which is not suitable for low-power hardware. One way to reduce these requirements is to modularize the CNN architecture and freeze the weights of the heavier modules, that is, the lower layers after pre-training. Recent studies have proposed alternative modular architectures and schemes that lead to a reduction in the number of trainable parameters needed to match the accuracy of fully fine-tuned CNNs on new domains. Our work suggests that a further reduction in the number of trainable parameters by an order of magnitude is possible. Furthermore, we propose that new modularization techniques for multiple domain learning should also be compared on other realistic metrics, such as the number of interconnections needed between the fixed and trainable modules, the number of training samples needed, the order of computations required and the robustness to partial mislabeling of the training data. On all of these criteria, the proposed architecture demonstrates advantages over or matches the current state-of-the-art.
updated: Thu Oct 21 2021 08:33:29 GMT+0000 (UTC)
published: Thu Oct 21 2021 08:33:29 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト