arXiv reaDer
モダリティ固有の蒸留
Modality-specific Distillation
大規模なニューラルネットワークは、計算コストが高く、推論が遅いため、モバイルデバイスに展開するのは実用的ではありません。知識蒸留(KD)は、大きな「教師」モデルから小さな「学生」モデルに知識を転送することにより、パフォーマンスを維持しながらモデルのサイズを縮小する手法です。ただし、視覚言語データセットなどのマルチモーダルデータセットのKDは比較的未踏であり、さまざまなモダリティがさまざまなタイプの情報を提示するため、このようなマルチモーダル情報の消化は困難です。この論文では、マルチモーダルデータセットに関する知識を教師から効果的に伝達するためのモダリティ固有の蒸留(MSD)を提案します。既存のKDアプローチはマルチモーダル設定に適用できますが、学生はモダリティ固有の予測にアクセスできません。私たちのアイデアは、各モダリティに補助損失項を導入することにより、教師のモダリティ固有の予測を模倣することを目的としています。各モダリティは予測にとって異なる重要性を持っているため、補助損失の重み付けアプローチも提案します。これらの損失項の最適な重みを学習するためのメタ学習アプローチ。私たちの実験では、MSDと重み付けスキームの有効性を示し、KDよりも優れたパフォーマンスを実現することを示しています。
Large neural networks are impractical to deploy on mobile devices due to their heavy computational cost and slow inference. Knowledge distillation (KD) is a technique to reduce the model size while retaining performance by transferring knowledge from a large "teacher" model to a smaller "student" model. However, KD on multimodal datasets such as vision-language datasets is relatively unexplored and digesting such multimodal information is challenging since different modalities present different types of information. In this paper, we propose modality-specific distillation (MSD) to effectively transfer knowledge from a teacher on multimodal datasets. Existing KD approaches can be applied to multimodal setup, but a student doesn't have access to modality-specific predictions. Our idea aims at mimicking a teacher's modality-specific predictions by introducing an auxiliary loss term for each modality. Because each modality has different importance for predictions, we also propose weighting approaches for the auxiliary losses; a meta-learning approach to learn the optimal weights on these loss terms. In our experiments, we demonstrate the effectiveness of our MSD and the weighting scheme and show that it achieves better performance than KD.
updated: Wed Jan 06 2021 05:45:07 GMT+0000 (UTC)
published: Wed Jan 06 2021 05:45:07 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト