ディープラーニングの大きな成功は、主に大規模なネットワークアーキテクチャと高品質のトレーニングデータによるものです。ただし、メモリとイメージング機能が制限されているポータブルデバイスに最近のディープモデルを展開することは依然として困難です。いくつかの既存の作業は、知識の蒸留によってモデルを圧縮することに従事しています。残念ながら、これらの方法では、低解像度(LR)画像など、画質が低下した画像を処理できません。この目的のために、高解像度(HR)画像から学習したヘビーネットワークモデルからLR画像を処理するコンパクトなネットワークモデルに役立つ知識を抽出する先駆的な取り組みを行い、新しいピクセル蒸留で現在の知識蒸留技術を進歩させます。この目標を達成するために、モデル圧縮段階と高解像度表現転送段階への知識の蒸留を解きほぐす、Teacher-Assistant-Student(TAS)フレームワークを提案します。新しい機能超解像(FSR)モジュールを装備することにより、私たちのアプローチは、重い教師モデルと同様の精度を達成できるが、パラメーターがはるかに少なく、推論速度が速く、入力の解像度が低い軽量ネットワークモデルを学習できます。広く使用されている3つのベンチマーク、つまりCUB-200-2011、PASCAL VOC 2007、およびImageNetSubでの包括的な実験は、私たちのアプローチの有効性を示しています。
The great success of deep learning is mainly due to the large-scale network architecture and the high-quality training data. However, it is still challenging to deploy recent deep models on portable devices with limited memory and imaging ability. Some existing works have engaged to compress the model via knowledge distillation. Unfortunately, these methods cannot deal with images with reduced image quality, such as the low-resolution (LR) images. To this end, we make a pioneering effort to distill helpful knowledge from a heavy network model learned from high-resolution (HR) images to a compact network model that will handle LR images, thus advancing the current knowledge distillation technique with the novel pixel distillation. To achieve this goal, we propose a Teacher-Assistant-Student (TAS) framework, which disentangles knowledge distillation into the model compression stage and the high resolution representation transfer stage. By equipping a novel Feature Super Resolution (FSR) module, our approach can learn lightweight network model that can achieve similar accuracy as the heavy teacher model but with much fewer parameters, faster inference speed, and lower-resolution inputs. Comprehensive experiments on three widely-used benchmarks, i.e. , CUB-200-2011, PASCAL VOC 2007, and ImageNetSub, demonstrate the effectiveness of our approach.