トレーニング後の量子化手法では、一連のキャリブレーションデータを使用して、ネットワークパラメーターとアクティベーションの量子化範囲を計算します。キャリブレーションデータは通常、データの機密性のためにアクセスできない可能性のあるトレーニングデータセットから取得されます。この作業では、このような問題を調査したいと思います。元のデータセットの知識がなくても、ドメイン外のデータを使用して、トレーニングされたネットワークを調整できますか?具体的には、自然画像の領域を超えて、X線画像、衛星画像、超音波画像など、大幅に異なる領域を含めます。クロスドメインキャリブレーションは、13の異なるキャリブレーションデータセットを使用した異なる画像ドメインの10のタスクで量子化モデルの驚くほど安定したパフォーマンスにつながることがわかりました。また、量子化モデルのパフォーマンスは、ソースドメインとキャリブレーションドメイン間のグラム行列の類似性と相関していることもわかりました。これは、パフォーマンスを向上させるためのキャリブレーションセットを選択するための基準として使用できます。私たちの研究は、ネットワークの量子化と圧縮のためにクロスドメインの知識を借りる扉を開くと信じています。
Post-training quantization methods use a set of calibration data to compute quantization ranges for network parameters and activations. The calibration data usually comes from the training dataset which could be inaccessible due to sensitivity of the data. In this work, we want to study such a problem: can we use out-of-domain data to calibrate the trained networks without knowledge of the original dataset? Specifically, we go beyond the domain of natural images to include drastically different domains such as X-ray images, satellite images and ultrasound images. We find cross-domain calibration leads to surprisingly stable performance of quantized models on 10 tasks in different image domains with 13 different calibration datasets. We also find that the performance of quantized models is correlated with the similarity of the Gram matrices between the source and calibration domains, which can be used as a criterion to choose calibration set for better performance. We believe our research opens the door to borrow cross-domain knowledge for network quantization and compression.