高精細ディスプレイ デバイスの開発に伴い、超解像 (SR) の実際のシナリオでは、通常、2K のような大きな入力をより高い解像度 (4K/8K) に超解像する必要があります。計算とメモリのコストを削減するために、現在の方法ではまず大きな入力をローカル パッチに分割し、次に SR パッチを出力にマージします。これらの方法は、パッチごとにサブネットを適応的に割り当てます。量子化は、ネットワーク アクセラレーションにとって非常に重要な手法であり、サブネットの設計に使用されています。現在の方法では、MLP ビット セレクターをトレーニングして、各レイヤーの適切なビットを決定します。ただし、トレーニングのためにサブネットを一様にサンプリングするため、単純なサブネットはオーバーフィットし、複雑なサブネットはアンダーフィットになります。したがって、トレーニングされたビット セレクターは最適なビットを決定できません。これとは別に、導入されたビットセレクターは、SR ネットワークの各レイヤーに追加のコストをもたらします。この論文では、パフォーマンスを損なうことなくビットセレクターを削除できる、Content-Aware Bit Mapping (CABM) という名前の新しい方法を提案します。 CABM は、トレーニング中に各レイヤーのビット セレクターも学習します。トレーニング後、入力パッチのエッジ情報と各レイヤーのビットの関係を分析します。エッジ情報は、選択したビットの有効なメトリックになり得ることがわかります。したがって、推論中にパッチのエッジ スコアを各レイヤーのビットにマップする Edge-to-Bit ルックアップ テーブルを構築する戦略を設計します。 SR ネットワークのビット構成は、すべてのレイヤーのルックアップ テーブルによって決定できます。私たちの戦略はより良いビット構成を見つけることができ、その結果、より効率的な混合精度ネットワークが得られます。この方法の一般化能力を実証するために、詳細な実験を行います。コードが公開されます。
With the development of high-definition display devices, the practical scenario of Super-Resolution (SR) usually needs to super-resolve large input like 2K to higher resolution (4K/8K). To reduce the computational and memory cost, current methods first split the large input into local patches and then merge the SR patches into the output. These methods adaptively allocate a subnet for each patch. Quantization is a very important technique for network acceleration and has been used to design the subnets. Current methods train an MLP bit selector to determine the propoer bit for each layer. However, they uniformly sample subnets for training, making simple subnets overfitted and complicated subnets underfitted. Therefore, the trained bit selector fails to determine the optimal bit. Apart from this, the introduced bit selector brings additional cost to each layer of the SR network. In this paper, we propose a novel method named Content-Aware Bit Mapping (CABM), which can remove the bit selector without any performance loss. CABM also learns a bit selector for each layer during training. After training, we analyze the relation between the edge information of an input patch and the bit of each layer. We observe that the edge information can be an effective metric for the selected bit. Therefore, we design a strategy to build an Edge-to-Bit lookup table that maps the edge score of a patch to the bit of each layer during inference. The bit configuration of SR network can be determined by the lookup tables of all layers. Our strategy can find better bit configuration, resulting in more efficient mixed precision networks. We conduct detailed experiments to demonstrate the generalization ability of our method. The code will be released.