arXiv reaDer
効率的な超解像のための残留ローカル機能ネットワーク
Residual Local Feature Network for Efficient Super-Resolution
ディープラーニングベースのアプローチは、単一画像の超解像(SISR)で優れたパフォーマンスを実現しました。ただし、効率的な超解像の最近の進歩は、パラメーターとFLOPの数を減らすことに焦点を当てており、複雑なレイヤー接続戦略を通じて機能の使用率を向上させることで、より強力な機能を集約しています。これらの構造は、より高速な実行速度を達成するために必要ではない場合があり、リソースに制約のあるデバイスへの展開が困難になります。この作業では、新しい残差ローカル機能ネットワーク(RLFN)を提案します。主なアイデアは、残差局所特徴学習に3つの畳み込み層を使用して、特徴集約を単純化することです。これにより、モデルのパフォーマンスと推論時間の間の適切なトレードオフが実現されます。さらに、人気のある対照的な損失を再検討し、その特徴抽出器の中間特徴の選択がパフォーマンスに大きな影響を与えることを観察します。さらに、新しい多段階のウォームスタートトレーニング戦略を提案します。各ステージでは、前のステージで事前にトレーニングされたウェイトを使用して、モデルのパフォーマンスを向上させます。改善されたコントラスト損失とトレーニング戦略と組み合わせることで、提案されたRLFNは、SRのPSNRとSSIMの両方を維持しながら、実行時間の点ですべての最先端の効率的な画像SRモデルよりも優れています。さらに、NTIRE2022の効率的な超解像チャレンジのランタイムトラックで1位を獲得しました。コードはhttps://github.com/fyan111/RLFNで入手できます。
Deep learning based approaches has achieved great performance in single image super-resolution (SISR). However, recent advances in efficient super-resolution focus on reducing the number of parameters and FLOPs, and they aggregate more powerful features by improving feature utilization through complex layer connection strategies. These structures may not be necessary to achieve higher running speed, which makes them difficult to be deployed to resource-constrained devices. In this work, we propose a novel Residual Local Feature Network (RLFN). The main idea is using three convolutional layers for residual local feature learning to simplify feature aggregation, which achieves a good trade-off between model performance and inference time. Moreover, we revisit the popular contrastive loss and observe that the selection of intermediate features of its feature extractor has great influence on the performance. Besides, we propose a novel multi-stage warm-start training strategy. In each stage, the pre-trained weights from previous stages are utilized to improve the model performance. Combined with the improved contrastive loss and training strategy, the proposed RLFN outperforms all the state-of-the-art efficient image SR models in terms of runtime while maintaining both PSNR and SSIM for SR. In addition, we won the first place in the runtime track of the NTIRE 2022 efficient super-resolution challenge. Code will be available at https://github.com/fyan111/RLFN.
updated: Mon May 16 2022 08:46:34 GMT+0000 (UTC)
published: Mon May 16 2022 08:46:34 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト