arXiv reaDer
画像復元を改善するためのグローバル統計集約の再検討
Revisiting Global Statistics Aggregation for Improving Image Restoration
空間次元全体に沿って集約されるグローバル空間統計は、最高性能の画像復元機能で広く使用されています。たとえば、HINetで採用されているインスタンス正規化(IN)の平均、分散、MPRNetに適用されているSqueeze and Excitation(SE)のグローバル平均プーリング(平均)などです。このホワイトペーパーでは、最初に、トレーニング/テストフェーズでパッチベース/イメージ全体ベースの機能にそれぞれ集約された統計が非常に異なって分布し、イメージ復元機能のパフォーマンスが低下する可能性があることを示します。これまでの作品では見過ごされてきました。この問題を解決するために、テスト時間内にのみ、統計集約操作の領域をグローバルからローカルに置き換える、単純なアプローチであるテスト時間ローカル統計コンバーター(TLSC)を提案します。再トレーニングや微調整を行わなくても、私たちのアプローチは画像復元のパフォーマンスを大幅に向上させます。特に、TLSCを使用してSEを最新モデルに拡張することにより、GoProデータセットのPSNRでMPRNetが0.65 dBブーストし、33.31 dBを達成し、以前の最良の結果である0.6dBを上回ります。さらに、TLSCを高レベルのビジョンタスク、つまりセマンティックセグメンテーションに適用するだけで、競争力のある結果が得られます。 TLSCが限界費用で問題を解決し、大幅な利益を得ることができることを実証するために、広範な量と質の実験が実施されています。コードはhttps://github.com/megvii-research/tlscで入手できます。
Global spatial statistics, which are aggregated along entire spatial dimensions, are widely used in top-performance image restorers. For example, mean, variance in Instance Normalization (IN) which is adopted by HINet, and global average pooling (i.e. mean) in Squeeze and Excitation (SE) which is applied to MPRNet. This paper first shows that statistics aggregated on the patches-based/entire-image-based feature in the training/testing phase respectively may distribute very differently and lead to performance degradation in image restorers. It has been widely overlooked by previous works. To solve this issue, we propose a simple approach, Test-time Local Statistics Converter (TLSC), that replaces the region of statistics aggregation operation from global to local, only in the test time. Without retraining or finetuning, our approach significantly improves the image restorer's performance. In particular, by extending SE with TLSC to the state-of-the-art models, MPRNet boost by 0.65 dB in PSNR on GoPro dataset, achieves 33.31 dB, exceeds the previous best result 0.6 dB. In addition, we simply apply TLSC to the high-level vision task, i.e. semantic segmentation, and achieves competitive results. Extensive quantity and quality experiments are conducted to demonstrate TLSC solves the issue with marginal costs while significant gain. The code is available at https://github.com/megvii-research/tlsc.
updated: Wed Dec 08 2021 12:52:14 GMT+0000 (UTC)
published: Wed Dec 08 2021 12:52:14 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト