自己監視型クロスモーダル超解像(SR)は、ペアのトレーニングデータを取得することの難しさを克服できますが、異なるモダリティからの低解像度(LR)ソースと高解像度(HR)ガイド画像しか利用できないため困難です。既存の方法は、LR空間での疑似または弱い監視を利用するため、ぼやけているか、ソースモダリティに忠実でない結果を提供します。この問題に対処するために、ソースからガイドへの変調とガイドからソースへの変調を含む相互変調戦略によってタスクに取り組む相互変調SR(MMSR)モデルを提示します。これらの変調では、クロスドメイン適応フィルターを開発して、クロスモーダル空間依存性を完全に活用し、ソースがガイドの解像度をエミュレートし、ガイドがソースのモダリティ特性を模倣するように誘導します。さらに、完全に自己監視された方法でMMSRをトレーニングするために、サイクル整合性制約を採用しています。さまざまなタスクの実験により、MMSRの最先端のパフォーマンスが実証されています。
Self-supervised cross-modal super-resolution (SR) can overcome the difficulty of acquiring paired training data, but is challenging because only low-resolution (LR) source and high-resolution (HR) guide images from different modalities are available. Existing methods utilize pseudo or weak supervision in LR space and thus deliver results that are blurry or not faithful to the source modality. To address this issue, we present a mutual modulation SR (MMSR) model, which tackles the task by a mutual modulation strategy, including a source-to-guide modulation and a guide-to-source modulation. In these modulations, we develop cross-domain adaptive filters to fully exploit cross-modal spatial dependency and help induce the source to emulate the resolution of the guide and induce the guide to mimic the modality characteristics of the source. Moreover, we adopt a cycle consistency constraint to train MMSR in a fully self-supervised manner. Experiments on various tasks demonstrate the state-of-the-art performance of our MMSR.