古典的な生成的敵対的ネットワーク(GAN)のパフォーマンスを改善するために、Wasserstein生成的敵対的ネットワーク(W-GAN)は、Wasserstein-1距離を使用した最適トランスポート(OT)問題のKantorovichデュアル定式化として開発されました。しかし、cycleGANタイプの生成モデルが最適な輸送理論からどのように導き出されるかは明らかではありませんでした。ここでは、輸送コストとしてディープラーニングベースのインバースパスペナルティ付きのペナルティ付き最小二乗(PLS)コストが使用される場合、新規のcycleGANアーキテクチャがKantorovichデュアルOT公式として導出できることを示します。この定式化の最も重要な利点の1つは、前向き問題の知識に応じて、cycleGANアーキテクチャの異なるバリエーションを導出できることです。たとえば、2つのペアのジェネレータとディスクリミネータを備えたものと、もう1つのペアだけを備えたものです。ジェネレーターとディスクリミネーター。 2つのジェネレーターの場合でも、フォワードオペレーターの構造的知識が、ニューラルネットワークのトレーニングを大幅に簡略化するシンプルなジェネレーターアーキテクチャにつながる可能性があることを示します。 OT-cycleGANと呼ばれる新しいcycleGAN製剤は、加速磁気共鳴画像法(MRI)、超解像顕微鏡法、低線量X線コンピューター断層撮影(CT)など、さまざまな生物医学画像の問題に適用されています。実験結果は、理論の有効性と柔軟性を確認します。
To improve the performance of classical generative adversarial network (GAN), Wasserstein generative adversarial networks (W-GAN) was developed as a Kantorovich dual formulation of the optimal transport (OT) problem using Wasserstein-1 distance. However, it was not clear how cycleGAN-type generative models can be derived from the optimal transport theory. Here we show that a novel cycleGAN architecture can be derived as a Kantorovich dual OT formulation if a penalized least square (PLS) cost with deep learning-based inverse path penalty is used as a transportation cost. One of the most important advantages of this formulation is that depending on the knowledge of the forward problem, distinct variations of cycleGAN architecture can be derived: for example, one with two pairs of generators and discriminators, and the other with only a single pair of generator and discriminator. Even for the two generator cases, we show that the structural knowledge of the forward operator can lead to a simpler generator architecture which significantly simplifies the neural network training. The new cycleGAN formulation, what we call the OT-cycleGAN, have been applied for various biomedical imaging problems, such as accelerated magnetic resonance imaging (MRI), super-resolution microscopy, and low-dose x-ray computed tomography (CT). Experimental results confirm the efficacy and flexibility of the theory.