網膜イメージングデバイスの多様性は、重要な課題を提起します。ドメインシフトは、1つのドメインでトレーニングされた深層学習モデルを新しいテストドメインに適用すると、パフォーマンスの低下につながります。この論文では、機能空間と出力空間の両方に階層的に適用される複数のドメインアダプタとともにマルチスケール入力を提案します。提案されたトレーニング戦略と、協調的敵対的ドメイン適応(CADA)と呼ばれる新しい教師なしドメイン適応フレームワークは、この課題を効果的に克服できます。マルチスケール入力は、特徴抽出のためにネットワークで使用されるプーリングレイヤーによる情報損失を減らすことができますが、提案されたCADAは、さまざまなネットワークレイヤーでの敵対的学習とアンサンブル重みの両方を通じて絶妙な協調的適応を提示するインタラクティブなパラダイムです。特に、ラベルのないターゲットドメインデータのより良い予測を生成するために、さまざまなレベルのネットワーク層からのマルチスケール出力での敵対的学習と履歴重みの指数移動平均(EMA)の維持により、ドメインの不変性とモデルの一般化可能性を同時に実現します。トレーニング中。ターゲットドメインからのサンプルに注釈を付けることなく、エンコーダー層とデコーダー層での複数の敵対的損失が、ドメイン不変の特徴の抽出を導き、ドメイン分類子を混乱させます。一方、EMAを介した重みのアンサンブルは、複数の弁別子学習を適応させることの不確実性を低減します。包括的な実験結果は、マルチスケール入力トレーニングを組み込んだCADAモデルが、REFUGE、Drishti-GS、およびRim-One-r3データセット。
The diversity of retinal imaging devices poses a significant challenge: domain shift, which leads to performance degradation when applying the deep learning models trained on one domain to new testing domains. In this paper, we propose a multi-scale input along with multiple domain adaptors applied hierarchically in both feature and output spaces. The proposed training strategy and novel unsupervised domain adaptation framework, called Collaborative Adversarial Domain Adaptation (CADA), can effectively overcome the challenge. Multi-scale inputs can reduce the information loss due to the pooling layers used in the network for feature extraction, while our proposed CADA is an interactive paradigm that presents an exquisite collaborative adaptation through both adversarial learning and ensembling weights at different network layers. In particular, to produce a better prediction for the unlabeled target domain data, we simultaneously achieve domain invariance and model generalizability via adversarial learning at multi-scale outputs from different levels of network layers and maintaining an exponential moving average (EMA) of the historical weights during training. Without annotating any sample from the target domain, multiple adversarial losses in encoder and decoder layers guide the extraction of domain-invariant features to confuse the domain classifier. Meanwhile, the ensembling of weights via EMA reduces the uncertainty of adapting multiple discriminator learning. Comprehensive experimental results demonstrate that our CADA model incorporating multi-scale input training can overcome performance degradation and outperform state-of-the-art domain adaptation methods in segmenting retinal optic disc and cup from fundus images stemming from the REFUGE, Drishti-GS, and Rim-One-r3 datasets.