大規模な天文調査の時代に、複数のデータセットに対して人工知能アルゴリズムを同時に活用する能力は、科学的発見のための新しい道を開きます。残念ながら、あるデータ ドメインの画像でディープ ニューラル ネットワークをトレーニングするだけでは、他のデータセットではパフォーマンスが非常に低下することがよくあります。ここでは、さまざまなタイプのクラスが重複しているデータセットに適用できる、半教師付きドメイン アライメントを実行できる Universal Domain Adaptation メソッド DeepAstroUDA を開発します。追加のクラスは 2 つのデータセットのいずれにも存在する可能性があり、未知のクラスが存在する場合でもメソッドを使用できます。初めて、2 つの非常に異なる観測データセット (SDSS と DECaLS から) でのドメイン適応の使用の成功を示します。私たちの方法は、2 つの天文調査の間のギャップを埋めることができ、ラベルのないデータセット内の未知のデータの異常検出とクラスタリングにも適していることを示しています。このモデルを、異常検出を伴う銀河の形態分類タスクの 2 つの例に適用します。 2) クラスが銀河のより詳細な形態学的特性を記述し、重力レンズの検出を伴う、より粒度の高い問題 (1 つの未知の異常クラスを含む 10 クラス)。
In the era of big astronomical surveys, our ability to leverage artificial intelligence algorithms simultaneously for multiple datasets will open new avenues for scientific discovery. Unfortunately, simply training a deep neural network on images from one data domain often leads to very poor performance on any other dataset. Here we develop a Universal Domain Adaptation method DeepAstroUDA, capable of performing semi-supervised domain alignment that can be applied to datasets with different types of class overlap. Extra classes can be present in any of the two datasets, and the method can even be used in the presence of unknown classes. For the first time, we demonstrate the successful use of domain adaptation on two very different observational datasets (from SDSS and DECaLS). We show that our method is capable of bridging the gap between two astronomical surveys, and also performs well for anomaly detection and clustering of unknown data in the unlabeled dataset. We apply our model to two examples of galaxy morphology classification tasks with anomaly detection: 1) classifying spiral and elliptical galaxies with detection of merging galaxies (three classes including one unknown anomaly class); 2) a more granular problem where the classes describe more detailed morphological properties of galaxies, with the detection of gravitational lenses (ten classes including one unknown anomaly class).