arXiv reaDer
天体画像の大規模なカタログに注釈を付けるためにディープニューラルネットワークを使用する場合の体系的なバイアス
Systematic biases when using deep neural networks for annotating large catalogs of astronomical images
ディープ畳み込みニューラルネットワーク(DCNN)は、ノンパラメトリックな性質、優れたパフォーマンス、TensorFlowなどのライブラリを介したアクセス性により、自動画像アノテーションの最も一般的なソリューションになりました。他の分野の中でも、DCNNは、デジタルスカイサーベイによって取得された大規模な天文画像データベースの注釈への一般的なアプローチでもあります。 DCNNの主な欠点の1つは、DCNNを「ブラックボックス」として機能させ、ユーザーに不明確な方法で注釈を提供する複雑で直感的でないルールです。したがって、ユーザーは多くの場合、どの情報を知ることができません。はDCNNによって分類に使用されます。ここでは、DCNNのトレーニングが、空のオブジェクトの位置などのトレーニングデータのコンテキストに敏感であることを示します。楕円銀河とらせん銀河の基本的な分類では、訓練に使用される銀河の空の位置は、アルゴリズムの動作に影響を与え、小さいが一貫性のある統計的に有意なバイアスにつながります。そのバイアスは、基本的な銀河の形態の分布において宇宙規模の異方性の形で現れます。したがって、 DCNNは拡張ソースの画像に注釈を付けるための強力なツールですが、銀河形態のトレーニングセットの構築では、obの視覚的外観よりも多くの側面を考慮する必要があります。ジェクト。いずれにせよ、宇宙論的異方性の兆候を示す深いニューラルネットワークで作成されたカタログは、一貫したバイアスの可能性を持って解釈されるべきです。
Deep convolutional neural networks (DCNNs) have become the most common solution for automatic image annotation due to their non-parametric nature, good performance, and their accessibility through libraries such as TensorFlow. Among other fields, DCNNs are also a common approach to the annotation of large astronomical image databases acquired by digital sky surveys. One of the main downsides of DCNNs is the complex non-intuitive rules that make DCNNs act as a ``black box", providing annotations in a manner that is unclear to the user. Therefore, the user is often not able to know what information is used by the DCNNs for the classification. Here we demonstrate that the training of a DCNN is sensitive to the context of the training data such as the location of the objects in the sky. We show that for basic classification of elliptical and spiral galaxies, the sky location of the galaxies used for training affects the behavior of the algorithm, and leads to a small but consistent and statistically significant bias. That bias exhibits itself in the form of cosmological-scale anisotropy in the distribution of basic galaxy morphology. Therefore, while DCNNs are powerful tools for annotating images of extended sources, the construction of training sets for galaxy morphology should take into consideration more aspects than the visual appearance of the object. In any case, catalogs created with deep neural networks that exhibit signs of cosmological anisotropy should be interpreted with the possibility of consistent bias.
updated: Mon Jan 10 2022 01:51:14 GMT+0000 (UTC)
published: Mon Jan 10 2022 01:51:14 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト