本論文では、コンピュータビジョンとメトリックス学習によりテスト統計を構築するための新しい深層学習法を提案します。このホワイトペーパーで強調されているアプリケーションは、Q-Qプロットにコンピュータービジョンを適用して、正規性検定の新しい検定統計量を構築しています。私たちの知る限り、文献に文書化された同様のアプリケーションはありません。従来、確率変数の確率分布を検証するためのアプローチには2つのファミリがあります。研究者は、Q-Qプロットを主観的に評価するか、コルモゴロフ-スミルノフ検定などの数式を客観的に使用して、正規性検定を正式に実施します。一様に最も強力なテストが存在しない場合、正常性テストの統計は十分に正確でない可能性があるのに対して、人間によるグラフィカルな評価は厳密ではありません。統計学者が統計的により強力な新しい検定統計量を開発するには、数十年かかる場合があります。提案された方法は、ディープラーニングに基づいて4つのコンポーネントを統合します:QQプロットの画像表現学習コンポーネント、次元削減コンポーネント、正規性検定のための2つのQQプロットの違いを最も定量化するメトリック学習コンポーネント、および新しい正規性仮説検定プロセス。私たちの実験結果は、機械学習ベースのテスト統計が、広く使用されているいくつかの従来の正規性テストよりも優れていることを示しています。この研究は、提案されたメソッドがQ-Qプロットに基づいて客観的に強力なテスト統計を作成でき、このメソッドを修正して将来的に他のアプリケーションのより強力なテスト統計を構築できるという説得力のある証拠を提供します。
This paper proposes a new deep-learning method to construct test statistics by computer vision and metrics learning. The application highlighted in this paper is applying computer vision on Q-Q plot to construct a new test statistic for normality test. To the best of our knowledge, there is no similar application documented in the literature. Traditionally, there are two families of approaches for verifying the probability distribution of a random variable. Researchers either subjectively assess the Q-Q plot or objectively use a mathematical formula, such as Kolmogorov-Smirnov test, to formally conduct a normality test. Graphical assessment by human beings is not rigorous whereas normality test statistics may not be accurate enough when the uniformly most powerful test does not exist. It may take tens of years for statistician to develop a new test statistic that is more powerful statistically. Our proposed method integrates four components based on deep learning: an image representation learning component of a Q-Q plot, a dimension reduction component, a metrics learning component that best quantifies the differences between two Q-Q plots for normality test, and a new normality hypothesis testing process. Our experimentation results show that the machine-learning-based test statistics can outperform several widely-used traditional normality tests. This study provides convincing evidence that the proposed method could objectively create a powerful test statistic based on Q-Q plots and this method could be modified to construct many more powerful test statistics for other applications in the future.