統計モデルの入力変数または設計点の選択は、適応設計と能動学習において非常に興味深いものです。 2つの科学的な例に動機付けられて、このペーパーでは、基礎となる回帰関数が不連続である場合に、回帰モデルの設計点を選択する戦略を示します。私たちが行った最初の例は、高解像度の材料イメージングでイメージング速度を加速することを目的としていました。 2つ目は、化学状態図をマッピングするためのシーケンシャルデザインの使用でした。どちらの例でも、基礎となる回帰関数には不連続性があり、既存の設計最適化アプローチの多くは、ほとんどが連続回帰関数を想定しているため、適用できません。ツリー回帰モデルから開発された既存の適応設計戦略の一部は不連続性を処理できますが、ベイズアプローチには、事後推論とその後の設計点選択のための計算コストの高いマルコフ連鎖モンテカルロ法が付属しています。これは、での計算を必要とする最初の動機付けの例には適していません。元のイメージング速度よりも最低速度。さらに、ツリー化されたモデルは、複雑なサブドメイン境界で不連続性が発生した場合に非効率的なドメイン分割に基づいています。不連続性のある回帰分析のためのシンプルで効果的な適応設計戦略を提案します。固定設計のいくつかの統計的特性を最初に提示し、次にこれらの特性を使用して、回帰分析の設計点を選択する新しい基準を提案します。新しい基準を使用したシーケンシャルデザインは、包括的なシミュレーション例とともに提示され、2つの動機付けの例へのその適用が提示されます。
Selecting input variables or design points for statistical models has been of great interest in adaptive design and active learning. Motivated by two scientific examples, this paper presents a strategy of selecting the design points for a regression model when the underlying regression function is discontinuous. The first example we undertook was for the purpose of accelerating imaging speed in a high resolution material imaging; the second was use of sequential design for the purpose of mapping a chemical phase diagram. In both examples, the underlying regression functions have discontinuities, so many of the existing design optimization approaches cannot be applied because they mostly assume a continuous regression function. Although some existing adaptive design strategies developed from treed regression models can handle the discontinuities, the Bayesian approaches come with computationally expensive Markov Chain Monte Carlo techniques for posterior inferences and subsequent design point selections, which is not appropriate for the first motivating example that requires computation at least faster than the original imaging speed. In addition, the treed models are based on the domain partitioning that are inefficient when the discontinuities occurs over complex sub-domain boundaries. We propose a simple and effective adaptive design strategy for a regression analysis with discontinuities: some statistical properties with a fixed design will be presented first, and then these properties will be used to propose a new criterion of selecting the design points for the regression analysis. Sequential design with the new criterion will be presented with comprehensive simulated examples, and its application to the two motivating examples will be presented.