スカラー サンプルのコレクションを目的の分布に従うように強制するアルゴリズムとパッケージ、Redistributor を紹介します。ある確率変数 S の独立した同一分布のサンプルと、ある目的のターゲット T の連続累積分布関数が与えられると、分布で R(S)=T を満たす変換 R の一貫した推定量が生成される可能性があります。 S または T の分布は不明な場合があるため、サンプルからこれらの分布を効率的に推定するためのアルゴリズムも含まれています。これにより、画像処理でさまざまな興味深い使用例が可能になり、Redistributor は視覚的に魅力的な結果を生成できる非常にシンプルで使いやすいツールとして機能します。このパッケージは Python で実装され、大規模なデータ セットを効率的に処理するように最適化されているため、機械学習の前処理ステップとしても適しています。ソース コードは https://gitlab.com/paloha/redistributor で入手できます。
We present an algorithm and package, Redistributor, which forces a collection of scalar samples to follow a desired distribution. When given independent and identically distributed samples of some random variable S and the continuous cumulative distribution function of some desired target T, it provably produces a consistent estimator of the transformation R which satisfies R(S)=T in distribution. As the distribution of S or T may be unknown, we also include algorithms for efficiently estimating these distributions from samples. This allows for various interesting use cases in image processing, where Redistributor serves as a remarkably simple and easy-to-use tool that is capable of producing visually appealing results. The package is implemented in Python and is optimized to efficiently handle large data sets, making it also suitable as a preprocessing step in machine learning. The source code is available at https://gitlab.com/paloha/redistributor.