オブジェクトクラスター階層は、機械学習の分野に関心を持つ階層クラスター分析の新しいバリアントです。まだ開発の初期段階にあるため、オブジェクトクラスター階層を体系的に分析するためのツールが不足しているため、それ以上の改善はできません。このペーパーでは、オブジェクトクラスター階層メソッドのベンチマークに使用できる合成階層データのジェネレーターを提案することで、この問題に対処します。この記事では、ジェネレーターの徹底的な経験的および理論的分析を示し、パラメーターの制御方法に関するガイダンスを提供します。実施された実験は、さまざまな異なる構造のデータを生成できるデータジェネレーターの有用性を示しています。さらに、開発されたジェネレーター(http://kio.pwr.edu.pl/?page\_id=396)と共に、最も一般的なタイプの階層を反映するベンチマークデータセットが生成され、一般に公開されます。
Object Cluster Hierarchies is a new variant of Hierarchical Cluster Analysis that gains interest in the field of Machine Learning. Being still at an early stage of development, the lack of tools for systematic analysis of Object Cluster Hierarchies inhibits its further improvement. In this paper we address this issue by proposing a generator of synthetic hierarchical data that can be used for benchmarking Object Cluster Hierarchy methods. The article presents a thorough empirical and theoretical analysis of the generator and provides guidance on how to control its parameters. Conducted experiments show the usefulness of the data generator that is capable of producing a wide range of differently structured data. Further, benchmarking datasets that mirror the most common types of hierarchies are generated and made available to the public, together with the developed generator (http://kio.pwr.edu.pl/?page\_id=396).