arXiv reaDer
Integrating E-Commerce and Data Mining: Architecture and Challenges
 eコマースドメインは、データマイニングを成功させるためのすべての適切な要素を提供でき、データマイニングのキラードメインであると主張します。この統合をサポートするためのBlue Martini Softwareでの経験に基づいた統合アーキテクチャについて説明します。このアーキテクチャは、知識発見プロジェクトで80%の時間を費やすことが多くの場合、文書化されている前処理、クリーニング、およびデータ理解の労力を劇的に削減できます。検出プロセスに不可欠なデータとメタデータのロギングをサポートするには、アプリケーションサーバーレイヤー(Webサーバーではない)でのデータ収集の必要性を強調します。トランザクション処理システムと顧客のイベントストリーム(クリックストリームなど)からデータウェアハウスに必要なデータ変換ブリッジについて説明します。レポート、データマイニングアルゴリズム、視覚化、OLAPを通じてデータの複数のビューを提供する必要があるマイニングワークベンチの詳細を説明します。最後に一連の課題をまとめます。
We show that the e-commerce domain can provide all the right ingredients for successful data mining and claim that it is a killer domain for data mining. We describe an integrated architecture, based on our expe-rience at Blue Martini Software, for supporting this integration. The architecture can dramatically reduce the pre-processing, cleaning, and data understanding effort often documented to take 80% of the time in knowledge discovery projects. We emphasize the need for data collection at the application server layer (not the web server) in order to support logging of data and metadata that is essential to the discovery process. We describe the data transformation bridges required from the transaction processing systems and customer event streams (e.g., clickstreams) to the data warehouse. We detail the mining workbench, which needs to provide multiple views of the data through reporting, data mining algorithms, visualization, and OLAP. We con-clude with a set of challenges.
updated: Fri Jul 14 2000 00:33:12 GMT+0000 (UTC)
published: Fri Jul 14 2000 00:33:12 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト