arXiv reaDer
Data Engineering for the Analysis of Semiconductor Manufacturing Data
 Q-YIELDと呼ばれる決定木誘導ソフトウェアを使用して、いくつかの異なる半導体製造工場の製造データを分析しました。ソフトウェアは、特定の製品をいつ拒否するかを予測するためのルールを生成します。ルールは、プロセスエンジニアが拒否の原因を発見できるようにすることで、製品の歩留まりを向上させることを目的としています。 Q-YIELDの経験から、データエンジニアリングの重要性がわかりました。データを前処理して、決定木誘導を有効化または促進します。このペーパーでは、半導体製造データで発生したデータエンジニアリングの問題について説明します。このペーパーでは、2つの広範なクラスの問題を扱います。特徴ベクトル表現での特徴のエンジニアリングと、ターゲットコンセプト(クラス)の定義のエンジニアリングです。データには複数のレベルの粒度(詳細、解像度)があるため、製造プロセスデータにはフィーチャエンジニアリングの特別な問題があります。機械学習で未来を予測することにより焦点を当てるのではなく、過去を理解することに重点を置いているため、ターゲットコンセプトの設計は重要です。
We have analyzed manufacturing data from several different semiconductor manufacturing plants, using decision tree induction software called Q-YIELD. The software generates rules for predicting when a given product should be rejected. The rules are intended to help the process engineers improve the yield of the product, by helping them to discover the causes of rejection. Experience with Q-YIELD has taught us the importance of data engineering -- preprocessing the data to enable or facilitate decision tree induction. This paper discusses some of the data engineering problems we have encountered with semiconductor manufacturing data. The paper deals with two broad classes of problems: engineering the features in a feature vector representation and engineering the definition of the target concept (the classes). Manufacturing process data present special problems for feature engineering, since the data have multiple levels of granularity (detail, resolution). Engineering the target concept is important, due to our focus on understanding the past, as opposed to the more common focus in machine learning on predicting the future.
updated: Thu Dec 12 2002 19:11:11 GMT+0000 (UTC)
published: Thu Dec 12 2002 19:11:11 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト