999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數據挖掘的晶圓制造交貨期預測方法

2016-06-23 09:42:06汪俊亮
中國機械工程 2016年1期
關鍵詞:數據挖掘

汪俊亮 秦 威 張 潔

上海交通大學,上海,200240

基于數據挖掘的晶圓制造交貨期預測方法

汪俊亮秦威張潔

上海交通大學,上海,200240

摘要:晶圓訂單的交貨期預測對于保證訂單交付的準時性和平順性,具有重要的意義。然而,晶圓制造中的在制品數量多、生產周期長的特點加劇了交貨期預測的復雜性。基于海量晶圓制造數據,設計回歸模型來對1669個晶圓加工過程參數與訂單交貨期指標之間的關聯關系進行分析,并采用費舍爾Z變換篩選得到強相關變量,對所得到的強相關變量采用案例推理方法實現了晶圓制造訂單交貨期的精準預測。

關鍵詞:晶圓制造;數據挖掘;交貨期預測;案例推理

0引言

交貨期預測作為晶圓制造運行過程研究中的重要問題,一直受到學術界的關注[1-2]。傳統的交貨期預測方法主要可以分為四類[3]:直接推理方法、仿真方法、分析方法和統計方法。直接推理方法利用工作特性、靜態和動態車間狀態等信息,通過預測每道工序的加工時間,從而推理得到訂單的交貨期[4]。該方法簡便、容易計算,但在復雜的制造過程難以實現交貨期的精準預測。仿真方法是在交貨時間預測研究中廣泛采用的先進方法,Vig等[5]基于不同設計的仿真規則,進行交貨期的預測。分析方法采用排隊論、馬爾可夫模型等數學工具,嘗試估計訂單交貨時間的平均值和標準差[6]。然而,分析方法的假設通常過于簡單,不符合真實條件,這導致其應用受到限制。統計方法采用回歸方法[7]和關聯分析[8]尋找訂單交貨時間和其他變量的關系,在變量的選擇上仍然采用基于經驗的方法。

晶圓制造的設備種類多、數量多,在制品數量和產品工序多,制造工期漫長這些特性使得晶圓制造交貨期預測問題成為一個復雜大規模的問題[9],傳統的交貨期預測方法難以適應。晶圓車間是典型的智能化工廠,其中的智能生產設備、數據通信網絡和傳感器可將制造過程數據源源不斷地采集上來。智能化車間的普及使得以數據挖掘和分析為核心的大數據技術被廣泛應用在設備故障預警[10]、產品質量控制[11]和生產成本優化[12]等方面。數據挖掘方法通過探究數據之間的關聯關系,為解決大規模復雜問題提供了新思路。因此,本文基于數據挖掘技術,對海量制造數據進行分析,從而實現晶圓制造訂單交貨期的精準預測。

1問題描述

在晶圓制造車間中,晶圓加工過程的制造數據(如晶圓卡等待時間)由傳感器測得,并通過工業網絡傳輸搜集,另一部分數據(如每個站的剩余總工作量)從制造執行系統、資源管理系統等信息系統中獲取。本文對這些有可能影響晶圓交貨期的制造數據進行采集,并通過數據挖掘和分析方法,判斷篩選與訂單交貨期強相關的變量,并用于交貨期預測,所采集的晶圓制造候選變量如表1所示。

表1 預測訂單交貨期的候選數據

晶圓制造中,復雜多樣的產品工藝路線與大量的車間在制品使得候選數據具有海量、高維和異構的特點。從數據的體量上來說,2000個訂單的工期預測候選數據集就達到了140萬條,具備海量特點;從數據的維度上來說,候選數據中有訂單特性數據、制造設備狀態數據、物流系統狀態數據,具備高維度特點;從數據的結構來說,候選數據涵蓋時間類型、有比例類型、數值類型、序次類型等多種數據。這些數據的特點進一步加劇了計算的復雜性,因此,采用一種高效數據關聯關系分析方法對于復雜海量的制造數據處理具有重要的意義。

2交貨期與晶圓制造數據相關性分析

考慮到數據的數量和種類,采用回歸分析衡量晶圓交貨期和不同候選變量之間的相關性。對每一個候選變量作費舍爾Z變換來統一各個候選變量和交貨期之間相關性的強度,定義費舍爾變換Z值高的變量為強相關變量。基于預測網絡模型和案例推理方法來評估當前訂單與歷史訂單的相似性,從而找出最合適的歷史案例進行訂單交貨期的預測,本研究的框架如圖1所示。

圖1 基于數據挖掘方法的晶圓交貨期預測框架圖

2.1回歸網絡數據模型

本文采用回歸分析的方法分析候選數據和訂單交貨期之間的相關關系,并采用費舍爾Z變換衡量變量和訂單交貨期之間的相關性,進而篩選得到強相關變量。

單步回歸方法和迭代回歸方法是兩種常用的回歸分析方法。單步回歸方法對實際生產數據或仿真數據進行單一回歸分析,從而確定回歸系數的值。迭代回歸方法通過多次調用回歸分析來計算和修正回歸系數的值。考慮到海量的數據要求和高效的算法要求,本文中采用單步回歸方法,構造多種回歸方程對候選變量進行處理,并通過方差r來驗證回歸效果,r越接近0,回歸效果越好。r表達式為

(1)

2.2基于費舍爾Z變換的關鍵參數篩選

費舍爾Z變換用于衡量各變量和訂單交貨期之間的相關性。當X和Y遵循二元正態分布時,費舍爾Z變換是一種方差近似穩定的變換。費舍爾Z變換的定義為

(2)

3訂單相似性匹配與交貨期推理

在通過數據的相關性分析得到晶圓訂單的強相關變量之后,采用基于案例推理(case-based reasoning,CBR)的方法來預測訂單交貨期。CBR通過對比當前案例與案例組中的案例之間的區別[13],尋找最為匹配的案例,從而實現晶圓訂單交貨期的預測。在晶圓訂單交貨期預測中,案例為晶圓的訂單,通過訂單強相關變量的數值差異來衡量訂單之間的相似性,從而實現案例的搜索和對比。

CBR的步驟具體步驟[14]如下:

(1)檢索。根據強相關變量,從案例組庫中查找相似度最高的案例構建案例組。除了案例組庫,檢索階段還從相似知識庫中檢索。

(2)再利用。重新利用檢索所得(最相似)的案例組解決方案,構建一個建議案例組,從而預測新案例組的解。

(3)修改。評估已解決案例組的解決方案的正確性,如有必要則提供測試/修復案例組的解決方案。修改階段可以手動實現,也可通過知識匹配自動實現。值得注意的是,修改一個建議解決方案很可能比從頭解決該問題的要求要低。

(4)保留。因為修復的案例組很可能對解決未來的問題有用,所以將會作為新知識保留在案例組庫中。

當前訂單變量的相似性定義為

(3)

式中,i為歷史數據編號,i=1,2,…,n-1;m為強相關變量的數目;k為訂單當前的強相關變量;wk為變量k的Z變換值;vnk為當前訂單的變量k的值;vik為歷史數據的變量k的值。

訂單的交貨期預測準確度可由“精確度”和“穩定性”來確定。在本文中,我們采用平均絕對偏差PMAD來衡量精確度,采用交貨期的方差PLV來衡量穩定性:

(4)

(5)

4實驗設計

本文的研究對象是某300 mm晶圓生產線,該生產線主要生產3種類型的晶圓,三者具有完全不同的工藝路線,如表2所示。本文對產品A的訂單完工時間進行預測研究,該晶圓產品涉及320道包含多重入流的工序。基于該生產線的實際情況,本文建立了虛擬化的晶圓制造仿真系統,并獲取了400組晶圓訂單生產數據(如表3所示,每組數據包括1669個候選變量),作為交貨期預測的數據基礎。系統中每道工序的處理時間在0.95倍至1.05倍的該工序平均處理時間內。車間擁有235臺機器,其中的瓶頸工作站是光刻曝光站。先到先服務規則長期用于晶圓批次排序調度,因此不考慮調度規則更改對晶圓訂單交貨期的影響。

表2 本文涉及的晶圓制造車間的產品詳情

表3 本文所采用的晶圓訂單交貨期預測數據

通過對候選數據與晶圓訂單交貨期的相關分析,在1669個候選變量中篩選得到304個強相關的變量,并基于所得的強相關變量構建關聯分析網絡,通過案例推理模型和關聯網絡模型實現晶圓訂單的交貨期預測。在基于案例的推理中,采用前300組數據構建CRB的案例組庫,針對后100組訂單數據進行完工時間預測,從而評價算法的性能。

試驗結果(表4)表明: CBR方法和BP神經網絡算法在晶圓交貨期預測的精準度上都具有不錯的表現,但是在預測結果的穩定性上,CBR方法要明顯優于常見的BP神經網絡算法。

表4 CBR方法和BP神經網絡方法的交貨期預測結果

5結語

本文提出了一種基于數據挖掘的兩個階段交貨期預測方法:設計了一種單步回歸算法從大量候選變量中自動選擇強相關變量;采用基于案例推理的方法來尋找最匹配的歷史數據并預測訂單交貨期。進一步的研究將從以下兩個方面展開:①采用更多的晶圓車間的實際生產數據進行數值試驗,來評估本文提出方法的有效性;②應用多種不同的交貨期預測方法與CBR方法的預測準確性、穩定性、求解速度進行對比。

參考文獻:

[1]RajanSuri.It’saboutTime:theCompetitiveAdvantageofQuickResponseManufacturing[M].NewYork:ProductivityPress,2010.

[2]MamaniH,MoinzadehK.LeadTimeManagementthroughExpeditinginaContinuousReviewInventorySystem[J].ProductionandOperationsManagement, 2014, 23(1): 95-109.

[3]ChungSH,YangMH,ChengCM.TheDesignofDueDateAssignmentModelandtheDeterminationofFlowTimeControlParametersfortheWaferFabricationFactories[J].IEEETransactiononComponent,Packaging,andManufacturingTechnologyPartC,1997,20:278-287.

[4]SmithML,SeidmanA.DueDateSelectionProcedureforJob-shopSimulation[J].Computers&IndustrialEngineering,1983,7(3):199-207.

[5]VigMM,DooleyKJ.DynamicRulesforDue-dateAssignment[J].TheInternationalJournalofProductionResearch, 1991, 29(7): 1361-1377.

[6]EnnsST.JobShopFlowtimePredictionandTardinessControlUsingQueueingAnalysis[J].InternationalJournalofProductionResearch,1993,31(9):2045-2057.

[7]ShaDY,StorchRL,LiuCH.DevelopmentofaRegression-basedMethodwithCase-basedTuningtoSolvetheDueDateAssignmentProblem[J].InternationalJournalofProductionResearch, 2007, 45(1): 65-82.

[8]KaplanAC,UnalAT.AProbabilisticCost-basedDueDateAssignmentModelforJobShops[J].TheInternationalJournalofProductionResearch,1993, 31(12): 2817-2834.

[9]QinW,ZhangJ,SunY.Multiple-objectiveSchedulingforInterbayAMHSbyUsingGenetic-programming-basedCompositeDispatchingRulesGenerator[J].ComputersinIndustry, 2013, 64(6):694-707.

[10]GEMovesMachinestotheCloud[OL]. [2013-07-18].http://www.Businesswire.com/news/home/0130618006446/en/GE-Moves-Machines-Cloud#.UxQ7No2BS50,1989.

[11]BrownB,ChuiM,ManyikaJ.AreYouReadyfortheEraof“BigData”[J].McKinseyQuarterly, 2011, 4: 24-35.

[12]農夫山泉:HANA應用在企業中層層展現[OL]. [2012-04-26].http://www.ileader.com.cn/html/2012/4/26/49926.htm.

[13]GuoYuan,HuJie,PengYinghong.ACBRSystemforInjectionMouldDesignBasedonOntology:aCaseStudy[J].Computer-AidedDesign,2012,44:496-508.

[14]RiesbeckCK,SchankRC.InsideCase-basedReasoning[M].London:PsychologyPress, 1989.

(編輯張洋)

DataMiningforOrders’LTForecastinginWaferFabrication

WangJunliangQinWeiZhangJie

ShanghaiJiaoTongUniversity,Shanghai,200240

Abstract:The accurate prediction of LT plays an important role to help semiconductor manufacturers keep the promises of an accurate and steady delivery-time. However, the large production scale, and long cycle time significantly substantiated the complexity of such a problem. Based on large amounts of manufacturing data, a regression-based model which took account of thousands of parameters was proposed to obtain the correlation among 1669 manufacturing variables and LT. To select “LT-related” variables which had high mean Z-transformed correlations, the Fisher Z-transformation was applied, and the case-based reasoning method was designed to forecast orders’ LT accurately.

Key words:wafer fabrication;data mining;lead-time (LT) forecasting;case-based reasoning

收稿日期:2015-01-09

基金項目:國家自然科學基金資助重點項目(51435009)

中圖分類號:TH166

DOI:10.3969/j.issn.1004-132X.2016.01.017

作者簡介:汪俊亮,男,1991年生。上海交通大學機械與動力工程學院碩士研究生。主要研究方向為制造系統建模與優化。秦威,男,1985年生。上海交通大學機械與動力工程學院講師、博士。張潔,女,1963年生。上海交通大學機械與動力工程學院教授。

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 五月婷婷伊人网| 亚洲视频在线观看免费视频| 日韩精品成人网页视频在线| 青青操国产| 国产18在线播放| 国产精品19p| 亚洲精品在线影院| 一级毛片中文字幕| 久久国产免费观看| 国产精品久久久久久搜索| 国内精品久久人妻无码大片高| 国产又大又粗又猛又爽的视频| 午夜不卡视频| 国产爽妇精品| 亚洲第一区精品日韩在线播放| 日本a∨在线观看| 欧美日韩国产综合视频在线观看| 真实国产精品vr专区| 亚洲区视频在线观看| 天天色天天操综合网| 国产国产人成免费视频77777| 香蕉色综合| 91精品伊人久久大香线蕉| 亚洲婷婷丁香| 美女国产在线| 激情视频综合网| 亚洲国产天堂久久综合| 久久国产精品影院| 色综合久久88| 4虎影视国产在线观看精品| 亚洲日韩AV无码精品| 精品无码人妻一区二区| 日韩色图在线观看| 爱爱影院18禁免费| 色婷婷成人网| 欧美福利在线播放| 欧美专区在线观看| 97久久人人超碰国产精品| 免费观看成人久久网免费观看| 亚洲an第二区国产精品| 欧美激情,国产精品| 国产v欧美v日韩v综合精品| 又爽又黄又无遮挡网站| 狼友视频一区二区三区| 国产成人三级在线观看视频| 欧美性久久久久| 国产精品国产主播在线观看| 午夜福利网址| 欧美黄网站免费观看| 欧美成人免费一区在线播放| 亚洲婷婷丁香| 人妻丰满熟妇av五码区| 国产高清色视频免费看的网址| 国产毛片高清一级国语| 天天综合网站| 日韩精品无码一级毛片免费| 欧美在线导航| 中文字幕在线一区二区在线| 国产精品熟女亚洲AV麻豆| 中文字幕无码中文字幕有码在线 | 久久婷婷五月综合97色| 午夜视频免费一区二区在线看| 成人免费黄色小视频| 日韩免费毛片| 国产成人无码Av在线播放无广告| 亚洲国产精品不卡在线 | 亚洲成人www| 国产一级毛片网站| 亚洲无码高清一区| 伊人成人在线| 亚洲无限乱码一二三四区| 欧美a在线视频| 91 九色视频丝袜| 欧美97欧美综合色伦图| 色一情一乱一伦一区二区三区小说 | 全部毛片免费看| 欧美 亚洲 日韩 国产| 一级爱做片免费观看久久| 欧美一区二区自偷自拍视频| 91无码网站| 婷婷激情五月网| 久久伊伊香蕉综合精品|