徐圣哲,高德東,王 珊,吳昊昊,張西亞,韓永龍,李麗榮
(1.青海大學(xué)機(jī)械工程學(xué)院,西寧 810016;2.陽(yáng)光能源(青海)有限公司,西寧 810007)
發(fā)展太陽(yáng)能光伏發(fā)電是實(shí)現(xiàn)國(guó)家“雙碳”目標(biāo)、優(yōu)化能源結(jié)構(gòu)和提高能源占有量的強(qiáng)有力措施。硅由于具有儲(chǔ)量大、化學(xué)性質(zhì)不活潑、電化學(xué)和熱穩(wěn)定性好等優(yōu)點(diǎn)被廣泛應(yīng)用于光伏發(fā)電領(lǐng)域[1]。在直拉法硅單晶直徑控制中,比例積分微分(proportion integration differentiation, PID)控制對(duì)于非線性、大滯后和不確定性等問題的控制效果不佳[2-3]。因此,許多學(xué)者提出在直拉硅單晶生長(zhǎng)過(guò)程控制中應(yīng)用基于模型的控制方法[4]。
在機(jī)理建模方面,Winkler等[5]采用集總參數(shù)法,建立了適合于控制的晶體直徑和晶體生長(zhǎng)速度模型、固體-液體界面熱關(guān)系模型和彎月面質(zhì)量計(jì)算模型。Rahmanpour等[6]建立了非線性的狀態(tài)空間模型并對(duì)晶體的實(shí)際直徑和彎月面高度進(jìn)行了分析。Derby等[7]提出了一種在時(shí)變空間域上進(jìn)行偏導(dǎo)的晶體傳熱模型。張妮等[8]建立了一種二維軸對(duì)稱浸入邊界熱格子Boltzmann模型來(lái)研究晶體生長(zhǎng)中的相變問題。Chen等[9]在橫向磁場(chǎng)下建立了硅熔體流動(dòng)、熱場(chǎng)分布、氧含量濃度三維模型。張晶等[10]基于拋物型偏微分方程對(duì)時(shí)變空間域的對(duì)流擴(kuò)散過(guò)程建立了溫度模型來(lái)研究等徑階段晶體直徑波動(dòng)。在數(shù)據(jù)驅(qū)動(dòng)建模中,等徑階段晶體直徑控制分為單特征參數(shù)和多特征參數(shù)兩方面。在單特征參數(shù)方面,王春陽(yáng)[11]在粒子群優(yōu)化算法的基礎(chǔ)上建立了加熱器功率-晶體直徑支持向量回歸模型,并根據(jù)預(yù)測(cè)模型設(shè)計(jì)無(wú)模型自適應(yīng)預(yù)測(cè)控制算法。王可[12]運(yùn)用多模型策略和分段線性法,建立“加熱-升溫”模型,并設(shè)計(jì)模型控制器對(duì)單晶爐晶體生長(zhǎng)過(guò)程中的各主要過(guò)程進(jìn)行了分段和模擬。李欣鴿[13]基于帶外源輸入的非線性自回歸(nonlinear autoregressive with exogeneous inputs, NARX)神經(jīng)網(wǎng)絡(luò)建立等徑階段加熱器溫度-晶體直徑非線性模型并設(shè)計(jì)預(yù)測(cè)控制算法。上述基于數(shù)據(jù)驅(qū)動(dòng)的模型控制方法的研究中均采用單一的特征參數(shù)即加熱器-晶體直徑,未考慮其他特征參數(shù)的影響。在多特征參數(shù)方面,劉聰聰?shù)萚14]建立了基于混合變量加權(quán)堆棧自編碼隨機(jī)森林的軟測(cè)量模型并利用灰狼優(yōu)化算法對(duì)其進(jìn)行優(yōu)化,實(shí)現(xiàn)了晶體直徑控制及V/G值的實(shí)時(shí)在線監(jiān)控,其研究主要目的為控制硅單晶缺陷。高德東等[15]建立了基于數(shù)據(jù)驅(qū)動(dòng)的BP神經(jīng)網(wǎng)絡(luò)晶體直徑預(yù)測(cè)模型,并采用遺傳算法對(duì)其進(jìn)行優(yōu)化。上述研究未從機(jī)理方面考慮,未探究特征參數(shù)對(duì)等徑階段晶體直徑的時(shí)延影響。
由于直拉法硅單晶生長(zhǎng)過(guò)程中存在多種機(jī)理假設(shè),多場(chǎng)耦合下邊界條件不明確和化學(xué)變化交錯(cuò)且相互影響等問題,導(dǎo)致機(jī)理建模困難[16]。基于數(shù)據(jù)驅(qū)動(dòng)的模型控制方法采用單一的特征參數(shù)或未考慮特征參數(shù)對(duì)等徑階段晶體直徑的時(shí)延影響。NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)是一種具有記憶功能、結(jié)構(gòu)簡(jiǎn)單和使用范圍廣的神經(jīng)網(wǎng)絡(luò),在處理時(shí)間序列的建模和預(yù)測(cè)等各種非線性問題上效果良好[17-20]。因此,本文提出一種多輸入單輸出的NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)的等徑階段晶體直徑預(yù)測(cè)模型,為晶體直徑的控制提供了一種更準(zhǔn)確的辨識(shí)模型,同時(shí)為實(shí)現(xiàn)晶體高質(zhì)量、大尺寸生長(zhǎng)控制提供了一種有效的手段。
基于神經(jīng)元的晶體直徑預(yù)測(cè)模型如圖1所示,具體分為數(shù)據(jù)準(zhǔn)備、神經(jīng)網(wǎng)絡(luò)訓(xùn)練和神經(jīng)網(wǎng)絡(luò)計(jì)算三部分。在數(shù)據(jù)準(zhǔn)備部分,對(duì)單晶爐拉晶車間晶體直徑生長(zhǎng)數(shù)據(jù)中的關(guān)鍵特征參數(shù)通過(guò)最大信息系數(shù)(maximal information coefficient, MIC)算法進(jìn)行分析,確定對(duì)等徑階段影響最大的特征參數(shù),并將選取的數(shù)據(jù)分為訓(xùn)練數(shù)據(jù)和驗(yàn)證數(shù)據(jù)兩部分,分別用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練和神經(jīng)網(wǎng)絡(luò)的可靠性驗(yàn)證。在神經(jīng)網(wǎng)絡(luò)訓(xùn)練部分,首先構(gòu)建合適的神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),并對(duì)其進(jìn)行初始化。然后,導(dǎo)入訓(xùn)練數(shù)據(jù)進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練,通過(guò)訓(xùn)練調(diào)整神經(jīng)網(wǎng)絡(luò)各層間的權(quán)值,得到精度滿足要求的神經(jīng)網(wǎng)絡(luò),并通過(guò)驗(yàn)證數(shù)據(jù)對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行驗(yàn)證。最后將得到的神經(jīng)網(wǎng)絡(luò)用于后續(xù)計(jì)算。

圖1 基于神經(jīng)元的晶體直徑預(yù)測(cè)模型Fig.1 Crystal diameter prediction model based on neuron
直拉硅單晶等徑階段特征參數(shù)與晶體直徑的相關(guān)性分析屬于特征降維,應(yīng)采用過(guò)濾式特征選擇的方法。該方法中的MIC是基于互信息理論提出的一種特征選擇算法,具有普適性和均衡性的特點(diǎn),能夠有效度量?jī)勺兞康木€性或非線性關(guān)系,以及不同類型數(shù)據(jù)間的相關(guān)性[21-22]。因此,本文通過(guò)MIC分析特征參數(shù)與晶體直徑的相關(guān)性。兩隨機(jī)變量的 MIC 表達(dá)式為:
(1)
式中:Ω(nx,ny)表示大小為nx×ny的二維網(wǎng)格集合;B(n)=nα為最大網(wǎng)格數(shù),n為數(shù)據(jù)樣本個(gè)數(shù),α為常數(shù),α∈(0,1),其具體取值可根據(jù)經(jīng)驗(yàn)或數(shù)據(jù)規(guī)格設(shè)置。
MIC算法的核心思想是在兩個(gè)變量散點(diǎn)圖的基礎(chǔ)上,將散點(diǎn)圖上的觀測(cè)點(diǎn)利用劃分網(wǎng)格柵G的方法分割成nx×ny
加熱功耗和主泵功耗二者散點(diǎn)圖如圖2所示,圖2(a)為加熱功耗-晶體直徑散點(diǎn)圖,圖2(b)為主泵功耗-晶體直徑散點(diǎn)圖,二者散點(diǎn)圖基本相同,計(jì)算加熱功耗和主泵功耗的MIC為0.998 8,二者具有極強(qiáng)的線性關(guān)系,可認(rèn)為加熱功耗和主泵功耗相互冗余。去除冗余參數(shù)主泵功耗和拉晶過(guò)程數(shù)值恒定的特征參數(shù)晶轉(zhuǎn)速度和紅外液溫,對(duì)剩余16個(gè)特征參數(shù)按照MIC值從高到低排列,按照順序逐漸增加模型輸入特征參數(shù)數(shù)量并試算,結(jié)果如圖3所示。隨著模型輸入特征參數(shù)數(shù)量的增加,模型運(yùn)算速度降低。當(dāng)模型輸入特征參數(shù)數(shù)量小于7時(shí),隨著數(shù)量的增加預(yù)測(cè)值與測(cè)試值之間的均方根誤差(root-mean-square error, RMSE) 逐漸減小;當(dāng)模型輸入特征參數(shù)數(shù)量大于7時(shí),隨著數(shù)量的增加預(yù)測(cè)值與測(cè)試值之間的RMSE逐漸增大;當(dāng)模型輸入特征參數(shù)數(shù)量為7時(shí),預(yù)測(cè)值與測(cè)試值之間的RMSE最小。考慮模型訓(xùn)練速度和精度,選取與晶體直徑相關(guān)性較高的7個(gè)特征參數(shù)(加熱功耗、球閥開度、主室爐壓、副室爐壓、主加熱功率、整棒拉速、爐壁測(cè)溫)作為模型輸入。優(yōu)化調(diào)節(jié)這7個(gè)特征參數(shù)將最大程度調(diào)節(jié)直拉硅單晶等徑階段晶體直徑。

圖2 MIC散點(diǎn)圖。(a)加熱功耗-晶體直徑散點(diǎn)圖;(b)主泵功耗-晶體直徑散點(diǎn)圖Fig.2 MIC scatter plots. (a) Heating power consumption-crystal diameter scatter plot; (b) main pump power consumption-crystal diameter scatter plot

圖3 不同數(shù)量模型輸入和均方根誤差的關(guān)系Fig.3 Relationship between different number of model inputs and root mean square error
在多指標(biāo)評(píng)價(jià)體系中,由于各種評(píng)價(jià)指標(biāo)的尺度和尺度單位都不盡相同,在不同指標(biāo)之間存在巨大差異,若不對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化(歸一化)處理,指標(biāo)的數(shù)值高低將會(huì)影響分析結(jié)果,導(dǎo)致后續(xù)訓(xùn)練精度不佳。因此,為了消除指標(biāo)之間的量綱影響,提高數(shù)據(jù)可靠性和訓(xùn)練精度,在使用數(shù)據(jù)前對(duì)其進(jìn)行標(biāo)準(zhǔn)化處理。將所選用7個(gè)模型輸入特征參數(shù)和1個(gè)模型輸出特征參數(shù)進(jìn)行min-max標(biāo)準(zhǔn)化(min-max normalization)處理,對(duì)原始數(shù)據(jù)的線性變換使結(jié)果值映射到[0,1]。轉(zhuǎn)換函數(shù)如下:
(2)
式中:xmax為樣本數(shù)據(jù)的最大值;xmin為樣本數(shù)據(jù)的最小值;x*為數(shù)據(jù)標(biāo)準(zhǔn)化后參數(shù)。本文采用標(biāo)準(zhǔn)化之后的特征參數(shù)組成的7元組Xi(i=1,2,3,…,6,7)作為模型輸入,晶體直徑Y(jié)作為模型輸出,如表2所示。

表2 模型輸入輸出特征參數(shù)Table 2 Inputs and outputs characteristic parameters of model
NARX模型是基于線性ARX模型發(fā)展而來(lái),常用于時(shí)間序列建模。NARX 動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)由輸入層、隱含層和輸出層三部分組成,其結(jié)構(gòu)如圖4所示。

圖4 NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型Fig.4 Structure model of NARX dynamic neural network
NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)的輸入分為外部輸入和反饋輸入兩部分,兩部分均含有時(shí)間延遲結(jié)構(gòu)。這表明NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)的輸出不僅由當(dāng)前的外部輸入所決定,還受外部輸入時(shí)間延遲和反饋輸出時(shí)間延遲的影響。該結(jié)構(gòu)能夠提高神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)性能和對(duì)歷史數(shù)據(jù)的敏感度,可以更好地捕捉到系統(tǒng)的動(dòng)態(tài)特性。NARX模型的定義方程是:
y(t)=f[u(t-1),u(t-2),…,u(t-nu),y(t-1),
y(t-2),…,y(t-ny)]+e(t)
(3)
(4)
(5)
式中:u(t)表示為在t時(shí)刻的輸入時(shí)序數(shù)據(jù);y(t)表示為在t時(shí)刻的輸出時(shí)序數(shù)據(jù);nu表示輸入的時(shí)延階數(shù);ny表示輸出的時(shí)延階數(shù);e(t)表示模型誤差;Hk(t)表示第k個(gè)隱含層神經(jīng)元輸出層的輸出;ωik表示連接第i個(gè)外生輸入和第k個(gè)隱含層的神經(jīng)元;ωjk表示第j個(gè)反饋輸入和第k個(gè)隱含層神經(jīng)元;ωok表示隱含層和輸出層的權(quán)值;bk、bo表示偏置;f(·)表示非線性激活函數(shù);g(·)為線性激活函數(shù)。
神經(jīng)網(wǎng)絡(luò)中的隱含層不直接同輸入輸出連接,它通過(guò)處理輸入數(shù)據(jù)的特征來(lái)更好地進(jìn)行數(shù)據(jù)處理和劃分,因此隱含層數(shù)很大程度影響神經(jīng)網(wǎng)絡(luò)對(duì)數(shù)據(jù)的處理能力。隱含層數(shù)為1層時(shí),神經(jīng)網(wǎng)絡(luò)可以逼近任意連續(xù)函數(shù)。綜合考慮模型精度及復(fù)雜程度,選取隱含層數(shù)為1。隱含層中神經(jīng)元數(shù)也稱為節(jié)點(diǎn)數(shù),通常由經(jīng)驗(yàn)法或反復(fù)實(shí)驗(yàn)法選取,如神經(jīng)元數(shù)目過(guò)少會(huì)無(wú)法匹配數(shù)據(jù)全部特征,出現(xiàn)欠擬合的情況,影響訓(xùn)練精度。如神經(jīng)元數(shù)目過(guò)多,訓(xùn)練過(guò)程將會(huì)增加,甚至?xí)霈F(xiàn)過(guò)擬合的情況,同樣影響訓(xùn)練精度。通過(guò)試算,當(dāng)隱含層中神經(jīng)元數(shù)為10時(shí),預(yù)測(cè)值與測(cè)試值之間的RSME最小。因此,隱含層神經(jīng)元數(shù)為10。加熱功耗與晶體直徑的MIC為0.529 4,對(duì)直拉硅單晶等徑階段直徑影響最大。由硅晶體生長(zhǎng)理論可知,實(shí)際拉晶生產(chǎn)中加熱功耗對(duì)晶體直徑影響很慢,經(jīng)驗(yàn)滯后時(shí)間約為8 min[13]。根據(jù)模型時(shí)延參數(shù)計(jì)算:
(6)
在晶體直徑測(cè)量數(shù)據(jù)中采樣時(shí)間Δt=60 s,經(jīng)驗(yàn)滯后時(shí)間t=8 min,計(jì)算晶體直徑時(shí)延參數(shù)d=8。因此,輸入時(shí)延階數(shù)和輸出時(shí)延階數(shù)均取8。
NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法會(huì)極大地影響到它的預(yù)測(cè)性能,常見的訓(xùn)練算法指標(biāo)對(duì)比如表3所示。Bayesian Regularization算法需要更大的內(nèi)存和更多的收斂時(shí)間,但對(duì)于困難或嘈雜等特殊的數(shù)據(jù)集,具有良好的泛化效果。Scaled Conjugate Gradient算法需要較少的內(nèi)存,適用于求解線性方程組和無(wú)約束優(yōu)化問題。LM(Levenberg-Marquardt)算法需要內(nèi)存較多,收斂時(shí)間較短,該算法將最速下降法與高斯-牛頓法相結(jié)合,根據(jù)離最優(yōu)解的距離選用不同的算法,既可以克服最速下降法離最優(yōu)解的距離較近時(shí)收斂速度慢的問題,又可以克服 Hessian矩陣無(wú)法迭代不滿秩的問題。考慮收斂速度和訓(xùn)練精度,本文選取LM算法作為訓(xùn)練算法。綜上所述,NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)的模型參數(shù)為隱含層數(shù)為1,隱含層神經(jīng)元數(shù)為10,輸入時(shí)延階數(shù)和輸出時(shí)延階數(shù)為8,訓(xùn)練算法為L(zhǎng)M算法。

表3 常見的訓(xùn)練算法指標(biāo)Table 3 Common training algorithm indicators
采用來(lái)源于拉晶車間提供的三臺(tái)單晶爐等徑階段8輪生產(chǎn)數(shù)據(jù),將預(yù)處理后的完整數(shù)據(jù)80%劃分為訓(xùn)練集(train set)、10%劃分為驗(yàn)證集(validation set)、10%劃為測(cè)試集(test set),用于模型的訓(xùn)練、篩選和評(píng)估。訓(xùn)練后NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)測(cè)試集的誤差直方圖如圖5所示,圖5中橫坐標(biāo)誤差為標(biāo)準(zhǔn)化后晶體直徑相對(duì)誤差,其誤差值為標(biāo)準(zhǔn)化后晶體直徑真實(shí)值與預(yù)測(cè)值差值 (Post-standardization error=Post-standardization target-Post-standardization prediction),縱坐標(biāo)為測(cè)試集的數(shù)量。圖5(a)所示的No.1單晶爐測(cè)試集誤差分布集中在0誤差線附近,處于-0.03~-0.01之間的誤差的數(shù)量最多。隨著距離0誤差線距離增大,存在誤差的數(shù)量逐漸減小,所有誤差處于-0.10~0.07之間。圖5(b)所示的No.2單晶爐測(cè)試集誤差分布集中在0誤差線附近,處于0~0.01之間的誤差的數(shù)量最多,較其他區(qū)間誤差數(shù)量比較突出。隨著距離0誤差線距離增大,存在誤差的數(shù)量逐漸減小,所有誤差處于-0.05~0.06之間。圖5(c)所示的No.3單晶爐測(cè)試集誤差大部分集中于-0.03~0.04之間。隨著距離0誤差線距離增大,存在誤差的數(shù)量逐漸減小,所有誤差處于-0.08~0.07之間。由圖5所知,三臺(tái)單晶爐誤差數(shù)值和誤差分布均較為理想,滿足預(yù)測(cè)要求。

圖5 NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)誤差直方圖。(a)No.1單晶爐;(b)No.2單晶爐;(c)No.3單晶爐Fig.5 Error histogram of NARX dynamic neural network. (a) No.1 single crystal furnace; (b) No.2 single crystal furnace; (c) No.3 single crystal furnace
通過(guò)縮小訓(xùn)練數(shù)據(jù)可驗(yàn)證NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)的有效性[23]。針對(duì)No.3單晶爐,縮小訓(xùn)練數(shù)據(jù),采用5輪單晶爐等徑階段生產(chǎn)數(shù)據(jù),其余NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)模型設(shè)定不變,訓(xùn)練結(jié)果如圖6所示。5輪數(shù)據(jù)的No.3單晶爐測(cè)試集誤差大部分集中于-0.04~0.04,有相當(dāng)一部分?jǐn)?shù)據(jù)誤差處于-0.14~-0.05,其所有誤差處于-0.14~0.07,同圖5(c)相比預(yù)測(cè)誤差明顯增大。在縮小訓(xùn)練數(shù)據(jù)的情況下,可以獲得較好的直徑預(yù)測(cè)結(jié)果,驗(yàn)證了NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)的有效性。然而,隨著訓(xùn)練數(shù)據(jù)的減少,預(yù)測(cè)誤差逐漸增大。

圖6 No.3單晶爐誤差直方圖(5輪)Fig.6 Error histogram of No.3 single crystal furnace (5 rounds)
BP神經(jīng)網(wǎng)絡(luò),也稱為反向傳播神經(jīng)網(wǎng)絡(luò),是一種靜態(tài)前饋神經(jīng)網(wǎng)絡(luò),具有結(jié)構(gòu)簡(jiǎn)單,應(yīng)用廣泛,非線性映射能力強(qiáng)與泛化能力強(qiáng)等優(yōu)點(diǎn)[24]。在實(shí)際生產(chǎn)中,每臺(tái)單晶爐因組裝和生產(chǎn)工藝優(yōu)化調(diào)整等原因存在差異,在生產(chǎn)前需對(duì)每臺(tái)單晶爐參數(shù)進(jìn)行調(diào)整,導(dǎo)致加熱特性不同。因此,采用上述相同數(shù)據(jù)集,基于BP神經(jīng)網(wǎng)絡(luò)建立等徑階段晶體直徑預(yù)測(cè)模型,并對(duì)No.1、No.2、No.3單晶爐分別進(jìn)行訓(xùn)練。將NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果進(jìn)行對(duì)比分析,兩種神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)值與真實(shí)值對(duì)比圖如圖7所示,預(yù)測(cè)結(jié)果如表4所示。

圖7 預(yù)測(cè)值與真實(shí)值對(duì)比圖。(a)No.1單晶爐;(b)No.2單晶爐;(c)No.3單晶爐Fig.7 Comparison of predicted and real values. (a) No.1 single crystal furnace; (b) No.2 single crystal furnace; (c) No.3 single crystal furnace

表4 兩種神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型性能Table 4 Performance of two neural network prediction models
圖7(a)所示的No.1單晶爐中NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)可以較精確地預(yù)測(cè)等徑階段晶體直徑,其預(yù)測(cè)均方誤差MSE 為0.000 797 72,相關(guān)系數(shù)R為96.744%。BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)直徑波動(dòng)范圍小,不能實(shí)時(shí)反映晶體直徑的無(wú)規(guī)則變化,只能大致反映晶體直徑變化趨勢(shì),其預(yù)測(cè)均方誤差MSE為0.006 498,相關(guān)系數(shù)R為75.428%,可見在No.1單晶爐中,NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度明顯優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。圖7(b)所示的No.2單晶爐中,NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)可以較精確地預(yù)測(cè)等徑階段晶體直徑,其預(yù)測(cè)均方誤差MSE為0.000 948 81,相關(guān)系數(shù)R為98.907%。BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)直徑波動(dòng)范圍小,同直徑真實(shí)值差距較大,預(yù)測(cè)值變化趨勢(shì)明顯滯后于真實(shí)值,其預(yù)測(cè)均方誤差MSE 為0.004 389,相關(guān)系數(shù)R為89.129%,可見在No.2單晶爐中,NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度明顯優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。圖7(c)所示的No.3單晶爐中NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)可以精確地預(yù)測(cè)等徑階段晶體直徑,其預(yù)測(cè)均方誤差MSE 為0.000 575 47,相關(guān)系數(shù)R為99.594%。BP神經(jīng)網(wǎng)絡(luò)在前期直徑波動(dòng)較小時(shí)預(yù)測(cè)誤差較小,當(dāng)晶體直徑波動(dòng)較大時(shí),預(yù)測(cè)值明顯偏離于真實(shí)值,誤差較大,其預(yù)測(cè)均方誤差MSE 為0.006 487 9,相關(guān)系數(shù)R為96.254%,可見在No.3單晶爐中,NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度明顯優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。
在3臺(tái)單晶爐中,BP神經(jīng)網(wǎng)絡(luò)的均方誤差MSE平均值為0.005 792,相關(guān)系數(shù)R平均值為86.937%, NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)均方誤差MSE平均值為0.000 774,相關(guān)系數(shù)R平均值為98.415%。以平均均方誤差MSE作為評(píng)估標(biāo)準(zhǔn),NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)較BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)精度提高了86.64%。以平均相關(guān)系數(shù)R作為評(píng)估標(biāo)準(zhǔn),NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)較BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)精度提高了13.20%。
根據(jù)No.1、2、3三臺(tái)單晶爐的拉晶車間生產(chǎn)數(shù)據(jù),基于NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)建立等徑階段晶體直徑預(yù)測(cè)模型,其預(yù)測(cè)晶體直徑誤差數(shù)值和誤差分布均較為理想。當(dāng)縮小訓(xùn)練數(shù)據(jù)的情況下,該模型仍獲得較好的直徑預(yù)測(cè)結(jié)果。將建立的NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)同BP神經(jīng)網(wǎng)絡(luò)進(jìn)行對(duì)比,三臺(tái)單晶爐的NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)精度均明顯優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。上述結(jié)果表明, NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)為晶體直徑的控制提供了一種更準(zhǔn)確的辨識(shí)模型。
本文針對(duì)直拉法在制備硅單晶的過(guò)程中存在多種機(jī)理假設(shè)、多場(chǎng)耦合下邊界條件不明確和化學(xué)變化交錯(cuò)且相互影響等問題,探究了與晶體直徑的相關(guān)的特征參數(shù),建立了一種多輸入單輸出的NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)等徑階段晶體直徑預(yù)測(cè)模型,并分析驗(yàn)證了該模型預(yù)測(cè)效果,結(jié)論如下:
(1)通過(guò)MIC算法分析特征參數(shù)與晶體直徑的相關(guān)性,得到加熱功耗、球閥開度、主室爐壓、副室爐壓、主加熱功率、整棒拉速以及爐壁測(cè)溫7個(gè)與晶體直徑的相關(guān)性最高的特征參數(shù)。
(2)所建立NARX 動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)等徑階段晶體直徑預(yù)測(cè)模型對(duì)晶體直徑預(yù)測(cè)的均方誤差MSE平均值為0. 000 774。
(3)通過(guò)NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)進(jìn)行對(duì)比分析,在以平均均方誤差MSE作為評(píng)估標(biāo)準(zhǔn)下,所用神經(jīng)網(wǎng)絡(luò)較BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)精度提高了86.64%,驗(yàn)證了NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)的優(yōu)越性。