基于NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)直拉硅單晶直徑預(yù)測(cè)模型

2022-02-01 06:15:48徐圣哲高德東吳昊昊張西亞韓永龍李麗榮

人工晶體學(xué)報(bào) 2022年12期

關(guān)鍵詞：模型

徐圣哲,高德東,王珊,吳昊昊，張西亞，韓永龍，李麗榮

(1.青海大學(xué)機(jī)械工程學(xué)院，西寧 810016；2.陽(yáng)光能源(青海)有限公司，西寧 810007)

0 引言

發(fā)展太陽(yáng)能光伏發(fā)電是實(shí)現(xiàn)國(guó)家“雙碳”目標(biāo)、優(yōu)化能源結(jié)構(gòu)和提高能源占有量的強(qiáng)有力措施。硅由于具有儲(chǔ)量大、化學(xué)性質(zhì)不活潑、電化學(xué)和熱穩(wěn)定性好等優(yōu)點(diǎn)被廣泛應(yīng)用于光伏發(fā)電領(lǐng)域[1]。在直拉法硅單晶直徑控制中，比例積分微分(proportion integration differentiation, PID)控制對(duì)于非線性、大滯后和不確定性等問題的控制效果不佳[2-3]。因此，許多學(xué)者提出在直拉硅單晶生長(zhǎng)過(guò)程控制中應(yīng)用基于模型的控制方法[4]。

在機(jī)理建模方面，Winkler等[5]采用集總參數(shù)法，建立了適合于控制的晶體直徑和晶體生長(zhǎng)速度模型、固體-液體界面熱關(guān)系模型和彎月面質(zhì)量計(jì)算模型。Rahmanpour等[6]建立了非線性的狀態(tài)空間模型并對(duì)晶體的實(shí)際直徑和彎月面高度進(jìn)行了分析。Derby等[7]提出了一種在時(shí)變空間域上進(jìn)行偏導(dǎo)的晶體傳熱模型。張妮等[8]建立了一種二維軸對(duì)稱浸入邊界熱格子Boltzmann模型來(lái)研究晶體生長(zhǎng)中的相變問題。Chen等[9]在橫向磁場(chǎng)下建立了硅熔體流動(dòng)、熱場(chǎng)分布、氧含量濃度三維模型。張晶等[10]基于拋物型偏微分方程對(duì)時(shí)變空間域的對(duì)流擴(kuò)散過(guò)程建立了溫度模型來(lái)研究等徑階段晶體直徑波動(dòng)。在數(shù)據(jù)驅(qū)動(dòng)建模中，等徑階段晶體直徑控制分為單特征參數(shù)和多特征參數(shù)兩方面。在單特征參數(shù)方面，王春陽(yáng)[11]在粒子群優(yōu)化算法的基礎(chǔ)上建立了加熱器功率-晶體直徑支持向量回歸模型，并根據(jù)預(yù)測(cè)模型設(shè)計(jì)無(wú)模型自適應(yīng)預(yù)測(cè)控制算法。王可[12]運(yùn)用多模型策略和分段線性法，建立“加熱-升溫”模型，并設(shè)計(jì)模型控制器對(duì)單晶爐晶體生長(zhǎng)過(guò)程中的各主要過(guò)程進(jìn)行了分段和模擬。李欣鴿[13]基于帶外源輸入的非線性自回歸(nonlinear autoregressive with exogeneous inputs, NARX)神經(jīng)網(wǎng)絡(luò)建立等徑階段加熱器溫度-晶體直徑非線性模型并設(shè)計(jì)預(yù)測(cè)控制算法。上述基于數(shù)據(jù)驅(qū)動(dòng)的模型控制方法的研究中均采用單一的特征參數(shù)即加熱器-晶體直徑，未考慮其他特征參數(shù)的影響。在多特征參數(shù)方面，劉聰聰?shù)萚14]建立了基于混合變量加權(quán)堆棧自編碼隨機(jī)森林的軟測(cè)量模型并利用灰狼優(yōu)化算法對(duì)其進(jìn)行優(yōu)化，實(shí)現(xiàn)了晶體直徑控制及V/G值的實(shí)時(shí)在線監(jiān)控，其研究主要目的為控制硅單晶缺陷。高德東等[15]建立了基于數(shù)據(jù)驅(qū)動(dòng)的BP神經(jīng)網(wǎng)絡(luò)晶體直徑預(yù)測(cè)模型，并采用遺傳算法對(duì)其進(jìn)行優(yōu)化。上述研究未從機(jī)理方面考慮，未探究特征參數(shù)對(duì)等徑階段晶體直徑的時(shí)延影響。

由于直拉法硅單晶生長(zhǎng)過(guò)程中存在多種機(jī)理假設(shè)，多場(chǎng)耦合下邊界條件不明確和化學(xué)變化交錯(cuò)且相互影響等問題，導(dǎo)致機(jī)理建模困難[16]。基于數(shù)據(jù)驅(qū)動(dòng)的模型控制方法采用單一的特征參數(shù)或未考慮特征參數(shù)對(duì)等徑階段晶體直徑的時(shí)延影響。NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)是一種具有記憶功能、結(jié)構(gòu)簡(jiǎn)單和使用范圍廣的神經(jīng)網(wǎng)絡(luò)，在處理時(shí)間序列的建模和預(yù)測(cè)等各種非線性問題上效果良好[17-20]。因此，本文提出一種多輸入單輸出的NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)的等徑階段晶體直徑預(yù)測(cè)模型，為晶體直徑的控制提供了一種更準(zhǔn)確的辨識(shí)模型，同時(shí)為實(shí)現(xiàn)晶體高質(zhì)量、大尺寸生長(zhǎng)控制提供了一種有效的手段。

1 晶體直徑預(yù)測(cè)模型的工作流程

基于神經(jīng)元的晶體直徑預(yù)測(cè)模型如圖1所示，具體分為數(shù)據(jù)準(zhǔn)備、神經(jīng)網(wǎng)絡(luò)訓(xùn)練和神經(jīng)網(wǎng)絡(luò)計(jì)算三部分。在數(shù)據(jù)準(zhǔn)備部分，對(duì)單晶爐拉晶車間晶體直徑生長(zhǎng)數(shù)據(jù)中的關(guān)鍵特征參數(shù)通過(guò)最大信息系數(shù)(maximal information coefficient, MIC)算法進(jìn)行分析，確定對(duì)等徑階段影響最大的特征參數(shù)，并將選取的數(shù)據(jù)分為訓(xùn)練數(shù)據(jù)和驗(yàn)證數(shù)據(jù)兩部分，分別用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練和神經(jīng)網(wǎng)絡(luò)的可靠性驗(yàn)證。在神經(jīng)網(wǎng)絡(luò)訓(xùn)練部分，首先構(gòu)建合適的神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)，并對(duì)其進(jìn)行初始化。然后，導(dǎo)入訓(xùn)練數(shù)據(jù)進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練，通過(guò)訓(xùn)練調(diào)整神經(jīng)網(wǎng)絡(luò)各層間的權(quán)值，得到精度滿足要求的神經(jīng)網(wǎng)絡(luò)，并通過(guò)驗(yàn)證數(shù)據(jù)對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行驗(yàn)證。最后將得到的神經(jīng)網(wǎng)絡(luò)用于后續(xù)計(jì)算。

圖1 基于神經(jīng)元的晶體直徑預(yù)測(cè)模型Fig.1 Crystal diameter prediction model based on neuron

2 特征參數(shù)識(shí)別與處理

2.1 基于 MIC 的參數(shù)相關(guān)性分析

直拉硅單晶等徑階段特征參數(shù)與晶體直徑的相關(guān)性分析屬于特征降維，應(yīng)采用過(guò)濾式特征選擇的方法。該方法中的MIC是基于互信息理論提出的一種特征選擇算法，具有普適性和均衡性的特點(diǎn)，能夠有效度量?jī)勺兞康木€性或非線性關(guān)系，以及不同類型數(shù)據(jù)間的相關(guān)性[21-22]。因此，本文通過(guò)MIC分析特征參數(shù)與晶體直徑的相關(guān)性。兩隨機(jī)變量的 MIC 表達(dá)式為：

(1)

式中：Ω(nx,ny)表示大小為nx×ny的二維網(wǎng)格集合；B(n)=nα為最大網(wǎng)格數(shù)，n為數(shù)據(jù)樣本個(gè)數(shù)，α為常數(shù)，α∈(0,1)，其具體取值可根據(jù)經(jīng)驗(yàn)或數(shù)據(jù)規(guī)格設(shè)置。

MIC算法的核心思想是在兩個(gè)變量散點(diǎn)圖的基礎(chǔ)上，將散點(diǎn)圖上的觀測(cè)點(diǎn)利用劃分網(wǎng)格柵G的方法分割成nx×ny

加熱功耗和主泵功耗二者散點(diǎn)圖如圖2所示，圖2(a)為加熱功耗-晶體直徑散點(diǎn)圖，圖2(b)為主泵功耗-晶體直徑散點(diǎn)圖，二者散點(diǎn)圖基本相同，計(jì)算加熱功耗和主泵功耗的MIC為0.998 8，二者具有極強(qiáng)的線性關(guān)系，可認(rèn)為加熱功耗和主泵功耗相互冗余。去除冗余參數(shù)主泵功耗和拉晶過(guò)程數(shù)值恒定的特征參數(shù)晶轉(zhuǎn)速度和紅外液溫，對(duì)剩余16個(gè)特征參數(shù)按照MIC值從高到低排列，按照順序逐漸增加模型輸入特征參數(shù)數(shù)量并試算，結(jié)果如圖3所示。隨著模型輸入特征參數(shù)數(shù)量的增加，模型運(yùn)算速度降低。當(dāng)模型輸入特征參數(shù)數(shù)量小于7時(shí)，隨著數(shù)量的增加預(yù)測(cè)值與測(cè)試值之間的均方根誤差(root-mean-square error, RMSE) 逐漸減小；當(dāng)模型輸入特征參數(shù)數(shù)量大于7時(shí)，隨著數(shù)量的增加預(yù)測(cè)值與測(cè)試值之間的RMSE逐漸增大；當(dāng)模型輸入特征參數(shù)數(shù)量為7時(shí)，預(yù)測(cè)值與測(cè)試值之間的RMSE最小。考慮模型訓(xùn)練速度和精度，選取與晶體直徑相關(guān)性較高的7個(gè)特征參數(shù)(加熱功耗、球閥開度、主室爐壓、副室爐壓、主加熱功率、整棒拉速、爐壁測(cè)溫)作為模型輸入。優(yōu)化調(diào)節(jié)這7個(gè)特征參數(shù)將最大程度調(diào)節(jié)直拉硅單晶等徑階段晶體直徑。

圖2 MIC散點(diǎn)圖。(a)加熱功耗-晶體直徑散點(diǎn)圖；(b)主泵功耗-晶體直徑散點(diǎn)圖Fig.2 MIC scatter plots. (a) Heating power consumption-crystal diameter scatter plot; (b) main pump power consumption-crystal diameter scatter plot

圖3 不同數(shù)量模型輸入和均方根誤差的關(guān)系Fig.3 Relationship between different number of model inputs and root mean square error

2.2 數(shù)據(jù)標(biāo)準(zhǔn)化

在多指標(biāo)評(píng)價(jià)體系中，由于各種評(píng)價(jià)指標(biāo)的尺度和尺度單位都不盡相同，在不同指標(biāo)之間存在巨大差異，若不對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化(歸一化)處理，指標(biāo)的數(shù)值高低將會(huì)影響分析結(jié)果，導(dǎo)致后續(xù)訓(xùn)練精度不佳。因此，為了消除指標(biāo)之間的量綱影響，提高數(shù)據(jù)可靠性和訓(xùn)練精度，在使用數(shù)據(jù)前對(duì)其進(jìn)行標(biāo)準(zhǔn)化處理。將所選用7個(gè)模型輸入特征參數(shù)和1個(gè)模型輸出特征參數(shù)進(jìn)行min-max標(biāo)準(zhǔn)化(min-max normalization)處理，對(duì)原始數(shù)據(jù)的線性變換使結(jié)果值映射到[0，1]。轉(zhuǎn)換函數(shù)如下：

(2)

式中：xmax為樣本數(shù)據(jù)的最大值；xmin為樣本數(shù)據(jù)的最小值；x*為數(shù)據(jù)標(biāo)準(zhǔn)化后參數(shù)。本文采用標(biāo)準(zhǔn)化之后的特征參數(shù)組成的7元組Xi(i=1，2，3，…，6，7)作為模型輸入，晶體直徑Y(jié)作為模型輸出，如表2所示。

表2 模型輸入輸出特征參數(shù)Table 2 Inputs and outputs characteristic parameters of model

3 晶體直徑預(yù)測(cè)模型建立

NARX模型是基于線性ARX模型發(fā)展而來(lái)，常用于時(shí)間序列建模。NARX 動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)由輸入層、隱含層和輸出層三部分組成，其結(jié)構(gòu)如圖4所示。

圖4 NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型Fig.4 Structure model of NARX dynamic neural network

NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)的輸入分為外部輸入和反饋輸入兩部分，兩部分均含有時(shí)間延遲結(jié)構(gòu)。這表明NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)的輸出不僅由當(dāng)前的外部輸入所決定，還受外部輸入時(shí)間延遲和反饋輸出時(shí)間延遲的影響。該結(jié)構(gòu)能夠提高神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)性能和對(duì)歷史數(shù)據(jù)的敏感度，可以更好地捕捉到系統(tǒng)的動(dòng)態(tài)特性。NARX模型的定義方程是：

y(t)=f[u(t-1),u(t-2),…,u(t-nu),y(t-1),
y(t-2),…,y(t-ny)]+e(t)

(3)

(4)

(5)

式中：u(t)表示為在t時(shí)刻的輸入時(shí)序數(shù)據(jù)；y(t)表示為在t時(shí)刻的輸出時(shí)序數(shù)據(jù)；nu表示輸入的時(shí)延階數(shù)；ny表示輸出的時(shí)延階數(shù)；e(t)表示模型誤差；Hk(t)表示第k個(gè)隱含層神經(jīng)元輸出層的輸出；ωik表示連接第i個(gè)外生輸入和第k個(gè)隱含層的神經(jīng)元；ωjk表示第j個(gè)反饋輸入和第k個(gè)隱含層神經(jīng)元；ωok表示隱含層和輸出層的權(quán)值；bk、bo表示偏置；f(·)表示非線性激活函數(shù)；g(·)為線性激活函數(shù)。

神經(jīng)網(wǎng)絡(luò)中的隱含層不直接同輸入輸出連接，它通過(guò)處理輸入數(shù)據(jù)的特征來(lái)更好地進(jìn)行數(shù)據(jù)處理和劃分，因此隱含層數(shù)很大程度影響神經(jīng)網(wǎng)絡(luò)對(duì)數(shù)據(jù)的處理能力。隱含層數(shù)為1層時(shí)，神經(jīng)網(wǎng)絡(luò)可以逼近任意連續(xù)函數(shù)。綜合考慮模型精度及復(fù)雜程度，選取隱含層數(shù)為1。隱含層中神經(jīng)元數(shù)也稱為節(jié)點(diǎn)數(shù)，通常由經(jīng)驗(yàn)法或反復(fù)實(shí)驗(yàn)法選取，如神經(jīng)元數(shù)目過(guò)少會(huì)無(wú)法匹配數(shù)據(jù)全部特征，出現(xiàn)欠擬合的情況，影響訓(xùn)練精度。如神經(jīng)元數(shù)目過(guò)多，訓(xùn)練過(guò)程將會(huì)增加，甚至?xí)霈F(xiàn)過(guò)擬合的情況，同樣影響訓(xùn)練精度。通過(guò)試算，當(dāng)隱含層中神經(jīng)元數(shù)為10時(shí)，預(yù)測(cè)值與測(cè)試值之間的RSME最小。因此，隱含層神經(jīng)元數(shù)為10。加熱功耗與晶體直徑的MIC為0.529 4，對(duì)直拉硅單晶等徑階段直徑影響最大。由硅晶體生長(zhǎng)理論可知，實(shí)際拉晶生產(chǎn)中加熱功耗對(duì)晶體直徑影響很慢，經(jīng)驗(yàn)滯后時(shí)間約為8 min[13]。根據(jù)模型時(shí)延參數(shù)計(jì)算：

(6)

在晶體直徑測(cè)量數(shù)據(jù)中采樣時(shí)間Δt=60 s，經(jīng)驗(yàn)滯后時(shí)間t=8 min，計(jì)算晶體直徑時(shí)延參數(shù)d=8。因此，輸入時(shí)延階數(shù)和輸出時(shí)延階數(shù)均取8。

NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法會(huì)極大地影響到它的預(yù)測(cè)性能，常見的訓(xùn)練算法指標(biāo)對(duì)比如表3所示。Bayesian Regularization算法需要更大的內(nèi)存和更多的收斂時(shí)間，但對(duì)于困難或嘈雜等特殊的數(shù)據(jù)集，具有良好的泛化效果。Scaled Conjugate Gradient算法需要較少的內(nèi)存，適用于求解線性方程組和無(wú)約束優(yōu)化問題。LM(Levenberg-Marquardt)算法需要內(nèi)存較多，收斂時(shí)間較短，該算法將最速下降法與高斯-牛頓法相結(jié)合，根據(jù)離最優(yōu)解的距離選用不同的算法，既可以克服最速下降法離最優(yōu)解的距離較近時(shí)收斂速度慢的問題，又可以克服 Hessian矩陣無(wú)法迭代不滿秩的問題。考慮收斂速度和訓(xùn)練精度，本文選取LM算法作為訓(xùn)練算法。綜上所述，NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)的模型參數(shù)為隱含層數(shù)為1，隱含層神經(jīng)元數(shù)為10，輸入時(shí)延階數(shù)和輸出時(shí)延階數(shù)為8，訓(xùn)練算法為L(zhǎng)M算法。

表3 常見的訓(xùn)練算法指標(biāo)Table 3 Common training algorithm indicators

4 晶體直徑預(yù)測(cè)

4.1 NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)晶體直徑預(yù)測(cè)

采用來(lái)源于拉晶車間提供的三臺(tái)單晶爐等徑階段8輪生產(chǎn)數(shù)據(jù)，將預(yù)處理后的完整數(shù)據(jù)80%劃分為訓(xùn)練集(train set)、10%劃分為驗(yàn)證集(validation set)、10%劃為測(cè)試集(test set)，用于模型的訓(xùn)練、篩選和評(píng)估。訓(xùn)練后NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)測(cè)試集的誤差直方圖如圖5所示，圖5中橫坐標(biāo)誤差為標(biāo)準(zhǔn)化后晶體直徑相對(duì)誤差，其誤差值為標(biāo)準(zhǔn)化后晶體直徑真實(shí)值與預(yù)測(cè)值差值 (Post-standardization error=Post-standardization target-Post-standardization prediction)，縱坐標(biāo)為測(cè)試集的數(shù)量。圖5(a)所示的No.1單晶爐測(cè)試集誤差分布集中在0誤差線附近，處于-0.03～-0.01之間的誤差的數(shù)量最多。隨著距離0誤差線距離增大，存在誤差的數(shù)量逐漸減小，所有誤差處于-0.10～0.07之間。圖5(b)所示的No.2單晶爐測(cè)試集誤差分布集中在0誤差線附近，處于0～0.01之間的誤差的數(shù)量最多，較其他區(qū)間誤差數(shù)量比較突出。隨著距離0誤差線距離增大，存在誤差的數(shù)量逐漸減小，所有誤差處于-0.05～0.06之間。圖5(c)所示的No.3單晶爐測(cè)試集誤差大部分集中于-0.03～0.04之間。隨著距離0誤差線距離增大，存在誤差的數(shù)量逐漸減小，所有誤差處于-0.08～0.07之間。由圖5所知，三臺(tái)單晶爐誤差數(shù)值和誤差分布均較為理想，滿足預(yù)測(cè)要求。

圖5 NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)誤差直方圖。(a)No.1單晶爐；(b)No.2單晶爐；(c)No.3單晶爐Fig.5 Error histogram of NARX dynamic neural network. (a) No.1 single crystal furnace; (b) No.2 single crystal furnace; (c) No.3 single crystal furnace

通過(guò)縮小訓(xùn)練數(shù)據(jù)可驗(yàn)證NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)的有效性[23]。針對(duì)No.3單晶爐，縮小訓(xùn)練數(shù)據(jù)，采用5輪單晶爐等徑階段生產(chǎn)數(shù)據(jù)，其余NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)模型設(shè)定不變，訓(xùn)練結(jié)果如圖6所示。5輪數(shù)據(jù)的No.3單晶爐測(cè)試集誤差大部分集中于-0.04～0.04，有相當(dāng)一部分?jǐn)?shù)據(jù)誤差處于-0.14～-0.05，其所有誤差處于-0.14～0.07，同圖5(c)相比預(yù)測(cè)誤差明顯增大。在縮小訓(xùn)練數(shù)據(jù)的情況下，可以獲得較好的直徑預(yù)測(cè)結(jié)果，驗(yàn)證了NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)的有效性。然而，隨著訓(xùn)練數(shù)據(jù)的減少，預(yù)測(cè)誤差逐漸增大。

圖6 No.3單晶爐誤差直方圖(5輪)Fig.6 Error histogram of No.3 single crystal furnace (5 rounds)

4.2 NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)優(yōu)越性驗(yàn)證

BP神經(jīng)網(wǎng)絡(luò)，也稱為反向傳播神經(jīng)網(wǎng)絡(luò)，是一種靜態(tài)前饋神經(jīng)網(wǎng)絡(luò)，具有結(jié)構(gòu)簡(jiǎn)單，應(yīng)用廣泛，非線性映射能力強(qiáng)與泛化能力強(qiáng)等優(yōu)點(diǎn)[24]。在實(shí)際生產(chǎn)中，每臺(tái)單晶爐因組裝和生產(chǎn)工藝優(yōu)化調(diào)整等原因存在差異，在生產(chǎn)前需對(duì)每臺(tái)單晶爐參數(shù)進(jìn)行調(diào)整，導(dǎo)致加熱特性不同。因此，采用上述相同數(shù)據(jù)集，基于BP神經(jīng)網(wǎng)絡(luò)建立等徑階段晶體直徑預(yù)測(cè)模型，并對(duì)No.1、No.2、No.3單晶爐分別進(jìn)行訓(xùn)練。將NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果進(jìn)行對(duì)比分析，兩種神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)值與真實(shí)值對(duì)比圖如圖7所示，預(yù)測(cè)結(jié)果如表4所示。

圖7 預(yù)測(cè)值與真實(shí)值對(duì)比圖。(a)No.1單晶爐；(b)No.2單晶爐；(c)No.3單晶爐Fig.7 Comparison of predicted and real values. (a) No.1 single crystal furnace; (b) No.2 single crystal furnace; (c) No.3 single crystal furnace

表4 兩種神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型性能Table 4 Performance of two neural network prediction models

圖7(a)所示的No.1單晶爐中NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)可以較精確地預(yù)測(cè)等徑階段晶體直徑，其預(yù)測(cè)均方誤差MSE 為0.000 797 72，相關(guān)系數(shù)R為96.744%。BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)直徑波動(dòng)范圍小，不能實(shí)時(shí)反映晶體直徑的無(wú)規(guī)則變化，只能大致反映晶體直徑變化趨勢(shì)，其預(yù)測(cè)均方誤差MSE為0.006 498，相關(guān)系數(shù)R為75.428%，可見在No.1單晶爐中，NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度明顯優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。圖7(b)所示的No.2單晶爐中，NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)可以較精確地預(yù)測(cè)等徑階段晶體直徑，其預(yù)測(cè)均方誤差MSE為0.000 948 81，相關(guān)系數(shù)R為98.907%。BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)直徑波動(dòng)范圍小，同直徑真實(shí)值差距較大，預(yù)測(cè)值變化趨勢(shì)明顯滯后于真實(shí)值，其預(yù)測(cè)均方誤差MSE 為0.004 389，相關(guān)系數(shù)R為89.129%，可見在No.2單晶爐中，NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度明顯優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。圖7(c)所示的No.3單晶爐中NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)可以精確地預(yù)測(cè)等徑階段晶體直徑，其預(yù)測(cè)均方誤差MSE 為0.000 575 47，相關(guān)系數(shù)R為99.594%。BP神經(jīng)網(wǎng)絡(luò)在前期直徑波動(dòng)較小時(shí)預(yù)測(cè)誤差較小，當(dāng)晶體直徑波動(dòng)較大時(shí)，預(yù)測(cè)值明顯偏離于真實(shí)值，誤差較大，其預(yù)測(cè)均方誤差MSE 為0.006 487 9，相關(guān)系數(shù)R為96.254%，可見在No.3單晶爐中，NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度明顯優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。

在3臺(tái)單晶爐中，BP神經(jīng)網(wǎng)絡(luò)的均方誤差MSE平均值為0.005 792，相關(guān)系數(shù)R平均值為86.937%， NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)均方誤差MSE平均值為0.000 774，相關(guān)系數(shù)R平均值為98.415%。以平均均方誤差MSE作為評(píng)估標(biāo)準(zhǔn)，NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)較BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)精度提高了86.64%。以平均相關(guān)系數(shù)R作為評(píng)估標(biāo)準(zhǔn)，NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)較BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)精度提高了13.20%。

根據(jù)No.1、2、3三臺(tái)單晶爐的拉晶車間生產(chǎn)數(shù)據(jù)，基于NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)建立等徑階段晶體直徑預(yù)測(cè)模型，其預(yù)測(cè)晶體直徑誤差數(shù)值和誤差分布均較為理想。當(dāng)縮小訓(xùn)練數(shù)據(jù)的情況下，該模型仍獲得較好的直徑預(yù)測(cè)結(jié)果。將建立的NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)同BP神經(jīng)網(wǎng)絡(luò)進(jìn)行對(duì)比，三臺(tái)單晶爐的NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)精度均明顯優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。上述結(jié)果表明， NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)為晶體直徑的控制提供了一種更準(zhǔn)確的辨識(shí)模型。

5 結(jié) 論

本文針對(duì)直拉法在制備硅單晶的過(guò)程中存在多種機(jī)理假設(shè)、多場(chǎng)耦合下邊界條件不明確和化學(xué)變化交錯(cuò)且相互影響等問題，探究了與晶體直徑的相關(guān)的特征參數(shù)，建立了一種多輸入單輸出的NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)等徑階段晶體直徑預(yù)測(cè)模型，并分析驗(yàn)證了該模型預(yù)測(cè)效果，結(jié)論如下：

(1)通過(guò)MIC算法分析特征參數(shù)與晶體直徑的相關(guān)性，得到加熱功耗、球閥開度、主室爐壓、副室爐壓、主加熱功率、整棒拉速以及爐壁測(cè)溫7個(gè)與晶體直徑的相關(guān)性最高的特征參數(shù)。

(2)所建立NARX 動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)等徑階段晶體直徑預(yù)測(cè)模型對(duì)晶體直徑預(yù)測(cè)的均方誤差MSE平均值為0. 000 774。

(3)通過(guò)NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)進(jìn)行對(duì)比分析，在以平均均方誤差MSE作為評(píng)估標(biāo)準(zhǔn)下，所用神經(jīng)網(wǎng)絡(luò)較BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)精度提高了86.64%，驗(yàn)證了NARX動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)的優(yōu)越性。