褚菲,彭闖,賈潤達,陳韜,陸寧云
(1 地下空間智能控制教育部工程研究中心,江蘇徐州221116; 2 中國礦業大學信息與控制工程學院,江蘇徐州221116;3東北大學信息科學與工程學院,遼寧沈陽110819; 4 薩里大學化學與工藝工程系,英國吉爾福德;5 南京航空航天大學自動化學院,江蘇南京210016)
隨著經濟的迅猛發展以及國際產品市場的競爭日趨激烈,產品質量的標準與要求也變得越來越高[1-5]。特別是在間歇生產過程中,產品質量的穩定不僅直接關乎企業的經濟效益,而且也是實現間歇過程生產優化的前提[6-9]。精確的質量預測則是確保間歇過程安全運行、獲得高質量產品的必要條件,隨著數據技術的迅速發展,數據驅動方法[10-16]因其建模速度快、模型精度高、成本效益好等優點正成為過程建模的主流,被廣泛地應用于間歇過程的產品質量預測[17-18]。數據驅動建模的前提是要擁有充足的過程數據,這是實現精準預測的必要條件[5]。在實際間歇生產過程中,不同的產品規格應采用特定的操作條件甚至設備進行生產,操作狀態需要頻繁更新,數據驅動模型的性能會降低,此時則需要重新構建新過程。但是,新過程由于運行時間相對較短而無法獲得豐富的過程數據,難以建立準確可靠的數據驅動模型[19-20]。
大數據時代的背景下,在現代間歇工業過程中有很多使用相同或相似的工藝原理生產相同或相似規格產品的相似過程[20],這些過程中存在著大量相似的歷史數據沒有得到充分利用,造成了資源的浪費。針對上述問題,一些學者提出了遷移學習的概念,遷移學習方法因其可以利用相似源域的知識來幫助完成目標域的學習任務而越來越受到重視[21-23]。Shen 等[24]為了克服收集長期循環數據的成本高昂這一困難,針對訓練數據集數據少的問題,通過融合轉移學習和集成學習,提出了一種基于深度學習模型 DCNN-ETL(deep convolutional neural networks with ensemble learning and transfer learning)的容量估計方法,使得復雜神經網絡的訓練過程在目標任務中使用相對較小的訓練數據集即可進行收斂。Shao等[25]開發了一個用于機械故障診斷和分類的深度遷移學習框架,通過使用遷移學習來加速深度神經網絡CNN(convolutional neural networks)的訓練,結果證明遷移學習能夠明顯提高深度模型的性能。Liu 等[26]利用遷移學習開發了一種領域自適應極限學習機DAELM (adaptive extreme learning machine),通過利用不同工況下的有用信息,并將其遷移到現有的軟測量系統中,有效提高了模型的預測范圍和預測精度。數據遷移作為遷移學習技術的一種形式,能夠充分利用舊過程的數據和模型,并將有用的數據信息遷移到新過程中以輔助其建模和控制。Jaeckle等[27]提出了一種用于數據遷移的EPCR(extended principal component regression)方法,該方法通過結合兩個相似過程的輸出數據矩陣來建立PCR(principal component regression)模型,利用相似生產過程已有的數據信息進行有效預測。但是,此方法在遷移時沒有合理利用相似過程的輸入數據, 而這些輸入數據中也很可能存在許多可以輔助新過程建模的有效信息。針對這個方法存在的不足,García 等[28]隨后提出了JYPLS (Joint-Y partial least squares)方法,首先在同一空間建立相似過程的聯合質量指標,然后利用所有相似過程的數據進行建模,而且JYPLS 模型只要求相似過程具有相同的質量指標構成,對于輸入變量矩陣沒有任何限制。
此外,針對JYPLS 方法不適用于非線性較強的間歇過程,Chu 等[5]在該模型上引入核函數,提出了一種改進的過程遷移的JYKPLS (Joint-Y kernel partial least squares)方法,成功地應用于非線性新間歇過程的產品質量預測,大大提高了建模效率和產品質量的預測精度。然而,在實際應用中進一步發現,雖然JYKPLS 方法可以描述過程數據的非線性關系,但是針對具有多尺度非線性特性的間歇過程,JYKPLS 方法的應用效果并不理想,存在局部擬合精度不高,模型參數匹配困難等問題[29-33],特別是當通過遷移學習利用相似舊過程的數據進行建模時,由于相似過程之間必然存在差異,使得包含兩個相似過程的建模數據集在多尺度方面的問題更加嚴重,嚴重影響產品質量預測精度的進一步提高。
本文針對過程數據不足,且具有強非線性和多尺度特性的間歇過程,將遷移學習方法與多尺度核學習方法相結合,提出了一種基于多尺度核JYMKPLS(Joint-Y multi-scale kernel partial least squares)遷移學習模型的間歇過程產品質量在線預測方法。本文通過遷移學習在解決新間歇過程數據不足難以精準建模的基礎上,旨在解決間歇過程數據具有多尺度特性且在過程遷移建模時由于過程數據之間的差異性表現得尤為突出的問題。由于單個尺度的核函數難以對所有樣本進行高效的映射,本文在遷移學習的基礎上引入了多尺度核函數的方法,通過改變核的尺度的大小更好地擬合數據變化劇烈和變化平緩的趨勢,充分地反映了數據樣本的分布特性,改善了新模型的泛化性,從而實現對產品質量的精準預測。
核學習方法以非線性特征提取的方式,能夠將自變量通過非線性的方式映射到高維空間,并在其中利用線性運算進行特征提取[29-34]。核函數有很多種類型,每一種核函數都有不同特性的映射效果,針對具體的樣本空間來選擇不同類型的核函數一般能夠獲得較為滿意的非線性映射。然而,由于噪聲的存在以及工業過程日趨復雜多變,使得過程樣本數據分布更加不規則、不平坦。在這種情況下,單一核函數的方法具有很大的局限性,過程的所有數據樣本難以用一個特定的核函數對整體進行有效的映射[35]。
近年來有學者提出了多核學習的方法,而多尺度核方法作為其中的一種[29],通過設置不同的核參數大小來構造多個尺度大小的核函數,能夠對過程不同的局部特征分別進行高效的映射。這種方法具有非常多的尺度選擇性,因此具有很強的靈活性。高斯核函數作為常用核函數的一種,不僅能夠多尺度化,而且具有普遍的無限逼近能力,具體形式如下所示:

其中,σ表示核函數的尺度參數,本文將其多尺度化后如下所示:

其中,σ1<σ2<…<σn,當σ 較小時,對變化劇烈的數據樣本具有更好的映射效果;當σ較大時,對變化平緩的數據樣本具有更好的映射效果。由此可構造出新的多尺度核函數如下所示,其中多個尺度采用直接加權的形式:

其中,k 代表所選核函數的尺度的數量,各個尺度核函數的寬度參數用σi(i = 1,2,…,k)來表示。基于高斯徑向基核函數的多尺度核的學習方法主要是通過調整各個尺度核函數中的核參數,更好地擬合不均勻數據的變化特征,以達到最優解。
考慮到在現代工業生產中,使用相同或相似的工藝原則生產相同或相似規格的獨立生產過程是普遍存在的。也就是說,對于一個新的目標工藝過程,雖然它與舊工藝過程有著不同的設備、原材料和操作條件,但是過程之間各變量的相關關系往往是相接近的,它們共享著相似的內在機理,且它們的過程數據的協方差結構具有相似性,從這個意義上說,這兩個過程具有一定的相似性。近年來,遷移學習方法因其可以利用相似源域的知識來幫助完成目標域的學習任務而越來越受到重視[21-23]。考慮到新過程剛投入運行,過程數據不足以建立較為精準的數據驅動模型,而舊過程已經投入運行了很久,擁有充足的過程數據但尚未被利用,造成了數據資源的閑置與浪費。因此,如果能夠通過遷移學習的方法將實際工業過程中可用的相似過程的數據進行整合和利用,依靠這些閑置的數據信息來促進新過程的快速高效建模,不僅能夠提高產品質量的預測精度,而且還能提高企業和社會的經濟效益。如圖1所示,在本文中,假定有兩個相似間歇過程:新 過 程B 和 舊 過 程A,XA,XB∈RI×J×K和YA,YB∈RI×J分別為兩個過程的輸入變量矩陣和質量指標輸出矩陣,J 是過程變量數,K 是采樣時間,I是生產的批次數量。

圖1 兩個相似過程數據Fig.1 Two similar process datasets
JYPLS 方法屬于線性建模范疇,難以對非線性系統固有的特性進行準確高效的描述。為此,文獻[5]中提出了一種新的JYKPLS 算法,通過在JYPLS算法中引入核學習方法建立新過程的遷移學習模型,能夠較好地描述新舊間歇過程的非線性特性,提高模型的預測精度。該方法雖然可以在一定程度上解決非線性問題,但是考慮到工業過程中存在數據分布不均勻的特性,單個尺度的核函數往往難以準確擬合所有樣本數據的變化趨勢。為此,本文將多尺度核函數技術應用到JYPLS 算法,提出了一種新的基于多尺度核的JYMKPLS算法,通過改變核函數的尺度的大小能夠更好地擬合數據變化劇烈和變化平緩的趨勢,可以更好地解決復雜的非線性分析問題,從而進一步提高質量預測的精度,JYMKPLS的模型結構如圖2所示。


用原始空間中定義的核函數來替代內積運算,則可構成如下形式的核矩陣:

圖2 JYMKPLS模型結構Fig.2 The structure of JYMKPLS model

本文選用了高斯核進行多尺度化,并采用下式進行核矩陣元素的計算:

其中,多個尺度高斯核函數的寬度參數分別用σl(l = 1,2,…,m)表示。尺度個數m與核函數模型的復雜度直接相關,m越多,則構造的多尺度核函數模型越復雜,學習訓練的時間也越長,尺度個數m 過多或過少都不利于使模型獲得良好的泛化性。由于某一寬度的高斯核函數可以將某一特定分布的樣本有效地向高維特征空間映射,因此輸入空間中訓練樣本的特征分布的數量可以看作尺度個數的最優選擇。目前常用的方法有模糊聚類分析方法,其可以通過劃分原始空間的樣本來確定相對最優的尺度個數。此外,核函數的合成系數以及核參數的大小的尋優方法越復雜,模型復雜度越高,學習訓練的時間也越長。針對一些具體問題,對核參數的選取,合成系數的設定,目前還沒有形成一個合理統一的模式[29]。本文在突出多尺度核優勢的前提下,為了降低模型復雜度和學習時間,暫且采用直接求和的方式來構造核模型的合成系數[31]。同時,為保證模型精度,利用訓練樣本建立JYMKPLS回歸模型,利用優化算法對核寬度參數σl進行尋優,計算擬合誤差作為評價指標,選取最優精度模型所對應的參數作為最優結果。在此算法中,由于只計算原始低位空間的核函數就可以得到高維空間的核函數矩陣KA和KB,因此沒有必要知道非線性映射函數的顯式表達式Φ(?)。在執行JYMKPLS 算法之前,通常需要對這兩個核矩陣進行中心化處理,公式如下:

其中,1I是I×I維的矩陣,其元素都為1,I則表示I×I維度的單位矩陣。
如果從原始空間到高維空間的映射Φ:xi∈RN→Φ(xi)∈H 已知,憑借樣本映射ΦA、ΦB和輸出樣本YA、YB則可以在高維空間中直接使用JYPLS 建模,那么就可以利用拉格朗日方法分析準則函數得到如下所示:

但是ΦA、ΦB通常都是未知的,wJ則不能通過式(8)直接計算得到,不過可以利用核函數來巧妙地避開該映射,將式(8)轉化成式(9)。

(4)計算YAi,YBi的得分向量uAi= YAiqJi,uBi=YBiqJi。
(5)對uAi和uBi進行收斂性判斷,若步驟(4)中的得分向量都具有收斂性,再根據式(13)進行核矩陣和輸出矩陣的縮減,否則返回到步驟(2)。

(6)然后令i=i+1,重復步驟(2)~步驟(6)提取主成分直到A 的主成分全部提取結束,主成分數量可以由交叉驗證確定。
給定某個間歇生產過程,假設它有J 個過程變量,在一個批次內有K 個采樣時間點,共收集I 個批次數,就構成了典型的間歇過程三維數據X(I × J ×K)。在進行過程傳遞模型的建立之前,本文采取圖3 所示的方法按批次方向將輸入矩陣XA,XB∈RI×J×K展 開 成XA,XB∈RI×KJ形 式,對 應 的輸出變量矩陣為YA,YB∈RI×J。

圖3 相似過程數據的批次展開Fig.3 Batch-unfolding of similar process data
將JYPLS 過程遷移模型與多尺度核方法相結合,不僅能夠解決新間歇過程因沒有充足的過程建模數據而影響建模效率的問題,而且同時考慮到數據具有多尺度特性的問題,通過改變核的尺度的大小來更好地擬合數據變化劇烈和變化平緩的趨勢,能夠充分地反映數據樣本的分布特性,可以進一步提高質量預測的精度。
JYMKPLS離線建模步驟如下:
(1)數據展開。采用批次展開的方式將新間歇過程B 和與其相似的舊間歇過程A 的矩陣XA,XB∈RI×J×K依次展開成XA,XB∈RI×KJ。
(2)數據預處理。將兩個過程的輸入矩陣XA,XB的每一列數據分別按照零均值和單位方差進行歸一化;同樣,對輸出矩陣YA,YB也進行標準化處理,將其聯合得到YJ=[YA; YB]。
(3)確定尺度個數m。對輸入樣本進行聚類,選擇分類個數作為相對最優的尺度個數m。
(4)確定核函數寬度參數σl(l = 1,2,…,m)。利用新舊過程的學習樣本建立JYMKPLS模型,計算擬合誤差作為評價指標,利用優化算法尋找最優核寬度參數σl(l = 1,2,…,m),使得擬合誤差最小,選取誤差最小模型所對應的核寬度參數作為最優結果。
(5)計算核矩陣。通過式(4)進行非線性映射,利用式(6)的多個尺度的核函數在高維空間中分別計算并得到核函數矩陣KA和KB。
(6)通過式(7)中心化核矩陣KA和KB。
(7)使用輸入核矩陣KA和KB以及聯合輸出矩陣YJ運行JYMKPLS算法。
(8)計算JYMKPLS模型的回歸系數:

其中,TJ=[TA; TB]是舊間歇過程A 和新間歇過程B 過程潛變量的聯合矩陣,是建立質量預測模型最為關鍵的變量。
(9)將預測樣本代入JYMKPLS 模型,得到回歸方程為:

其中,xnew是新過程B 的新采樣數據,xj代表第j批次的輸入訓練數據,knew是新的批次數據對應的核向量, e 是預測誤差,ynew為新采樣數據的預測結果。
本文基于JYMKPLS過程遷移模型,為間歇過程產品質量提供了在線預測方法的完整框架和算法流程,包括基于JYMKPLS 的預測模型的離線建立,在線模型更新和數據剔除,該方法的流程圖如圖4所示。

圖4 基于JYMKPLS過程遷移模型的批次過程質量預測及更新流程Fig.4 Batch process quality prediction and update process based on JYMKPLS process transfer model
得到離線質量模型之后,該模型可用于下一批次產品的質量預測。在新的批次運行時,由于該批次過程沒有完全結束,只能得到操作周期開始到當前時刻的不完整的輸入數據xformer。為了預測當前時刻下最終的產品質量,可以通過預估計[7]的方法對當前時刻之后的數據部分xafter進行填補,構成與預測值y?new相對應的輸入數據xnew=[xformer; xafter]。然后,通過核函數獲得核向量knew,將完整的輸入數據xnew和knew代入預測模型即可得到預測值y?new。

其中,xj代表第j 批次的輸入訓練數據,knew表示過程新產生的新批次的輸入數據所對應的核向量,e為預測誤差,y?new代表新過程新采集到的數據所對應的預測輸出值。
由于新過程建模數據的稀缺性,現有的新過程數據集也無法描述整個新過程的特征。因此,在每個批次結束時,需要不斷地利用新獲得的數據xnew和ynew補充到新過程的建模數據集XB和YB,進一步增加建模信息,從而有效提高預測模型的準確性。通過這兩個增廣矩陣可以離線更新預測模型,模型更新方法如式(17)所示:

在生產過程前期,由于新過程數據不足,舊過程的數據有助于新過程模型的建立,但是由于相似過程之間必然存在差異,舊過程的數據不可能包含新過程的所有過程信息,隨著新過程數據的補充和積累,建模數據集中舊過程的數據反而會影響模型精度的進一步提高。因此,需要在適當的時刻對舊過程數據進行逐步剔除,本文檢測了連續m 個批次的最終質量偏差,通過設置穩定性閾值εstable來判斷誤差是否收斂至穩定階段從而決定是否進行數據剔除(εstable的值是趨近于0 的預設常數)。數據剔除的原則是對舊過程數據集中偏差較大的數據優先處理,具體方法和步驟如下。
(2)收集所有最新批次的最終質量的預測偏差,判斷連續采樣批次中Δj偏差小于閾值εstable的批次數是否大于等于n 個,如果是,則轉到步驟(3)進行數據選擇和剔除,否則返回到步驟(1)。
(3)計算新舊過程數據之間的相似度,從舊過程數據集中選取與新過程數據偏差最大的舊數據進行剔除,計算相似度的公式如式(18)所示:

其中,‖ ? ‖2是歐幾里得度量,XˉB是新過程數據的平均值,d(xAj,XB)表示過程數據之間的歐氏距離,相似度用S(xAj)表示,其范圍是0~1。
青霉素生產過程是一種典型的間歇工業過程,其主要通過微生物發酵的途徑進行生產,過程本身具有非線性的特性。而青霉素的終點濃度是衡量生產效益的最重要的指標,因此,對其進行質量預測十分重要。本文通過Pensim2.0 仿真軟件按照設定生成的數據來驗證本文算法,過程反應周期和采樣間隔分別設定為400 h 和0.5 h。然后,選取了通風率等六個輸入變量和青霉素濃度這一個輸出變量建立預測模型對青霉素濃度進行質量預測。本文采用仿真軟件按照表1設置的工作條件分別生成40 個批次的數據作為舊過程A 已有的大量過程數據,生成55 個批次的數據作為新過程B 產生的過程數據,其中5 個作為剛投入運行的新過程B 已有的過程數據,剩余50個批次的數據用作數據更新和數據測試。同時,為了增加實驗實際應用的可信度,將2%的測量噪聲分別加到過程的輸入變量和輸出質量指標上。提取舊過程A中40個批次數據中的6個輸入變量和最終質量,形成舊過程數據集矩陣XA(40 × 6 × 800)和YA(40 × 1),同樣,可以得到新過程數據集矩陣XB(55× 6 × 800)和YB(55× 1)。

表1 過程A和B的工作條件Table 1 Working conditions for batch processes A and B

圖5 基于KPLS和MKPLS的青霉素最終濃度預測結果Fig.5 The prediction result of the final concentration of penicillin in each batch based on KPLS and MKPLS
為了更清晰地表明新過程B由于數據稀缺導致數據驅動建模精度低下的問題,更好地突出多尺度核學習方法在質量預測中的優勢,本節只用到新過程B 的數據,將MKPLS 模型與傳統的KPLS 模型進行了比較,測試了這兩種方法的預測效果。
首先為了充分地驗證兩個模型在整個工況范圍內的最終質量預測能力,保持建模數據集不變,并且不進行模型的在線更新和舊數據的剔除,實驗將新過程B 的50 個批次的數據分為5 個批次的建模數據集和45 個批次的測試數據集,構建最終質量預測模型。利用兩種方法對測試數據集的最終質量進行了預測,評價指標為預測值的均方根誤差RMSE 和平均相對預測誤差MPRE。由圖5 和表2 可得實驗結果如下,新過程在剛投入生產的前期階段,擁有很少的建模數據,在不進行模型更新的前提下基于這兩種數據驅動建模方法的預測精度都不理想,但是MKPLS 建模方法的預測效果要略優于KPLS 建模方法的預測效果,這表明即使在少量數據的情況下,相比于單尺度核方法,多尺度核方法能夠較好地抓取數據特征,具有更高的精度。
兩種方法的均方根誤差和平均相對預測誤差值如表2所示。
考慮模型更新的情況,本實驗將新過程B 的55個批次的數據分為5 個批次的建模數據集,45 個批次的更新數據集,5 個批次的測試數據集三個部分,測試數據集中5 個批次最終濃度預測值的RMSE 是量化預測性能的評價指標。利用建模數據集構建初始的最終質量預測模型,每次對測試數據集中的所有測試樣本進行預測后,計算預測結果的RMSE,然后向訓練數據集中添加一批更新數據集以重建質量預測模型,再次對測試集的最終濃度進行預測,直到更新數據集中的所有數據都放入建模數據集中。兩種方法測試數據集的RMSE 如圖6 所示,隨著新批次數據的不斷產生,建模數據不斷增多,兩種預測方法的精度隨著模型更新都在不斷提高,在第25批次之后,達到了較為穩定的精度。對比兩種預測方法的均方根誤差,可以看出在進行該生產過程的質量預測時,基于MKPLS的建模方法的預測效果明顯優于基于KPLS 的建模方法,而且隨著建模數據越來越多,基于MKPLS的建模方法的預測效果的優勢會更加明顯。
1.3 技術培訓與質量控制 本研究的6名測查人員均經過北京婦幼保健院的Gesell神經心理發育測查的技能培訓并取得證書,臨床測查經驗豐富。實驗前6名測查員測查結果一致性檢驗合格。

表2 兩種預測方法的評價指標對比Table 2 The evaluation index comparison of two prediction methods

圖6 帶有模型更新的KPLS模型和MKPLS模型的RMSEFig.6 RMSE of KPLS model and MKPLS model with model updates
考慮到新過程B初期建模數據少導致建模精度很低甚至無法建模的情況,為了突出過程遷移在最終質量預測中的優勢,更為了突出多尺度核方法在解決批次過程訓練樣本中普遍存在的數據分布不均勻的多尺度特性問題上的優勢,本節將JYMKPLS模型、JYKPLS 模型以及傳統的KPLS 模型的預測效果進行了比較。
首先,為了充分驗證在新過程數據不足的情況下,JYMKPLS 模型在整個工況范圍內的最終質量預測能力,保持建模數據集不變,并且暫且不進行模型的在線更新和舊數據的剔除。該實驗中,用到舊過程A 的所有數據和新過程B 的50 個批次的數據,將新過程B的50個批次的數據分為5個批次的建模數據集和45個批次的測試數據集,用以構建最終質量預測模型。其中,傳統的KPLS 建模方法只利用新過程B 的5 個批次數據進行建模,而JYKPLS 和JYMKPLS 過程遷移建模方法則利用相似舊過程A的40個批次的過程數據和新過程B的5個批次的過程數據進行建模。利用三種方法對測試數據集的最終質量進行了預測,評價指標為預測值的均方根誤差RMSE 和平均相對預測誤差MPRE。實驗的結果如圖7 和表3 所示,在新過程運行初期,擁有很少的建模數據的情況下, JYKPLS 和JYMKPLS 過程遷移建模方法的整體預測效果要明顯優于KPLS 建模方法的預測效果。同時,基于JYMKPLS的建模方法的預測精度要略優于基于JYKPLS 的建模方法的預測精度。
三種預測方法的均方根誤差以及平均相對預測誤差如表3所示。

表3 三種預測方法的評價指標對比Table 3 The evaluation index comparison of three prediction methods
三種預測方法的平均均方根誤差如表4 所示(無數據剔除)。

表4 三種預測方法的平均均方根誤差對比Table 4 Comparison of mean RMSE of three prediction methods

圖7 基于KPLS、JYKPLS和JYMKPLS的青霉素最終濃度預測結果Fig.7 Prediction results of final penicillin concentration for each batch based on KPLS,JYKPLS and JYMKPLS

圖8 帶有模型更新的三種模型的RMSEFig.8 RMSE of the three models with model updates
考慮模型更新情況,本實驗用到新過程B 的55個批次的數據,將其分為三部分,5 個批次的建模數據集,45個批次的更新數據集,5個批次的測試數據集。然后根據KPLS、JYKPLS、JYMKPLS 三種建模方法構建初始的最終質量預測模型。其中,傳統的KPLS 建模方法只利用新過程B 的5 個批次數據進行建模,而JYKPLS 和JYMKPLS 過程遷移建模方法則利用相似舊過程A 的40 個批次的過程數據和新過程B 的5 個批次數據進行建模。測試數據集中5個批次最終濃度預測值的RMSE是量化預測性能的評價指標,每次對測試數據集中的所有測試樣本進行預測后,計算預測結果的RMSE,并向訓練數據集中添加一批更新數據集用以重建預測模型,再次預測它們的最終濃度,直到更新數據集中的所有數據都放入建模數據集中。如圖8(a)和表4所示,隨著新批次數據的不斷產生,建模數據不斷增多,三種預測方法的精度隨著模型更新都在不斷提高,在第25批次之后,達到了較為穩定的精度。對比三種預測方法的均方根誤差,可以看出在對新過程B 的前期進行質量預測時,相較于KPLS 方法,引入相似舊過程A 的過程數據進行遷移建模的JYKPLS 方法和JYMKPLS 方法能夠明顯地降低預測誤差。同時,由于引入了多個尺度的核函數來更好地擬合數據的變化特征,使得JYMKPLS 方法相較于JYKPLS 方法在降低預測誤差方面更加明顯。此外,由于在第25批次之后,JYKPLS 方法和JYMKPLS 方法都已達到了較為穩定的精度,精度受到舊過程數據的影響,此時須考慮數據剔除情況,如圖8(b)所示,通過上文所提的剔除判定方法,在誤差穩定幾個批次之后進行數據剔除,可以看出在第30 個批次以后,二者的預測誤差都進一步降低。總體上,隨著模型更新和數據剔除的進行,基于JYMKPLS建模方法的預測精度不斷提高,而且預測精度明顯優于另外兩種建模方法。
針對間歇過程數據大都具有強非線性和多尺度特性的問題,為了對數據不足的新間歇過程建立更加精準的產品質量預測模型,提出了一種基于多尺度核JYMKPLS 遷移學習模型的產品質量在線預測方法。該方法綜合了遷移學習建模和多尺度核學習方法的優點,既能在減少數據資源浪費的同時,遷移相似舊過程充足的過程數據到新過程中以輔助和加速新過程的建模,又兼顧了間歇過程訓練樣本中普遍存在的多尺度特性,提升了模型泛化性。此外,提出模型在線更新和數據剔除,在每個生產周期結束時,通過在線持續改善遷移模型對新間歇過程的匹配程度,以消除相似過程間的差異性給遷移學習帶來的不利影響,進而不斷地提高產品質量的預測精度。本文通過仿真將該方法應用于青霉素生產過程,結果顯示,與傳統的KPLS 方法和基于過程遷移的JYKPLS 方法相比,該方法在加快新過程建模速度的同時,具有更高的預測精度和良好的泛化性能,能夠進一步提高新批次產品質量的預測精度。
符 號 說 明
B——模型的回歸系數矩陣
e——ynew的預測誤差
I——I × I單位矩陣
KA,KB——分別為A、B過程的核函數矩陣
knew——B過程的新的批次數據對應的核向量
qJi——聯合輸出變量的負載矩陣
S(·)——數據之間的相似度
tA,tB,tJ——分別為A、B 過程輸入數據的得分向量和關聯主成分
uA,uB——分別為過程輸出數據的得分向量
XA,XB——分別為A、B過程的輸入數據矩陣
xformer,xafter——分別為xnew中已存在數據樣本和未知數據樣本
xi——第i 批次的輸入訓練數據
xnew——B過程在線獲取的新的批次的數據樣本
YA,YB,YJ——分別為A、B 過程的輸出數據矩陣和聯合輸出矩陣
ynew,——分別為B 過程在線采集的新生產批次的輸出樣本值及其預測值
βj——第j批次的預測偏差
Δj——前后批次間預測偏差的差值
εstable——穩定閾值
σ——核參數
Φ(?)——非線性變換函數
下角標
A——與過程B相似的舊間歇生產過程
after——之后的,未知的
B——新間歇生產過程
former——之前的,已知的
i——提取的潛變量的序號
J——聯合矩陣
j——批次數
new——新過程B的當前運行批次
old——舊過程A的數據