徐圓,盧玉帥,才軼
(北京化工大學信息與科學技術學院,北京 100029)
隨著過程工業生產規模不斷擴大和生產要求不斷提高,生產系統日益呈現出高度復雜化、大規模化和非線性化的特點,為了保證工業生產過程能安全可靠的運行,避免生產系統發生故障造成不必要的財產損失和人員傷亡情況,故要求系統在出現故障之前就能提供故障的檢測和隔離。近年來,過程工業故障預測[1-3]已成為當前研究熱點問題,基于數據驅動的故障預測方法更是受到了國內廣大學者的關注。張正道等[4-5]提出了基于未知輸入觀測器和神經網絡的非線性時間序列故障預報模型,通過對系統變量狀態線性擬合達到故障預測的目的,但此方法只針對了單變量時序進行預測,忽略了多元變量時序的相關性問題。而系統的運行狀態通常由多元相關時序共同決定,該多元時間序列隨著時間推移可由系統運行累積得到。多元相關時序相比單變量時序包含了系統更多的動態信息,具有一定的信息確定性和完備性,能更好地表征系統的運行狀態。文獻[6-7]從多元相關變量的角度出發對系統進行了故障預測,通過優化和改進預測模型提高了預測的準確度。同時一些學者針對系統的退化階段進行了建模預測,Si等[8]通過在時變系統中引入衰變因子,提出了一種基于動態證據推(dynamic evidential reasoning,DER)算法,有效地解決了時變系統的動態融合問題。文獻[9]提出了一種基于健康概率評估(health state probability estimation)故障預測方法,通過利用 SVM 分類器評價軸承退化階段的健康狀態概率,從而為系統提供一個長期的預測。
對于一些復雜的非線性系統而言,系統的整個運行周期可以劃分為正常工作階段、潛在故障階段和故障階段。有效地對系統運行狀態進行分段,能更好地利用系統的動態機理信息對系統進行故障預測,有利于提高系統故障預測的準確度。一般情況下,系統主要處于正常運行狀態,運行期間產生大量的正常數據,這類數據包含較少的故障信息,增加了實時在線監測的工作量;同時,數據量過多可能導致信息冗余,由此加大了系統建模的難度和預測模型的計算復雜度,使得模型預測精度和可靠度大幅度降低。
本文提出了一種基于多元時序驅動的全流程故障預測方法。首先,為了降低系統變量的維數,提高系統故障預測的精度,利用k-近鄰互信息方法對多元時序變量進行相關性選擇,得到一組相關變量集;其次利用改進的趨勢分析方法對相關變量集中的目標變量運行狀態趨勢進行監測,通過與正常情況下變量的運行趨勢比較、分析確定目標變量發生突變的時刻并記錄,定義此時刻對應的樣本點為系統進入潛在故障階段的突變點,將系統的正常運行階段和潛在故障階段進行區分;最后,提取系統在潛在故障階段產生的數據并通過 ELM 神經網絡進行故障預測。本研究以青霉素發酵過程為仿真對象,實驗驗證提出方法的有效性。
互信息[10-11]作為一種描述變量相關性的常用的方法,能準確地表述出變量間線性、非線性相關性。本文引用文獻[12]中多提到的k-近鄰互信息方法對變量進行相關性提取。
設X={X1,X2,…,XM}為輸入變量,Y為輸出變量(目標變量),輸入變量的維數用M表示。計算各輸入變量與輸出變量間的互信息I(Xi,Y),i=1,2,…,M。



考慮到輸入變量Xi和目標變量Y的相關性,如果輸入變量Xi滿足

則可認為輸入變量Xi是目標變量Y的相關變量;如果不滿足式(3),則說明輸入變量Xi中包含了較少或者不包含關于目標變量Y的信息,可認為輸入變量Xi與目標變量Y不相關,其中δ(δ∈[0,1])為相關性閾值,I(Y,Y)表示目標變量Y的自信息量。根據式(3)可確定與目標變量Y相關變量Xi,與目標變量Y一起可組成相關變量集合F,F={Xi,Y∣I(Xi,Y)>δI(Y,Y)}。
為了快速判定系統是否進入到潛在故障階段,采用趨勢提取的方法對特征變量在線實時監測,通過分析變量趨勢的斜率變化,確定系統是否進入潛在故障階段。傳統的趨勢提取方法[13-14]主要分為 4個步驟:①在線數據的線性分段;②片段的分類,把片段分成7個有時間相關的趨勢;③ 分類片段的半定性轉換;④ 相鄰片段的整合。考慮到本次研究對象數據波動小的特點,也為了減少算法的復雜度,對算法做以下簡化和修改。
假定某段數據經最小二乘法擬合得到的數學模型如下所示



式中,Δt為采樣時間,t1為未來某個時刻,k=1,2,3,…,外推值與真實值的誤差為

記 cusum(t1+kΔt)為(t1+kΔt)時刻誤差的累積和,則有

預設定一個閾值參數th1,如滿足|cusum(t1+kΔt)|<th1,則認為(t1+kΔt)時刻的數據能被此曲線模型所接受;如滿足|cusum(t1+kΔt)|≥th1,則從t1+kΔt時刻開始,提取未來10個時刻的數據進行下一次曲線的擬合,得到下一個線性片段,cusum被重置為 0,進行下次判斷。分段完成后,設相鄰的兩片段斜率分別為p1、p2(假設p1>p2),若滿足

則把相鄰的兩片段進行整合,得到整個信號的運行趨勢,最后通過對趨勢片段斜率的分析比較確定出系統的突變點,式(8)中α∈(0~1)。
ELM神經網絡具有訓練速度快、精度高,泛化能力強等特點,選用 ELM 構建故障預測模型,能有效地提高預測精度[15-17]。本文將 ELM 分別用于多元時間序列預測和故障識別兩個部分,并通過子網1和子網2實現其功能。
在進行多元時間序列預測時,子網1的輸入輸出層節點數可根據第1.2節得到的相關變量集F的維數確定,輸入樣本為集合X

子網 1實際輸出為O={O1,O2,…,Os},訓練時期望輸出設為Oe。

式中,t表示輸入樣本的起始時刻,n為輸入樣本數,P為預測步長,s為子網1的輸入層和輸出層的節點數。
故障識別部分,子網 1 的實際輸出O={O1,O2,…,Os}作為子網2的輸入,子網2的隱含層節點數為b,子網2 的輸出y1,y2,…,ym分別代表m種故障類型。
圖1為將ELM同時用于多元時間序列預測和故障識別的模型結構。

圖1 ELM神經網絡故障預測模型結構Fig.1 ELM neural network fault prediction model
青霉素發酵過程由Pensim仿真平臺模擬實現,其模型結構主要是由 Birol等[18-20]根據前人的實驗數據對Bajpai 模型進行改進而來。該模型可以模擬各種操作條件下生物量,CO2、青霉素、碳源、氧氣和熱量產生的濃度,其中生物量濃度作為青霉素生產過程中的一個關鍵變量,過程中所產生的數據已被廣泛應用于過程的故障監控和預測。圖2所示為青霉素發酵過程的流程圖。
青霉素發酵過程一共包括 15個變量,如表 1所示。本研究中,取關鍵變量生物量濃度(XV7)用于青霉素發酵過程的狀態監測。

圖2 青霉素發酵過程流程Fig.2 Flow diagram of penicillin fermentation process

表1 青霉素發酵過程變量Table 1 Variables of penicillin fermentation process

表2 發酵過程故障Table 2 Failures of fermentation process
基于Pensim仿真平臺的青霉素發酵仿真過程,實驗仿真時間設定為200 h,采樣時間間隔為0.04 h,定義的故障類型如表2所示。
正常操作情況,取 1000組數據對相關變量進行選擇。變量 7(生物量濃度)作為目標變量,其余14個變量作為輸入變量。在本實驗中,設定k-近鄰距離為50,相關性閾值δ=0.4366,互信息相關性分析結果如圖3所示。

圖3 目標變量與各變量之間的互信息量Fig.3 Mutual information between target variable and other variables
從圖3可以看出,變量5(物料濃度)、變量6(溶氧濃度)、變量13(產熱)、變量14(冷卻水流量率)與目標變量7(生物量濃度)的相關性比較強,和目標變量一起組成相關變量集F={XV5,XV6,XV7,XV13,XV14}。各變量與目標變量的互信息如表3所示。

表3 各變量與目標變量的互信息Table 3 MI between target variable and other variables
在線監測目標變量的變化趨勢確定系統的運行狀態,分別針對故障類型 1~3分別做了仿真分析。設定閾值參數th1=0.01,式(8)中參數α=0.5。圖4為系統正常目標變量趨勢分析結果以及系統處于故障1、2、3時的目標變量趨勢分析結果。
針對故障類型1的目標變量趨勢進行分析,由實驗數據可得,目標變量在第2504樣本處,也就是在時刻tc1=100.16 h時發生了突變,因此可認為系統在此時刻進入了潛在故障階段,實驗數據還得出了故障類型2和故障類型3的目標變量的突變時刻分別為tc2=100.24 h,tc3=100.12h。為了更好地評價趨勢分析的有效性以及對系統潛在故障階段和故障階段進行區分,在本研究中,取TH=μ±3σ作為青霉素發酵仿真過程中的故障閾值,忽略系統對集合F外其他變量和運行在滯后期的影響,故障類型1~3最先超過閾值控制線的變量分別為變量 5,變量 6和變量 13,發生故障時刻分別為tf1=104.32h、tf2=105.72h、tf3=107.04h,也就是說系統在發生故障1~3時,分別在時刻tf1~tf3進入到了故障工作階段。趨勢分析方法帶來的誤差ei(i=1,2,3)可由式(11)求得

式中,數字100表示在仿真研究過程中加入干擾的時刻,由式(11)可計算得到 3種故障類型的誤差分別為e1=0.0370、e2=0.0420、e3=0.0170,3種故障類型誤差都在允許的誤差范圍內,由此驗證了方法的有效性。

圖4 目標變量趨勢分析結果Fig.4 Target variable trend analysis
構建ELM神經網絡預測模型,從時刻100 h開始,分別從故障類型1~3各取500組數據作為輸入訓練樣本,取44組數據進行泛化,預測步長P=6,預測模型神經網絡結構為5-100-5。本文分別以故障類型1和故障類型2的變量6為例做數據預測,預測如圖5、圖6所示。
各故障的變量的預測均方根誤差如表4所示。


圖5 故障1的變量6數據預測Fig.5 Data prediction of variable 6th of fault 1

圖6 故障2的變量6數據預測Fig.6 Data prediction of variable 6th of fault 2

表4 各變量的均方根誤差Table 4 RMSE of variables

表5 故障識別結果Table 5 Results of fault identification

本文從全流程的角度出發,提出了一種基于多元時序驅動的復雜過程故障預測方法。通過提取過程特征變量,提出改進趨勢分析方法在線監測系統的運行狀態,并提取系統潛在故障階段的數據進行建模實現對系統進行故障預測。通過青霉素發酵過程的仿真結果表明,所提方法滿足在線預測的要求,能夠至少提前12 min對系統故障做出預報,給操作員提供了足夠的反應時間,方便其及時檢測到并排除故障,保證了復雜過程工業安全可靠的生產,具有重要的現實意義。
[1]Ai Hong(艾紅), Zhou Donghua(周東華). Fault prediction approach for dynamic system [J].Journal of Huazhong University of Science and Technology:Natural Science Edition(華中科技大學學報:自然科學版), 2009, 37(1): 222-225
[2]Sun Qiang(孫強), Yue Jiguang(岳繼光). Review on fault prognostic methods based on uncertainty [J].Control and Decision(控制與決策),2014, 29(5): 1-10
[3]Xu Yuan(徐圓), Liu Ying(劉瑩), Zhu Qunxiong(朱群雄). A complex process fault prognosis approach based on multivariate delayed sequences [J].CIESC Journal(化工學報), 2013, 64(12): 4290-4295
[4]Zhang Zhengdao(張正道), Hu Shousong(胡壽松). Fault prediction for nonlinear time series based on unknown input observer [J].Control and Decision(控制與決策), 2005, 20(7): 769-772
[5]Hu Shousong(胡壽松), Zhang Zhengdao(張正道). Fault prediction for nonlinear time series based on neural network [J].Acta Automatica Sinica(自動化學報), 2007, 33(7): 744-748
[6]Zhang Zhengdao(張正道), Cui Baotong (崔寶同). On-line fault prediction of system based on hiding semi Markov model [J].Control and Decision(控制與決策), 2010, 25(12): 1853-1856
[7]De Carvalho A B, Pozo A, Vergilio S R. A symbolic fault-prediction model based on multiobjective particle swarm optimization [J].Journal of Systems and Software, 2010, 83(5): 868-882
[8]Si X S, Hu C H, Yang J B,et al. On the dynamic evidential reasoning algorithm for fault prediction [J].Expert Systems with Applications,2011, 38(5): 5061-5080
[9]Kim H E, Tan A C C, Mathew J,et al. Bearing fault prognosis based on health state probability estimation [J].Expert Systems with Applications, 2012, 39(5): 5200-5213
[10]Herman G, Zhang B, Wang Y,et al. Mutual information-based method for selecting informative feature sets [J].Pattern Recognition, 2013,46(12): 3315-3327
[11]Lü Ning(呂寧), Yu Xiaoyang(于曉洋). Fault diagnosis in TE process based on feature selectionviasecond order mutual information [J].CIESC Journal(化工學報), 2009, 60(9): 2252-2258
[12]Liu Xiaoxin(劉曉欣). Correlation analysis and variable selection for multivariate time series based on mutual information [D]. Dalian :Dalian University of Technology, 2013
[13]Charbonnier S, Garcia-Beltan C, Cadet C,et al. Trends extraction and analysis for complex system monitoring and decision support [J].Engineering Applications of Artificial Intelligence, 2005, 18(1): 21-36
[14]Charbonnier S, Portet F. A self-tuning adaptive trend extraction method for process monitoring and diagnosis[J].Journal of Process Control, 2012, 22(6): 1127-1138
[15]Gao Guangyong(高光勇), Jiang Guoping(蔣國平). Prediction of multivariable chaotic time series using optimized extreme learning machine [J].Acta Physica Sinica(物理學報), 2012, 61(4): 1-9
[16]Wong P K, Yang Z, Vong C M,et al. Real-time fault diagnosis for gas turbine generator systems using extreme learning machine [J].Neurocomputing, 2013, 128(3): 249-257
[17]Peng Di(彭荻), He Yanlin(賀彥林), Xu Yuan(徐圓), Zhu Qunxiong(朱群雄). Research and chemical application of feature extraction based AANN-ELM neural network [J].CIESC Journal(化工學報), 2012,63(9): 2920-2925
[18]Liu Yi(劉毅), Wang Haiqing(王海清). Pensim simulator and its application in penicillin fermentation process [J].Journal of System Simulation(系統仿真學報), 2007, 18(12): 3524-3527
[19]Birol G, ündey C, Cinar A. A modular simulation package for fed-batch fermentation: penicillin production [J].Computers &Chemical Engineering, 2002, 26(11): 1553-1565
[20]Xiong Weili(熊偉麗), Wang Xiao(王肖), Chen Minfang(陳敏芳), Xu Baoguo(徐保國). Modeling for penicillin fermentation process based on weighted LS-SVM [J].CIESC Journal(化工學報), 2012, 63(9):2913-2919