王宇紅,狄克松,張姍,尚超,黃德先
?
基于DBN-ELM的聚丙烯熔融指數的軟測量
王宇紅1,狄克松1,張姍1,尚超2,黃德先2
(1中國石油大學(華東)信息與控制工程學院,山東青島 266580;2清華大學自動化系,北京 100084)
針對聚丙烯熔融指數軟測量中預測精度不高的缺點,將基于深度置信網絡-極限學習機(DBN-ELM)的軟測量方法應用到熔融指數的軟測量中。與傳統深度置信網絡(DBN)不同的是,該方法將極限學習機(ELM)算法運用到深度置信網絡的訓練中。首先用深度置信網絡對原始數據進行數值分析來提取特征,然后將提取的特征輸入到極限學習機中進行訓練,得到軟測量模型。實驗驗證表明,與支持向量機和單純的深度置信網絡模型相比,該方法具有更高的測量精度。
深度置信網絡;算法;極限學習機;數值分析;特征提取;實驗驗證
熔融指數是聚丙烯生產過程中一個重要的質量指標,決定了產品的不同牌號。目前,聚丙烯生產過程中控制產品質量的一個主要困難就是沒有對應的在線分析儀表。聚丙烯熔融指數只能通過人工采樣、離線化驗分析得到,并且化驗周期一般為2~4 h,時間滯后比較大,難以滿足生產質量實時控制的要求,從而導致生產過程的熔融指數總是處于波動之中,特別是在產品牌號切換過程中會產生大量的不合格產品,帶來很大的經濟損失[1-3]。因此,如果能夠建立實時反映聚丙烯熔融指數的軟測量模型,對實現聚丙烯生產過程的平穩操作、提高產品質量以及聚丙烯最優牌號切換均具有重要的意義[4]。
目前已經有很多學者開展了該領域的研究。文獻[5]提出一種基于支持向量機的軟測量模型。文獻[6]首次提出將深度學習用于軟測量的建模。文獻[7]提出將DBN-ELM用于球磨機料位的軟測量建模,并取得好的效果。文獻[8]基于生產過程的質量平衡和能量平衡建立聚丙烯熔融指數的預測模型。文獻[9]針對聚丙烯裝置熔融指數軟測量中的非線性以及多工況切換問題,提出一種基于卡爾曼濾波-正交最小二乘(Kalman-OLS )的非線性自適應軟測量方法。文獻[10]針對聚丙烯生產過程的非線性,提出了一種基于KPCA和組合神經網絡的軟測量方法。文獻[11-12]提出一種模糊技術與人工神經網絡或支持向量機的組合模型。文獻[13-14]提出一種混合群智能算法與RBFNN或SVM的組合模型。在聚丙烯的軟測量方面盡管取得了很多的研究成果,但是目前研究工作仍然存在著模型復雜或預測精度不高等不足。
最近神經網絡研究成果表明,深度置信網絡(deep belief network, DBN)作為一種深層神經網絡,具有良好的特征學習能力,通過對低層特征的組合形成更加抽象的高層表示,使分類或預測更容易[15]。另外,DBN在時間序列的預測方面也有成功的應用[16]。在DBN的訓練過程中,首先通過無監督貪婪訓練每一層RBM,將訓練后的RBM組合構建DBN,然后采用傳統的全局優化算法對整個網絡進行微調,使網絡達到最優。然而基于梯度的全局優化算法會陷入局部最優,并不能很好地訓練深層神經網絡,并且這樣的全局微調需要大量的訓練時間。因此,將極限學習機算法運用到DBN的訓練過程中,對DBN進行改進來改善DBN的性能,提高模型的預測準確率。
綜上所述,本文將DBN與ELM相結合用于聚丙烯熔融指數的軟測量。實驗結果表明,相比傳統軟測量方法,該方法具有更高的預測精度,為聚丙烯熔融指數軟測量的研究和應用提供了新的方法。
深度置信網絡(DBN)作為一種多層網絡,近來受到廣泛的關注[17]。對于多層神經網絡來說,單純地采用梯度下降訓練很難達到較好的效果,深度置信網絡采用深度學習算法很好地解決了該問題。深度學習算法由兩個階段組成,即無監督的預訓練階段和有監督的反向傳播階段。在無監督的預訓練階段,DBN首先被預訓練作為有監督階段的初始權重;在有監督的反向傳播階段,對整個網絡進行調優。
DBN可看作通過疊加若干層受限玻爾茲曼機(restricted Boltzmann machine, RBM)分級建立而成,如圖1所示。每一層可以看作一個單獨的RBM。RBM是一種兩層神經網絡,由一層代表輸入的可見層和一層代表隱變量的隱層組成,并且隱變量作為下一個RBM的輸入。DBN采用一種貪婪的逐層訓練方法。在圖1中,RBM1首先被訓練,并且RBM1的隱層作為RBM2的輸入,然后RBM2被訓練,RBM3也以同樣的方式訓練。在每一個RBM的訓練過程中,隱變量作為特征被從輸入數據中提取出來。
相比于傳統的軟測量建模方法,深度置信網絡一個很大的優勢就是快速采樣的過程數據可以被充分利用。在工業過程中,過程變量的采樣速率比質量變量的采樣速率要大得多,如圖2所示。結果,質量樣本的數目要遠遠小于過程樣本的數目。傳統軟測量建模方法只利用了和質量變量相同數目的過程樣本,那些沒有被利用的過程樣本仍然包含豐富的信息。在深度學習的過程中,那些沒有被利用的過程變量可以用于非監督的預訓練來提取隱變量,有利于促進監督階段的反向傳播。利用的數據越多,挖掘的信息也就越多,建立的模型也就越準確。因此,采用了深度學習算法的深度置信網絡非常適合用于建立軟測量模型。
2.1 RBM的基本模型
RBM可視為一個無向圖模型,RBM中的可見單元和隱單元可以為任意指數族單元,如sotfmax單元、高斯單元等[17]。為了方便起見,假設所有可見單元和隱單元均為二值變量。
假設一個RBM有個可見單元和個隱單元,和分別代表可見單元和隱單元的狀態。作為一個系統,當給定狀態(,)時,所具有的能量可表示為[18]
(,)=-T-T-T(1)
其中,為可見層的偏置,為隱層的偏置,為可見層和隱層的連接權重。
當參數={,,}確定以后,系統的聯合概率分布可表示為

其中,()為歸一化因子。
對于一個實際問題,主要關心的是輸入數據的分布(|),也稱為對數似然函數,即

為了確定該分布,需要計算(),需計算2+m次,計算量比較大,因此()比較難計算。
但是由RBM的特殊結構可知,同層節點之間的狀態是相互獨立的。當給定可見節點的狀態時,第個隱層節點的激活概率為

由于RBM的對稱結構,求得隱層節點后,可見節點的激活概率為

2.2 基于對比散度的RBM訓練算法


對數似然函數關于參數的梯度為

設表示輸入數據,代表隱層向量,代表可見層向量,代表學習速率,代表RBM的權重矩陣,代表輸入層偏置向量,代表輸出層偏置向量。
(1)隨機初始化模型參數,并設定迭代次數Step。
(2)將原始數據賦給可見層向量。
(3)根據下面兩個公式計算0、1、1的狀態值,即隱層和可見層的激活概率為

(4)用式(9)對參數進行更新

(5)若≥Step,則訓練結束,否則-1將賦給。并轉到步驟(3),重新訓練。
極限學習機是一種適用于單隱層神經網絡的快速學習算法。當輸入權重和偏置隨機初始化以后,輸出權重也就確定了。
設一個單隱層神經網絡有個樣本(,t),,。假設一個單隱層神經網絡有個隱層節點,則此網絡可表示為

式中,()為激活函數;=[,1,,2,…,,n]T為輸入權重;為輸出權重;為第個隱單元的偏置。
訓練單隱層神經網絡的目的是使輸出誤差最小,即

也就是存在特殊的、、,使

式(12)可以表示為
=
其中,為隱層節點的輸出;為輸出權重;為期望輸出。



當采用ELM算法時,輸入權重和隱層偏置被隨機確定后,隱層的輸出矩陣也就確定。此時單隱層神經網絡的訓練問題變為一個線性系統=,輸出權重即為

式中,+為矩陣的Moore-Penrose廣義逆。同時,求得的解是最小且唯一。
設一個DBN含有層隱層,通過貪婪的訓練方式得到-1個RBM,從輸入層,隱層1,…,隱層-1。而第-1個隱層到第層隱層以及第層隱層到輸出層的權重和偏置則是由ELM算法確定[20],改進的深度置信網絡結構如圖3所示。

式中,為第-1層隱藏層到第層隱藏層的權重,為第-1層隱藏層到第層隱藏層的偏置,為第層隱藏層到輸出層的輸出權重。對于整個網絡結構來說,目標是最小化輸出誤差,可表示為

并且存在,使

此問題可轉化為=。
其中,為DBN第-1層到第層的輸出



隨機初始化第-1層隱藏層到第層隱藏層的權重和偏置,則可以得到隱藏層唯一的輸出矩陣。將深度置信網絡的訓練問題轉化成求解線性系統=。同時輸出權重可被確定為

式中,+為矩陣的Moore-Penrose廣義逆。Huang等[21]已經證明求得的解最小且唯一。
從現場聚丙烯裝置采集工業數據獲得軟測量所需要的輔助變量,同時從化驗車間獲取熔融指數的化驗值,經過一系列數據預處理后,最后獲得444組數據,將這些數據分為兩部分,280組數據用于建立軟測量模型,剩余164組數據用于模型驗證。
本文分別采用SVM、DBN、DBN-ELM的方法建立聚丙烯熔融指數的軟測量模型,比較不同方法所建立模型的預測效果,其中,DBN和DBN-ELM的網絡結構參數通過交叉驗證的方式確定。
3種建模方法所建立模型的預測結果列于表1以及圖4~圖6。

表1 3種軟測量建模方法預測結果的對比
從表中可以看出,與SVM方法相比,基于DBN所建立的軟測量模型在測試誤差方面,提高并不是很明顯,但是將DBN與ELM結合后,所建立的基于DBN-ELM的軟測量模型,測試誤差降低了15%。與SVM相比,雖然在訓練誤差方面,準確度有所下降,但是在測試誤差方面,準確度有了明顯的提高。從軟測量的意義上來說,測試誤差更為重要,有時為了保證較低的測試誤差,有意將訓練誤差調得高一些,使模型的預測性能更好。因此,總的來說,基于DBN-ELM的軟測量方法具有更高的預測精度,要優于SVM和單獨的DBN。
針對聚丙烯熔融指數難以在線測量的特點以及傳統軟測量方法所存在的預測精度不足,將DBN-ELM應用在聚丙烯熔融指數的軟測量上。研究結果表明,基于DBN-ELM所建立的軟測量模型具有更高的預測精度,有利于過程質量的監控和先進控制的實施,在聚丙烯生產過程中具有廣闊的應用前景。
[1] YI H S, AND J H K, HAN C,. Plantwide optimal grade transition for an industrial high-density polyethylene plant[J]. Industrial & Engineering Chemistry Research, 2003, 42(1): 91-98.
[2] AND F T, BIEGLER L T, SALDíVARGUERRA E. Optimal grade transitions in the high-impact polystyrene polymerization process[J]. Industrial & Engineering Chemistry Research, 2006, 45(18): 6175-6189.
[3] SHARMIN R, SUNDARARAJ U, SHAH S,. Inferential sensors for estimation of polymer quality parameters: industrial application of a PLS-based soft sensor for a LDPE plant[J]. Chemical Engineering Science, 2006, 61(19): 6372-6384.
[4] WEI Y J, JIANG Y H, YAN F,Three-stage decomposition modeling for quality of gas-phase polyethylene process based on adaptive hinging hyperplanes and impulse response template[J]Ind. Eng. Chem. Res., 2013, 52(16): 5747-5756.
[5] 馬勇,黃德先,金以慧.基于支持向量機的軟測量建模方法[J].信息與控制, 2004, 33(4): 417-421. MA Y, HUANG D X, JIN Y H. Soft-sensor modeling method based on support vector machine[J]. Information and Control, 2004, 33(4): 417-421.
[6] SHANG C, YANG F, HUANG D,. Data-driven soft sensor development based on deep learning technique[J]. Journal of Process Control, 2014, 24(3): 223-233.
[7] 康巖,盧慕超,閻高偉.基于DBN-ELM的球磨機料位軟測量方法研究[J].儀表技術與傳感器,2015, (4): 73-75. KANG Y, LU M C, YAN G W. Soft sensor for ball mill fill level based on DBN-ELM model[J]. Instrument Technique and Sensor, 2015, (4): 73-75.
[8] 王平,田華閣,田學民. Spheripol-Ⅱ雙環管聚丙烯裝置動態建模[J].計算機與應用化學,2008, 25(7): 827-831. WANG P, TIAN H G, TIAN X M. Dynamic modeling of Spheripol-Ⅱ propylene polymerization in dual-loop reactor [J]. Computers and Applied Chemistry, 2008, 25(7): 827-831.
[9] 田華閣,田學民,鄧曉剛.基于Kalman-OLS的聚丙烯熔融指數軟測量[J].控制工程,2010, (S1): 83-86. TIAN H G, TIAN X M, DENG X G. Polypropylene melt index soft sensor based on Kalman-Orthogonal least squares[J]. Control Engineering of China, 2010, (S1): 83-86.
[10] 潘澤林,夏陸岳,周猛飛,等. KPCA-SNNs的聚丙烯熔融指數軟測量[J].計算機與應用化學,2014, 31(2): 203-206. PAN Z L, XIA L Y, ZHOU M F,. Soft sensor of polypropylene melt index based on KPCA-SNNs[J]. Computers and Applied Chemistry, 2014, 31(2): 203-206.
[11] LIU X, ZHAO C. Melt index prediction based on fuzzy neural networks and PSO algorithm with online correction strategy- s[J]. AIChE Journal, 2012, 58(4): 1194-1202.
[12] ZHANG M, LIU X.A soft sensor based on adaptive fuzzy neural network and support vector regression for industrial melt index prediction[J]. Chemometrics and Intelligent Laboratory Systems, 2013, 126(15): 83-90.
[13] LI J, LIU X, JIANG H,. Melt index prediction by adaptively aggregated RBF neural networks trained with novel ACO algorithm [J]. Journal of Applied Polymer Science, 2012, 125 (2): 829-1656.
[14] 蔣華琴,劉興高.免疫 PSO_WLSSVM最優聚丙烯熔融指數預報[J]. 化工學報,2012, 63(3): 866-872. JIANG H Q, LIU X G. Optimal melt index prediction based on ICPSO_WLSSVM algorithm for industrial propylene polymerization[J]. CIESC Journal, 2012, 63(3): 866-872.
[15] HINTON G E, SALAKHUTDINOV R R. Reducing the dimensionality of data with neural networks[J]. Science, 2006, 313(5786): 504-507.
[16] LANGKVIST M, KARLSSON L, LOUTFI A.A review of unsupervised feature learning and deep learning for time series modeling[J]. Pattern Recognition Letters, 2014, 42(1): 11-24.
[17] HINTON G E, OSINDERO S, TEH Y W. A fast learning algorithm for deep belief nets[J].Neural Computation, 2006, 18(7): 1 527-1554.
[18] 張春霞,姬楠楠,王冠偉.受限波爾茲曼機[J]. 工程數學學報,2015, (2): 159-173. ZHANG C X, JI N N, WANG G W. Restricted Boltzmann machines[J]. Chinese Journal of Engineering Mathematics, 2015, (2): 159-173.
[19] HUANG G B, ZHOU H, DING X,. Extreme learning maching for regression and multiclass classification[J]. IEEE, Transactions on System, Man, and Cybernetics, 2012, 42(2): 513-529.
[20] 趙志勇,李元香,喻飛,等.基于極限學習的深度學習算法[J]. 計算機工程與設計, 2015, (4): 1022-1026. ZHAO Z Y, LI Y X, YU F,. Improved deep learning algorithm based on extreme learning machine[J]. Computer Engineering and Design, 2015, (4): 1022-1026.
[21] HUANG G B, ZHOU H, DING X,. Extreme learning machine for regression and multiclass classification.[J]. IEEE Transactions on Systems Man & Cybernetics Part B Cybernetics A Publication of the IEEE Systems Man & Cybernetics Society, 2012, 42(42): 513-529.
Melt index prediction of polypropylene based on DBN-ELM
WANG Yuhong1, DI Kesong1, ZHANG Shan1, SHANG Chao2, HUANG Dexian2
(1College of Information and Control Engineering, China University of Petroleum, Qingdao 266580, Shandong, China; 2Department of Automation, Tsinghua University, Beijing 100084, China)
To solve the issue of low accuracy of the traditional soft sensor methods of polypropylene melt index, an approach based on deep belief network and extreme learning machine(DBN-ELM)was used to the melt index prediction of polypropylene. Traditional deep belief network (DBN) applied the deep learning to the learning process of the deep neural networks. Different from traditional deep belief network, this approach applied the extreme learning machine algorithm (ELM) to the learning process of DBN to improve the DBN model. Firstly, deep belief network was employed to extract effective features from vibration data by numerical analysis. Then, the effective features were put into the extreme learning machine to proceed model training to obtain the soft sensor model. The experimental validation showed that the method was more accuracy than the traditional method.
deep belief network; algorithm; extreme learning machine; numerical analysis; feature extraction; experimental validation
date: 2016-09-12.
Prof. WANG Yuhong, Y.H.Wang@upc.edu.cn
10.11949/j.issn.0438-1157.20161280
TP 273
A
0438—1157(2016)12—5163—06
山東省自然科學基金項目(2013ZRE28089)。
supported by the Natural Science Foundation of Shandong Province (2013ZRE28089).
2016-09-12收到初稿,2016-09-22收到修改稿。
聯系人及第一作者:王宇紅(1970—),男,博士,教授。