999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于改進隨機梯度Boosting算法的軟測量建模

2017-10-14 07:01:59倉文濤楊慧中
化工學報 2017年3期
關鍵詞:測量方法模型

倉文濤,楊慧中

?

基于改進隨機梯度Boosting算法的軟測量建模

倉文濤,楊慧中

(江南大學輕工過程先進控制教育部重點實驗室,江蘇無錫 214122)

在建立復雜化工過程軟測量模型時,使用傳統的隨機梯度Boosting算法(SGB)建模若收縮參數選取不當會明顯降低算法收斂速度,且極易陷入過擬合,難以取得令人滿意的泛化效果。為解決這一問題,提出了一種基于SGB集成學習的軟測量建模方法,采用高斯過程回歸作為基學習器,并針對SGB算法固有的不足,依據每一次迭代中弱學習機的反饋,自適應調整收縮參數,改善了SGB算法的過度擬合,從而提高了集成模型的估計精度與學習效率。將該方法應用于某雙酚A裝置的軟測量建模中,仿真結果表明,相比于傳統SGB建模,該方法具有更高的泛化性能和學習效率。

算法;計算機模擬;集成;隨機梯度Boosting;軟測量

引 言

化工、冶金、發酵等過程工業通常是一個具有高度非線性與時變性的復雜過程,一些反映工藝參數或質量指標的重要變量目前還缺乏在線測量的儀器與手段,往往需要通過在線取樣、離線分析的方法得到。由于離線分析時間間隔長、數據滯后,難以滿足過程工業實施在線優化控制的需求。為解決此類難題,人們提出了軟測量技術[1-5]。

軟測量技術的基本原理是通過構造某種數學模型,建立輔助變量與主導變量之間的關聯形式,從而實現主導變量的實時估計[6-9]。作為軟測量技術的核心內容,軟測量建模方法通常可劃分為機理建模和數據驅動建模法[10-12]。近年來,各種基于數據驅動的軟測量技術已經在工業生產過程中得到越來越廣泛的運用[13-16]。然而,對于越來越復雜的工業生產過程,各種不確定因素導致很難用單一模型來準確地表達實際工業過程。集成學習方法的出現,為解決上述問題提供了良好的途徑。集成學習可以有效地提高軟測量模型的泛化能力,已經成為機器學習領域的研究熱點之一[17-19]。

作為一種重要的集成學習方法,Boosting算法的思想起源于Valiant[20]提出的PAC(probably approximately correct)學習模型,它能將預測精度僅比隨機猜度略高的弱學習機提升為預測精度高的強學習機。1990年,Schapire[21]首次將Boosting算法引入機器學習領域。隨后,為解決早期Boosting算法必須知道弱學習算法學習正確率下限的問題,Freund等[22]于1997年提出了一種名為AdaBoost(adaptive Boosting)的回歸建模方法。AdaBoost最終判別準則的精確度依賴所有弱學習過程得出的弱學習機,因而更能全面地挖掘弱學習算法的能力。2001年,Friedman[23]提出了梯度Boosting算法(gradient Boosting,GB),GB在建立模型時,使之前模型的殘差往梯度方向減少,從而使得強學習機可以對損失函數進行極小化優化。在此基礎上,Friedman[24]于2002年結合Bagging思想,在GB算法基礎上引入一個隨機化參數,提出了隨機梯度Boosting(stochastic gradient Boosting,SGB)方法,其主要思想是在算法的每一次迭代過程中,隨機抽取訓練樣本的一部分來擬合弱學習機,因此SGB可以看成是Bagging和Boosting的綜合體。

SGB回歸算法簡單易用,但與GB算法相比,增加了一個需要確定的參數——收縮參數,合理選取值是該算法成功與否的關鍵因素:若值選取過小,則學習效率低,收斂速度慢;若值選取過大,則學習不充分,可能會出現過擬合現象[25]。為解決這一問題,本文對原始SGB回歸算法進行改進,采用高斯過程回歸作為基學習器,依據每一次迭代中弱學習機的反饋,自適應調整該學習機的收縮參數,使得每次學習過程中性能優異的弱學習機得到更多關注,從而提高集成模型的泛化性能與收斂速度。最后將此改進的SGB回歸算法用于某雙酚A生產裝置中2,4-雙酚A濃度的軟測量建模。

1 高斯過程回歸

作為近幾年發展起來的一種基于高斯隨機函數的回歸算法,高斯過程回歸(Gaussian process regression,GPR)具有嚴格的統計學理論基礎,且對處理高維數、小樣本和非線性等復雜問題具有很好的適應性[26-28]。與支持向量機、神經網絡相比,GPR具有容易實現、非參數推斷靈活、超參數自適應獲取以及能夠實現概率化估計等優點。

給定訓練樣本集={(x,y)},=1,2,…,,其中,R為維輸入變量,y∈為輸出變量。輸入、輸出之間的回歸關系由式(1)產生

y=()+(1)

式中,是未知函數形式;是均值為0、方差為2的高斯噪聲。對于新的測試樣本*,其預測分布的均值和方差如式(2)、式(3)所示

*(*)=T(*)-1(2)

2*(*)=(*,*)-T(*)-1(*) (3)

式中,(*)=[(*,1),…,(*,)]是測試數據與訓練數據之間的協方差矩陣;=(,)是訓練數據之間的協方差矩陣;=[1,…,y]T。GPR可以選擇不同的協方差函數產生協方差矩陣,只需要選擇的協方差函數能保證產生的協方差矩陣滿足非負正定的關系。本文選擇徑向基函數作為協方差函數

式中,0為函數控制局部相關性程度的先驗協方差;w為維輸入變量的相對重要性權重;1為噪聲的先驗協方差;為Kronecker算子。GPR需要對式(4)中的未知參數0、w、1和高斯噪聲方差2的值進行估計。最常用的方法就是通過極大似然估計得到最優超參數

=[0,2,1,…,w,1] (5)

為求得超參數的值,首先將設置為某一合理區間中的隨機數,再用共軛梯度迭代法搜索的最優值。獲得最優值后,對于測試樣本*,可以通過式(2)、式(3)來估計GPR模型的輸出值。

2 SGB回歸模型

2.1 SGB加性回歸模型

梯度Boosting作為加性回歸模型的基本原理是:每一次迭代為了減少上一次弱學習機的殘差,在殘差減少的梯度方向上建立一個新的弱學習機,由此不斷迭代最終產生一個弱學習機的相加組合,使得組合回歸模型可以對損失函數進行極小化優化[29-30]。令=[1,2,…,]T,基于梯度Boosting算法加性模型的模型輸出()如式(7)表述

(8)

式中,arg min(*)是為使得(*)取最小值的最優(),收縮參數v∈(0,1)稱為“學習率”,為子模型個數,v和通常都是根據先驗知識確定的常量。

Friedman[24]于2002年將類似于Bagging的隨機選擇策略與GB組合,提出了SGB算法。SGB在每一次迭代中,有放回地隨機抽取訓練集中n(n<)個子樣本,用以替代全部訓練數據,擬合弱學習機與計算當前迭代中模型更新,抽樣比例由隨機化參數表示。當=1時,算法等同于原始的GB算法,由文獻[24]可知,=0.5時模型泛化性能最佳。SGB回歸模型的學習及更新過程算法描述如下。

(1)建立訓練數據集=(,),確定最大迭代次數及收縮參數v

(2)從訓練數據集中隨機抽取n個子樣本,建立基本GPR模型1=1()(弱學習機1),用1估計全部訓練樣本,估計結果記為,計算殘差:,并更新訓練數據集=(,res,1)。

(3)=2,3,…,,重復如下步驟。

① 從已更新的訓練數據集中隨機抽取n個子樣本,建立基本GPR模型=f()(弱學習機)用以擬合上一次弱學習機的殘差。

② 用f估計訓練集中所有樣本,估計結果記為。

③訓練數據集更新:=(,res,k),其中。

④ 最終估計結果為

⑤ 對于新的測試樣本new,根據式(9)計算估計輸出。

2.2 改進的SGB算法

SGB算法在實施過程中首先需要確定學習率v,而v通常通過反復實驗獲得,這就增加了整個算法操作的復雜程度,而且SGB算法性能對v的選擇比較敏感,主要體現為如下幾方面。

(1)雖然運用較小的學習率(v<0.1)比GB算法能更有效地提高泛化能力,且學習率越小,學習越充分,然而較小的學習率需要更大的迭代次數才能使模型收斂,這就導致了計算耗時的增加,延緩了算法的執行效率。

(2)若學習率v取值過大,迭代中由某些性能較差的弱學習機提取出的回歸信息可能存在過擬合現象,同時也無法保證對訓練樣本的充分學習,這將嚴重影響最終集成學習的性能。

為此,本文提出了一種改進的MSGB算法(modified stochastic gradient Boosting,MSGB),即按照迭代誤差自適應調整v的方法。在整個SGB迭代學習過程中,v不再是一個固定先驗值,而是根據每次迭代學習時弱學習機的反饋不斷變化,通過迭代過程中弱學習機的反饋結果,自適應地調節v,使得整個學習過程更多地注重性能優異的弱學習機。即當該次迭代誤差e大于前一次迭代的誤差e-1時,將v減小;反之,當該次迭代誤差e小于前一次迭代誤差e-1時,將v增大。這樣,可以在整個迭代過程中不斷地根據實際情況實時調整v的大小,始終向著性能最優的方向尋找最佳收縮參數值,從而克服初始v選擇給SGB算法帶來的不利影響。本文的具體改進思路為:首先,確定初始收縮參數1的值,并構造弱學習機1,學習及更新過程與SGB完全一致。弱學習機每學習一次結束后,計算本次學習的輸出平均相對誤差

收縮參數的變化由輸出平均相對誤差的變化決定

其中,是一個與平均相對誤差變化率相關的系數,取,∈(0,1)為一個自定義的比較小的數,此時完成收縮參數調整,繼續SGB迭代,直至迭代過程結束。建立集成學習模型的流程如圖1所示。

通過上述方法改進之后的MSGB算法,不必再為如何確定合適的收縮參數而反復嘗試,并能保證SGB向正確方向迭代,同時可以依據每一次迭代過程中的誤差變化,實時調整收縮參數的值,保證避免過擬合,最終達到改善SGB泛化性能的目的。

3 仿真實驗

為了驗證改進MSGB算法的有效性,本文利用高斯過程回歸作為基學習器,對某石化廠雙酚A生產中的脫水單元產物2,4-BPA的質量指標進行估計。分析雙酚A生產工藝可知,影響脫水單元2,4-BPA質量指標的主要操作變量為脫水塔進料流量、溫度、塔頂壓力、塔底壓力、回流溫度、回流流量以及塔頂、塔中部、塔底溫度。

從脫水塔單元現場采集到300組數據,選取200組作為訓練樣本,100組作為測試樣本。首先采用主成分分析(principalcomponentanalysis,PCA)算法對軟測量的輸入輔助變量進行預處理,用累計方差貢獻率(cumulative percent variance,CPV)準則確定PCA主成分個數,從而保證所提取的主成分能夠解釋過程數據90%以上的信息。如圖2所示,采用PCA方法提取出5個主元進行軟測量建模。

考慮訓練樣本集規模,設定模型參數為:=0.5,=0.1,=100。為驗證本文方法的有效性,分別設置1=0.9及1=0.8,并重復兩次實驗。

用200組訓練樣本對SGB-GPR模型與MSGB-GPR模型進行訓練,圖3為學習過程中訓練數據均方根誤差(RMSE)隨迭代次數變化的情況,RMSE定義為

圖4為1=0.9及1=0.8時,收縮參數隨迭代次數變化情況。分析圖3的訓練結果可知,相比于SGB-GPR模型,本文提出的MSGB-GPR模型具有更好的訓練精度與更高的學習效率。

圖3 訓練數據RMSE曲線

Fig.3 RMSE curves of training data

為進一步驗證本文方法對改善模型泛化性能的有效性,用100組測試樣本對MSGB-GPR模型進行測試,并將測試結果與SGB-GPR模型進行比較,如圖5、圖6所示。

分別列出上述2種建模方法的測試誤差,各模型的最大絕對誤差(MAXE)、均方根誤差(RMSE)如表1所示。

通過圖5、圖6和表1的仿真結果可知,本文提出的基于改進SGB算法的高斯過程集成軟測量建模的模型精度和泛化能力明顯優于傳統的SGB回歸模型,對過程信號具有較好的跟蹤能力。

表1 兩種模型的測試誤差

4 結 論

本文針對現有SGB回歸算法建立軟測量模型時需要反復實驗確定收縮參數的不足,依據弱學習機的反饋,提出了一種自適應修正收縮參數的方法,有效地消除了收縮參數選擇對系統的影響。將所提出的方法運用于某雙酚A生產裝置軟測量建模,使用實際生產數據建立2,4-BPA濃度軟測量模型。仿真結果表明,改進的方法有效地改善了SGB算法性能,估計精度有了顯著提高,且提高了學習效率,具有指導工業生產的意義。

References

[1] 楊小梅, 劉文琦, 楊俊. 基于分階段的LSSVM 發酵過程建模[J]. 化工學報, 2013, 64(9): 3262-3269. YANG X M, LIU W Q, YANG J. LSSVM modeling for fermentation process based on dividing stages[J]. CIESC Journal, 2013, 64(9): 3262-3269.

[2] 曹鵬飛, 羅雄麟. 化工過程軟測量建模方法研究進展[J]. 化工學報, 2013, 64(3): 788-800. CAO P F, LUO X L. Modeling of soft sensor for chemical process[J]. CIESC Journal, 2013, 64(3): 788-800.

[3] KADLEC P, GABRYS B, STRANDT S. Data-driven soft sensors in the process industry[J]. Computers and Chemical Engineering, 2009, 33(4): 795-814.

[4] 雷瑜, 楊慧中. 基于高斯過程和貝葉斯決策的組合模型軟測量[J]. 化工學報, 2013, 64(12): 4434-4438. LEI Y, YANG H Z. Combination model soft sensor based on Gaussian process and Bayesian committee machine[J]. CIESC Journal, 2013, 64(12): 4434-4438.

[5] CAO P F, LUO X L. Modeling for soft sensor systems and parameters updating online[J]. Journal of Process Control, 2014, 24(6): 975-990.

[6] JIN H P, CHEN X G, WANG L,. Adaptive soft sensor development based on online ensemble Gaussian process regression for nonlinear time-varying batch processes[J]. Industrial & Engineering Chemistry Research, 2015, 54(30): 7320-7345.

[7] CAO P F, LUO X L. Soft sensor model derived from wiener model structure: modeling and identification[J]. Chinese Journal of Chemical Engineering, 2014, 22(5): 538-548.

[8] GUO Y F, ZHAO Y, HUANG B. Development of soft sensor by incorporating the delayed infrequent and irregular measurements[J]. Journal of Process Control, 2014, 24(11): 1733-1739.

[9] LIU J L. Developing a soft sensor based on sparse partial least squares with variable selection[J]. Journal of Process Control, 2014, 24(7): 1046-1056.

[10] GE Z Q, HUANG B, SONG Z H. Mixture semi-supervised principal component regression model and soft sensor application[J]. AIChE Journal, 2014, 60(2): 533-545.

[11] YAN X D, YANG W, MA H H,. Soft sensor for ammonia concentration at the ammonia converter outlet based on an improved group search optimization and BP neural network[J]. Chinese Journal of Chemical Engineering, 2012, 20(6): 1184-1190.

[12] JIN X, WANG S Y, HUANG B,. Multiple model based LPV soft sensor development with irregular/missing process output measurement[J]. Control Engineering Practice, 2012, 20(2): 165-172.

[13] LIU Y, GAO Z L, LI P,. Just-in-time kernel learning with adaptive parameter selection for soft sensor modeling of batch processes[J]. Industrial & Engineering Chemistry Research, 2012, 51(11): 4313-4327.

[14] SHAO W M, TIAN X M, WANG P. Soft sensor development for nonlinear and time-varying processes based on supervised ensemble learning with improved process state partition[J]. Asia-Pacific Journal of Chemical Engineering, 2015, 10(2): 282-296.

[15] LIU Y Q, HUANG D P, LI Y. Development of interval soft sensors using enhanced just-in-time learning and inductive confidence predictor[J]. Industrial & Engineering Chemistry Research, 2012, 51(8): 3356-3367.

[16] WANG L, JIN H P, CHEN X G,. Soft sensor development based on the hierarchical ensemble of Gaussian process regression models for nonlinear and non-Gaussian chemical processes[J]. Industrial & Engineering Chemistry Research 2016, 55(28): 7704-7719.

[17] MA M D, WANG S J, WU M F,. Development of adaptive soft sensor based on statistical identification of key variables[J]. Control Engineering Practice, 2009, 17(9): 1026-1034.

[18] LI X L, SU H Y, CHU J. Multiple model soft sensor based on affinity propagation, Gaussian process and Bayesian committee machine[J]. Chinese Journal of Chemical Engineering, 2009, 17(1): 95-99.

[19] LIU J L. On-line soft sensor for polyethylene process with multiple production grades[J]. Control Engineering Practice, 2007, 15(7): 769-778.

[20] VALIANT L G. A theory of the learnable[J]. Communications of the ACM, 1984, 27(22): 1134-1142.

[21] SCHAPIRE R E. The strength of weak learnability[J]. Machine Learning, 1990, 5(2): 197-227.

[22] FREUND Y, SCHAPIRE R E. A decision-theoretic generalization of on-line learning and an application of boosting[J]. Journal of Computer and System Sciences, 1997, 55(1): 119-139.

[23] FRIEDMAN J H. Greedy function approximation: a gradient boosting machine[J]. The Annuals of Statistics, 2001, 29(5): 1189-1232.

[24] FRIEDMAN J H. Stochastic gradient boosting[J]. Computational Statistics and Data Analysis, 2002, 38(4): 367-378.

[25] CAO D S, XU Q S. The boosting: a new idea of building models[J]. Chemometrics and Intelligent Laboratory Systems, 2010, 100(1): 1-11.

[26] SUI Y, ZHANG L. Visual trackinglocally structured Gaussian process regression[J]. IEEE Signal Processing Letters, 2015, 22(9): 1331-1335.

[27] LIU Y, CHEN T, CHEN J H. Auto-switch Gaussian process regression-based probabilistic soft sensors for industrial multigrade processes with transitions[J]. Industrial & Engineering Chemistry Research, 2015, 54(18): 5037-5047.

[28] YAN W J, HU S Q, CHEN T,. Bayesian migration of Gaussian process regression for rapid process modeling and optimization[J]. Chemical Engineering Journal, 2011, 166(3): 1095-1103.

[29] GAO Y B, KONG X Y. Multivariate data modeling using modified kernel partial least squares[J]. Chemical Engineering Research and Design, 2015, 94(1): 466-474.

[30] ZHANG M H, XU Q S, MASSART D L. Boosting partial least squares[J]. Analytical Chemistry, 2005, 77(5): 1423-1431.

Soft sensor modelling method based on modified stochastic gradient Boosting algorithm

CANG Wentao, YANG Huizhong

(Key Laboratory of Advanced Process Control for Light Industry (Ministry of Education), Jiangnan University, Wuxi 214122, Jiangsu, China)

When soft sensor models were constructed for complicated chemical processes by traditional stochastic gradient Boosting (SGB), improper selection of shrinkage parameters would reduce convergence rate of the algorithm, engender overfitting, and sometimes make it difficult to obtain a satisfactory generalization performance. In order to solve this problem, a modified SGB ensemble learning soft sensor was proposed, in which Gaussian process regression (GPR) was adopted as base learner and shrinkage parameters were automatically adjusted according to feedback of a weak learner in each iteration such that both estimation accuracy and learning efficiency were improved. Simulation results in an industrial process of bisphenol A production showed that the modified integration algorithm had higher learning efficiency and generalization performance than traditional SGB models.

algorithm; computer simulation; integration; stochastic gradient Boosting; soft sensor

10.11949/j.issn.0438-1157.20161624

TP 273

A

0438—1157(2017)03—0970—06

國家自然科學基金項目(61273070)。

2016-11-16收到初稿,2016-11-26收到修改稿。

聯系人:楊慧中。第一作者:倉文濤(1986—),男,博士研究生。

2016-11-16.

Prof.YANG Huizhong, yhz_jn@163.com

supported by the National Natural Science Foundation of China (61273070).

猜你喜歡
測量方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
把握四個“三” 測量變簡單
滑動摩擦力的測量和計算
滑動摩擦力的測量與計算
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
測量
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
主站蜘蛛池模板: 综合亚洲色图| 久久成人免费| 不卡午夜视频| 亚洲中文制服丝袜欧美精品| 国产久草视频| 日韩a级片视频| 欧美日韩综合网| 一级毛片在线播放| 国产黄视频网站| 亚洲视频在线青青| 少妇露出福利视频| 久久无码av一区二区三区| 午夜视频在线观看免费网站| 精品国产91爱| 五月婷婷丁香综合| 毛片三级在线观看| 秋霞午夜国产精品成人片| 天天色天天综合网| 欧美一区二区精品久久久| 精品1区2区3区| 3D动漫精品啪啪一区二区下载| 久久这里只有精品免费| 色综合天天综合中文网| 久久永久免费人妻精品| 亚洲动漫h| 免费国产好深啊好涨好硬视频| 国产免费精彩视频| 中日韩一区二区三区中文免费视频| 成人综合网址| 成人午夜亚洲影视在线观看| 欧美午夜视频在线| 亚洲午夜天堂| 爆操波多野结衣| 91激情视频| 91九色国产porny| 日韩美毛片| 日韩午夜伦| 国产精品林美惠子在线观看| 久久久91人妻无码精品蜜桃HD| 9999在线视频| 99视频在线免费观看| 午夜欧美理论2019理论| 国产v精品成人免费视频71pao| 欧美亚洲国产精品久久蜜芽| 国产成人综合在线观看| 国产产在线精品亚洲aavv| 日韩精品亚洲人旧成在线| 女人18毛片一级毛片在线 | 一级毛片视频免费| 亚洲天堂成人在线观看| 2021最新国产精品网站| 在线播放精品一区二区啪视频| 欧美色亚洲| 美女无遮挡免费视频网站| 色亚洲成人| 欧美精品啪啪一区二区三区| 在线观看网站国产| 免费无码网站| 91无码人妻精品一区| 久久无码高潮喷水| 欧美日本在线播放| 国产视频a| 欧美a在线视频| 热伊人99re久久精品最新地| 欧美a在线视频| 老司机午夜精品网站在线观看| 亚洲伊人天堂| AV熟女乱| 91精品国产91久久久久久三级| 日韩欧美国产三级| 大陆精大陆国产国语精品1024 | 成人毛片免费在线观看| 激情午夜婷婷| 国产自无码视频在线观看| 欧美一级夜夜爽www| 污污网站在线观看| 婷婷成人综合| 久久情精品国产品免费| 国产伦精品一区二区三区视频优播| 国产一区二区免费播放| 日本精品视频一区二区| 色综合天天娱乐综合网|