999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于開源技術的FCC裝置產(chǎn)品收率預測BP神經(jīng)網(wǎng)絡模型

2021-03-23 06:28:08苑丹丹高雪穎
石油煉制與化工 2021年3期
關鍵詞:特征產(chǎn)品模型

劉 洋,苑丹丹,李 浩,高雪穎

(中國石化工程建設有限公司,北京 100101)

石化項目設計前期階段是從項目的立項到確認項目可行性并得到批準所做的工作。前期階段主要由工廠設計、技術經(jīng)濟、市場分析等專業(yè)的專家對業(yè)主提出的工程項目進行研究,根據(jù)進展深度可以分為機會研究、方案研究和可行性研究等,對裝置收率的估算是其中重要的一環(huán)。裝置收率估算需要專家的經(jīng)驗和專業(yè)科室的配合,但這種靠人工計算和經(jīng)驗推斷的傳統(tǒng)方法難以應對信息時代石化項目設計前期階段越來越快的工作節(jié)奏和對方案變化、多方案比選、快速反應、快速決策等越來越高的工作要求[1]。研究表明,在相對穩(wěn)定的情況下基于機器學習的數(shù)學模型對裝置收率的預測準確度超過人的經(jīng)驗推算[2]。因此,為了應對時代發(fā)展的要求,項目設計前期階段可以利用BP神經(jīng)網(wǎng)絡模型等機器學習技術實現(xiàn)對裝置收率的快速估算,以便設計人員能夠快速地制定或修改方案,提高工作效率和工作質(zhì)量。本研究使用開源語言Python和PHP構建一個適用于石化設計前期階段的BS架構神經(jīng)網(wǎng)絡系統(tǒng),并開發(fā)針對MIP工藝流化床催化裂化裝置收率預測的組合BP模型。

1 BP神經(jīng)網(wǎng)絡

BP神經(jīng)網(wǎng)絡是由Rumelhar和McClelland[3-4]于1986年提出的以網(wǎng)絡誤差平方為目標函數(shù),并采用梯度下降法對目標函數(shù)進行優(yōu)化的多層前饋神經(jīng)網(wǎng)絡。因其具有自學習性、自組織性和推理能力強的特點,同時具備良好的非線性映射能力和柔性網(wǎng)絡結(jié)構,因而被廣泛應用[5-6]。而在石化設計領域,BP神經(jīng)網(wǎng)絡與徑向基函數(shù)(RBF)、支持向量機(SVM)等機器學習模型也已被證明確實可以提高設計的效率和準確度[7-12]。

BP算法在神經(jīng)網(wǎng)絡學習算法中具有十分重要的作用。BP神經(jīng)網(wǎng)絡由輸入層、隱藏層和輸出層3部分組成,每層由一個或多個神經(jīng)元構成,其中輸入層神經(jīng)元個數(shù)與樣本數(shù)據(jù)中的特征變量個數(shù)一致,輸出層神經(jīng)元個數(shù)與預測目標個數(shù)一致。以流化床催化裂化(FCC)裝置為例,本研究使用中國石油化工股份有限公司(簡稱中國石化)2007—2019年MIP工藝裝置的193組工業(yè)匯編數(shù)據(jù),按照6∶2∶2分為訓練數(shù)據(jù)集、交叉驗證數(shù)據(jù)集(調(diào)整和選擇模型參數(shù))和測試數(shù)據(jù)集(模型性能評估)[8],經(jīng)過綜合考慮歐陽福生和趙媛媛等學者的研究中對FCC裝置主要特征變量的劃分[8-10]、中國石化內(nèi)部專家意見以及現(xiàn)階段所能取得的數(shù)據(jù)樣本的實際情況后,將與FCC裝置6個主要產(chǎn)品收率(干氣、液化氣、汽油、柴油、油漿、焦炭)相關的13個主要特征變量定為:4個原料性質(zhì)(密度、殘?zhí)俊i含量、V含量)、再生劑的微反應活性指數(shù)、沉降器頂部壓力、提升管溫度、原料預熱溫度、預提升蒸汽量、汽提蒸汽量、再生器頂部壓力、密相段溫度、再生劑定碳。則FCC裝置產(chǎn)品收率模型中的特征變量個數(shù)為13,目標個數(shù)為6,即BP多層前饋神經(jīng)網(wǎng)絡結(jié)構由13個輸入神經(jīng)元、6個輸出神經(jīng)元、q個隱藏層神經(jīng)元構成,如圖1所示。

圖1 BP神經(jīng)網(wǎng)絡結(jié)構

(1)

式中:bh表示隱藏層中第h個神經(jīng)元的輸出。由于石化裝置收率預測屬于回歸預測問題,本研究激活函數(shù)f使用ReLU分段線性函數(shù),ReLU函數(shù)屬于半線性、半非線性函數(shù),有助于網(wǎng)絡訓練,同時模型收斂較快,ReLU計算如式(2)所示。

ReLU(x)=max(x,0)

(2)

進而計算網(wǎng)絡在(xk,yk)上的均方誤差(MSEk),如式(3)所示。

(3)

之后將誤差逆向傳播回到隱藏層,根據(jù)誤差調(diào)整隱藏層神經(jīng)元的連接權重和閾值。BP算法屬于迭代算法,直到達到預先設置的迭代次數(shù)或是最小誤差,模型停止訓練,得到訓練好的FCC裝置產(chǎn)品收率BP神經(jīng)網(wǎng)絡預測模型。

2 開發(fā)技術選擇和系統(tǒng)架構

2.1 開發(fā)技術選擇

目前用于神經(jīng)網(wǎng)絡開發(fā)的主流工具包括MATLAB(矩陣實驗室)和以Python為代表的開源工具[13-18]。MATLAB是由美國Mathworks公司發(fā)布的針對科學計算、數(shù)據(jù)可視化、系統(tǒng)仿真,和交互程序設計的集成計算環(huán)境[19]。Python是誕生于20世紀90年代的開源腳本語言,多年來被廣泛應用于機器學習等人工智能相關領域,已有Scikit-learn,Theano,TensorFlow,Keras等機器學習框架,為機器學習系統(tǒng)的開發(fā)提供了便利[20-22]。

目前國內(nèi)石油化工領域利用神經(jīng)網(wǎng)絡進行裝置收率預測的研究主要采用MATLAB來實現(xiàn)[23-30],但工程公司在進行前期項目設計時需要考慮更多的客觀因素來選擇神經(jīng)網(wǎng)絡的實現(xiàn)工具。相對于裝置模擬等以研究為主導的開發(fā),前期項目的裝置產(chǎn)品收率預測更重視操作的簡便性,對后臺程序的高度封裝性,以及能夠快速地得到一組能夠直接用于輔助方案設計、可行性研究等前期工作的產(chǎn)品收率數(shù)值。因此使用MATLAB作為神經(jīng)網(wǎng)絡模塊的主要實現(xiàn)工具在前期項目裝置產(chǎn)品收率預測上會有一些不便之處[31-32]:①MATLAB軟件較大,而且較昂貴;②運行MATLAB模型必須安裝MATLAB運行環(huán)境,運行環(huán)境為免費,但如果服務器端僅安裝運行環(huán)境的話,則無法在服務器端進行模型修改后的重新生成和調(diào)試,增加了開發(fā)流程的步驟和復雜性;③MATLAB功能較為定項化,在應用開發(fā)上不如Python等通用型語言靈活。

基于以上原因,本研究選擇使用Python語言作為實現(xiàn)神經(jīng)網(wǎng)絡預測單元的主要實現(xiàn)工具。與MATLAB相比,Python可操作性更強,能夠靈活地調(diào)用模型并能與服務器端其他模塊實現(xiàn)快捷的數(shù)據(jù)交互傳輸,且開源免費,在服務器端部署開發(fā)環(huán)境較為方便,開發(fā)人員可以在同一開發(fā)語言環(huán)境內(nèi)完成模型的創(chuàng)建、修改和測試的全部流程。

需要指出的是,利用Python語言可節(jié)約開發(fā)時間,具備一定的編程基礎和開發(fā)經(jīng)驗的開發(fā)人員可快速上手;而對于無編程背景者,使用Python或是R等純編程語言的開發(fā)成本可能會比使用MATLAB更高。

2.2 整體平臺構架

基于兼顧方便性和易用性,本研究選擇使用Web開發(fā)領域的主流開源語言PHP搭建服務器端的系統(tǒng)平臺構架,使用Python作為服務器端神經(jīng)網(wǎng)絡模塊的開發(fā)語言,充分發(fā)揮兩種語言各自的優(yōu)勢,節(jié)約配置及調(diào)試等步驟上所花費的時間。圖2為系統(tǒng)實現(xiàn)框架。

圖2 系統(tǒng)實現(xiàn)架構

開發(fā)使用Python的Scikit-learn開源工具包[22],主要是基于Scikit-learn的以下特點:①涵蓋絕大部分主流機器學習算法,包括BP(MLP),RBF,Lasso等常用回歸算法;②為所有算法提供一致化的調(diào)用接口,便于開發(fā);③文檔齊全且更新及時。

3 模型構建

3.1 整體設計思路

BP神經(jīng)網(wǎng)絡在理論研究和技術實現(xiàn)上均較成熟,并有較強的非線性映射能力,而對于MIP工藝裝置收率預測,由于各特征變量與各主要產(chǎn)品收率的關聯(lián)度不同,部分特征變量對產(chǎn)品收率預測結(jié)果的影響存在著模糊界限,所以本研究通過對特定產(chǎn)品收率組(每個產(chǎn)品收率組包括6個主要產(chǎn)品收率中的一個到多個)所對應的特征變量中進行特征選取和特征組合來獲得更理想的預測結(jié)果。同時,對于指定類型的裝置,與全廠設計相關的主要產(chǎn)品收率和與主要產(chǎn)品收率相關的特征變量經(jīng)過分析確認后就是相對固定的,變化的只是輸入的特征變量和輸出的裝置產(chǎn)品收率數(shù)值。基于以上條件,可以認為對于已確定主要產(chǎn)品收率的特定煉化裝置,對其確定的特征變量在理論上存在著最優(yōu)組合方案。

3.2 網(wǎng)絡結(jié)構及參數(shù)設置

構建BP神經(jīng)網(wǎng)絡模型的關鍵是隱藏層的層數(shù)以及神經(jīng)元個數(shù)的設置。隱藏層用于提取數(shù)據(jù)抽象特征,不與外界發(fā)生直接數(shù)據(jù)傳輸。隱藏層層數(shù)或神經(jīng)元個數(shù)多,訓練時間會長,同時容易出現(xiàn)過擬合現(xiàn)象;隱藏層層數(shù)或神經(jīng)元個數(shù)少,訓練時間短,但容易出現(xiàn)欠擬合、學習效果不佳等問題。本研究為找到最佳的隱藏層層數(shù)以及神經(jīng)元個數(shù)進行了多次試驗,比較網(wǎng)絡結(jié)構含有單一隱藏層和兩層隱藏層以及不同隱藏層神經(jīng)元個數(shù)下的學習效果。對兩層隱藏層網(wǎng)絡中每層神經(jīng)元個數(shù)分別選擇(6,2),(7,2),(8,2)進行均方誤差(MSE)比較,結(jié)果見圖3(1)。單一隱藏層神經(jīng)元個數(shù)范圍為20~120,每次按照遞增10個神經(jīng)元進行試驗并比較MSE,結(jié)果見圖3(2)。從圖3可知:兩層隱藏層(7,2)的MSE較小;單層隱藏層神經(jīng)元個數(shù)為100時的MSE較小,且優(yōu)于兩層隱藏層情況。因此,本研究BP神經(jīng)網(wǎng)絡結(jié)構按照13-100-6結(jié)構進行搭建。

圖3 隱藏層與MSE的關系

BP網(wǎng)絡結(jié)構中激活函數(shù)‘Identity’,‘Logistic’,‘Tanh’,‘ReLU’的MSE分別為1.43,1.39,1.31,0.68。根據(jù)測試結(jié)果,本研究選擇MSE最小的激活函數(shù)‘ReLU’。其他參數(shù)設置為:最大迭代次數(shù)5 000,學習率0.001,動量0.9。

3.3 組合模型

利用全部13個特征變量進行BP神經(jīng)網(wǎng)絡訓練生成的模型在此稱為原始BP模型。根據(jù)不同產(chǎn)品收率與各特征變量的相關性不同,針對每個產(chǎn)品收率,對特征變量進行選擇,分別對每個產(chǎn)品收率進行BP建模,并對這些對應單項產(chǎn)品收率的BP模型進行組合得到組合BP模型[33]。研究表明[33-39],通過組合多個預測模型確實可以達到提高預測精度,取得比單一模型更好預測效果的目的。所以,本研究嘗試將FCC裝置的13個主要特征變量分為不同的特征組,構建分別以這些特征組為輸入變量的神經(jīng)網(wǎng)絡模型,并根據(jù)這些模型的預測結(jié)果統(tǒng)計出針對具體產(chǎn)品收率的最佳特征模型。

BP模型對特征縮放敏感,所以對輸入的特征變量進行了歸一化處理,采用離差標準化處理方式,將特征變量歸一化到0~1之間。歸一化采用式(4)計算。

(4)

式中:max表示某個特征變量最大值;min表示某個特征變量最小值;x表示原始特征變量值;x*表示歸一化后的特征變量值。

利用Pyohon語言Scikit-learn模塊自帶的Preprocessing.minmax_scale方法對所有樣本中的特征數(shù)據(jù)進行歸一化。結(jié)果表明,歸一化后,神經(jīng)網(wǎng)絡模型的MSE、整體平均絕對值誤差、整體平均可釋方差、整體中值絕對誤差均有所降低,見表1。

表1 特征歸一化前后誤差對比

分析特征變量與收率之間的關系以及特征變量之間的關系,并由此對特征-目標收率進行分組,首先計算特征變量之間的Pearson相關系數(shù)[40-41],計算見式(5)。

(5)

式中:n表示樣本數(shù);xi和yi為樣本值;x′和y′為樣本均值。觀察計算結(jié)果,得到Ni含量和V含量的Pearson相關系數(shù)為0.626 2。

根據(jù)Cohen的相關性強度判別規(guī)范[42],Ni含量和V含量之間的Pearson系數(shù)大于0.5屬于強相關屬性,存在多重共線性。如果Ni含量、V含量是否與預測目標的一個或幾個產(chǎn)品收率存在較強的關聯(lián)性,則Ni含量、V含量可能對構建這幾個特定產(chǎn)品收率的預測模型有較大的作用,而對于組合模型中其他產(chǎn)品收率對應的預測模型,Ni含量和V含量可以根據(jù)具體情況作出取舍和保留。

對于特征變量與產(chǎn)品收率之間的關系,本研究采用Scikit-learn minepy包的最大信息系數(shù)(MIC)[43]表示。MIC采用尋找最優(yōu)離散化的方法,將最大互信息轉(zhuǎn)化為0~1的度量值,MIC比Person相關系數(shù)法更適合尋找變量間的非線性關系。以Ni含量、V含量為例,通過分析結(jié)果可以得到兩者在FCC裝置13個特征變量中對于每個特定產(chǎn)品收率的最大信息系數(shù)排名,結(jié)果見表2。

表2 Ni含量、V含量對應FCC裝置各主要產(chǎn)品收率的MIC排名

基于多次試驗的結(jié)果篩選出每個輸出目標的特征變量如表3所示。由于干氣收率、油漿收率和焦炭收率對應的特征變量相同,液化氣收率和柴油收率對應的特征變量也相同,因此,本研究僅需訓練3個BP模型,并將模型進行組合實現(xiàn)對6個輸出目標的預測。表3為對應每個輸出目標根據(jù)篩選出的特征變量需要建立的BP模型。組合模型 = [干氣(模型1),液化氣(模型2),汽油(模型3),柴油(模型2),油漿(模型3),焦炭(模型3)]。

表3 特征篩選后輸出目標與特征變量對應關系

4 模型預測效果

為了衡量模型的預測效果,分別比較了原始BP模型和組合BP模型的測試數(shù)據(jù)集預測結(jié)果的MSE,結(jié)果見表4。由表4可知,組合BP模型的整體MSE比原始BP模型小,說明組合BP模型預測的FCC裝置產(chǎn)品收率與真實值的偏差更小,預測結(jié)果更準確。

表4 原始BP模型和組合BP模型的MSE對比

雖然組合模型預測速率比獨立模型略低,但對于前期設計階段的決策支持而言這種速度上的差異(2 s以內(nèi))可以忽略不計。

5 結(jié)論和建議

使用神經(jīng)網(wǎng)絡模型等機器學習技術進行裝置產(chǎn)品收率預測具有成本低、反應速度快的特點,對工程公司進行項目前期設計實現(xiàn)快速反應、快速決策具有很強的現(xiàn)實意義。在操作條件基本不變的情況下,神經(jīng)網(wǎng)絡模型對裝置產(chǎn)品收率的預測準確度高于人為的經(jīng)驗判斷。同時,裝置產(chǎn)品收率預測機器學習模型的開發(fā),對于以業(yè)務為先導的設計機構而言可以用相對較少的投入實現(xiàn)自主開發(fā),指導生產(chǎn)實踐,提高工程設計特別是項目前期設計人員的工作效率。

通過計算特征變量之間Pearson相關系數(shù)、以及特征變量與主要產(chǎn)品收率間的最大信息系數(shù),可以對特征變量之間的關聯(lián)性及特征變量與收率之間的非線性關系進行統(tǒng)計分析,并以此為基礎構建組合BP模型。測試結(jié)果表明,組合BP模型的預測效果優(yōu)于原始BP模型。

機器學習模型的基礎是數(shù)據(jù)的積累,將預測模型部署在內(nèi)網(wǎng)服務器上可以保證模型的安全性、保密性和穩(wěn)定性,也便于對模型進行統(tǒng)一升級和更新。

Python語言在人工智能領域有長期的發(fā)展歷史,對于機器學習的相關開發(fā)有各種已成型的方法庫;同時,相對于MATLAB而言,Python開源免費,而且更加靈活,更易于開發(fā)與系統(tǒng)其他模塊的相關接口,適合于迅捷的開發(fā)部署。

后續(xù)研究將對RBF等更多的機器學習技術應用于FCC裝置產(chǎn)品收率預測進行進一步的探索,并對其他煉化裝置進行產(chǎn)品收率預測研究,構建以裝置為單元的模塊化全煉油廠裝置產(chǎn)品收率預測分析系統(tǒng)。

猜你喜歡
特征產(chǎn)品模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
2015產(chǎn)品LOOKBOOK直擊
Coco薇(2015年1期)2015-08-13 02:23:50
線性代數(shù)的應用特征
河南科技(2014年23期)2014-02-27 14:19:15
新產(chǎn)品
玩具(2009年10期)2009-11-04 02:33:14
主站蜘蛛池模板: 色婷婷电影网| 国产精品天干天干在线观看| 久久这里只有精品国产99| 伊大人香蕉久久网欧美| 国产成人8x视频一区二区| 国产www网站| 在线国产91| 欧美精品在线观看视频| 亚洲AV无码久久精品色欲| 亚洲天堂.com| 伊人色天堂| 99无码熟妇丰满人妻啪啪 | 国产成人久久777777| 免费av一区二区三区在线| 精品国产污污免费网站| 国产精品一线天| 精品91在线| 日韩国产综合精选| 亚洲精品无码av中文字幕| 亚洲天堂视频在线观看免费| 国产精品网曝门免费视频| 欧美一级专区免费大片| 看国产毛片| 最新国产你懂的在线网址| 91精品国产情侣高潮露脸| 久久青草免费91线频观看不卡| 四虎永久免费网站| 亚洲AV无码久久精品色欲| 国产午夜福利片在线观看| 在线国产欧美| 91精品国产一区自在线拍| 亚洲伊人久久精品影院| 中文国产成人久久精品小说| 国产一级毛片网站| 国产成人超碰无码| 亚洲经典在线中文字幕| 国产无码高清视频不卡| 国产精品一老牛影视频| 亚洲国产中文欧美在线人成大黄瓜| 成人中文在线| 久久黄色影院| 国产不卡一级毛片视频| 97在线国产视频| 欧美综合一区二区三区| 亚洲色欲色欲www网| 99re经典视频在线| 婷婷午夜天| 免费观看国产小粉嫩喷水 | 综合亚洲色图| 色欲不卡无码一区二区| 亚洲黄色高清| 少妇极品熟妇人妻专区视频| 亚洲视频免| 成人免费一级片| 热这里只有精品国产热门精品| 青草视频网站在线观看| 中文字幕在线看| 免费看a级毛片| 91麻豆国产在线| 亚洲欧美日韩中文字幕在线| 国产国语一级毛片| 婷婷五月在线视频| 国产午夜一级淫片| 91免费观看视频| 中文字幕亚洲精品2页| 一级毛片免费观看久| 综合天天色| 久久精品日日躁夜夜躁欧美| 又粗又硬又大又爽免费视频播放| 国产美女丝袜高潮| 四虎成人精品| 老司机久久99久久精品播放| 午夜免费小视频| 国外欧美一区另类中文字幕| 国产幂在线无码精品| 精品久久高清| 九色综合视频网| 亚洲视频免费播放| 国产一二三区在线| 国内精品小视频在线| 亚洲女同欧美在线| 亚洲无码精品在线播放|