999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于CNN-ABC-BiGRU 的火電廠數據分析與應用研究

2023-11-21 14:12:22宗學軍楊忠君
電子設計工程 2023年22期
關鍵詞:模型

李 萌,宗學軍,連 蓮,何 戡,楊忠君

(沈陽化工大學信息工程學院,遼寧沈陽 110142)

在當今大數據時代的產業界,深度學習在大數據場景下更能揭示數據內部邏輯關系,進而指導企業決策[1-2]。目前已有學者在電力領域廣泛使用深度學習技術,文獻[3]建立了基于卷積神經網絡(Convolutional Neural Networks,CNN)-門控循環網絡(Gate Recurrent Unit,GRU)的負荷預測模型;文獻[4]基于CNN 對電廠熱能循環進行了預測控制。但深度網絡耗時較長才可達到預期性能。另有部分學者將并行計算技術用于算法優化[5],文獻[6]提出了并行化深度卷積神經網絡,提高收斂速度和并行效率。文獻[7]提出了一種基于Spark 平臺的并行決策樹算法,保持分類精度的同時提高大規模數據的訓練效率。然而電廠運行狀態的并行預測模型仍有深入研究空間。文中在火電廠工業環境下將深度學習引入Hadoop 框架,實現設備健康狀態精準高效預測,與以往數據分析平臺相比,經Hadoop 框架優化的算法處理數據效率和模型的準確度有所提高。

1 火電廠環境的分布式框架

Hadoop 分布式框架主要解決大數據的存儲和挖掘分析問題[8]。分布式文件管理系統(Hadoop Distributed File System,HDFS)將現場工業設備傳感器采集的數據拆分多個數據塊,其中時間序列數據由Spark 引擎調用,采用內存計算的方式實現鍋爐主蒸汽流量的實時預測。

2 CNN-ABC-BiGRU模型

2.1 理論基礎

CNN 主要包括卷積和池化兩個組件,它們通常交替出現在CNN的結構中,以實現特征提取[9]。LSTM是循環神經網絡(Recurrent Neural Network,RNN)的改進,以緩解RNN 在訓練時出現梯度消失和梯度爆炸等問題[10]。GRU 處理等量數據時相較于LSTM 網絡,裁汰了部分訓練參數,降低了學習時間要求,并可防止LSTM 網絡經過層層訓練之后因參數過多而產生的過擬合問題[11]。傳統的GRU 結構使用單向傳播,t時刻只與過去的時間相關。為使對輸入信息的分析更加完整,模型的準確性更高,遂構建BiGRU 模型。BiGRU 神經網絡結構如圖1 所示,其具體計算見式(1)-(3)[12]:

圖1 BiGRU神經網絡結構

其中,GRU()函數表示對輸入時間數據的非線性變換,wf和wb分別為正反兩個方向預測過程中輸入層到隱含層的權重,ht為當前時刻的隱含層狀態,wy為隱含層到輸出層的權重,yt為當前時刻的輸出值。

由于某一時間點的過去與未來時刻對當前時刻隱含層狀態都有影響,BiGRU 相較于單向GRU 添加了一層隱含層,使預測過程改良為正向預測與反向預測兩個過程,新模型的輸出結果由正反雙向的隱含層共同決定。因此,BiGRU 網絡有能力學習過去和未來主蒸汽流量影響因素與當前主蒸汽流量之間的關系。

2.2 CNN-ABC-BiGRU網絡

ABC 是D.Karaboga 于2005 年提出的一種基于蜜蜂群體特定智能行為的最優化算法。ABC 算法在每次迭代過程中都會執行全局和局部最優搜索任務,其控制參數較少、魯棒性強、收斂速度快。

文中提出一種基于CNN-ABC-BiGRU 網絡的預測模型,具體步驟為:

1)將實驗數據劃分為訓練數據、驗證數據和測試數據。

2)初始化ABC 參數,確定種群數、最大迭代次數、控制參數等其他參數的初始值。

3)構建CNN-BiGRU 主蒸汽流量預測模型,確定所需尋優的CNN-BiGRU 模型的超參數和尋優范圍,然后在范圍內依據式(4)隨機生成N個初始可行解,并將它們被分配給引領蜂:

其中,xij為第i個可行解的第j個參數。每個初始解xi(i∈(1,2,…,N))為D維向量,D是待優化參數的數目,j∈{1,2,…,D},和分別為第j個參數的最大值與最小值,即待優化參數的可行區間;rand(0,1) 為[0,1] 范圍內的隨機數。

4)針對初始解對CNN-BiGRU 模型展開訓練,根據式(5)尋找初始種群中每個可行解的適應度fit(xi):

其中,f(xi)為可行解的目標函數。

5)引領蜂在每一個可行解鄰域進行搜索,根據式(6)尋找新的可行解vij(t+1),并計算適應度:

其中,i,k∈(1,2,…N),j∈{1,2,…D},k為隨機生成的數值且k≠i,vij為算法對第j個參數計算的新解,φij為[-1,1] 范圍內的隨機數。

6)根據式(7)所示的貪婪算法,比較新解與現有解,保留適應度大的可行解:

7)根據式(8)得出第i個可行解被選擇的概率值Pi:

8)跟隨蜂依據概率值Pi以輪盤賭的方式選定某一個可行解,并根據式(6)在其鄰域隨機搜索新的可行解以及計算新可行解的適應度值。

9)根據式(7)所示的貪婪算法,更新可行解。

10)判斷是否存在因連續未更新次數達到限制而被放棄的可行解,若存在,則由偵查蜂根據式(4)隨機得到一個新的可行解替代它。

11)保留最優可行解。

12)如果滿足終止條件,或者已經用盡迭代次數,返回最優可行解,否則跳轉到步驟5)重新循環。建立該預測模型的流程如圖2 所示。

圖2 CNN-ABC-BiGRU網絡建模流程圖

3 實驗與分析

3.1 數據選擇

利用基于逐步回歸的變量選擇方法選擇最優變量,得出相關因素的相關性,然后采用VIF 檢驗排除因具有多重共線性而對算法結果有影響的變量,從而決定輸入模型變量數量。

3.1.1 逐步回歸分析

逐步回歸方程變量較少,且能保留最為顯著的變量[13]。逐步回歸分析變量之間的相關性,逐個引入新變量,每引入一個新變量時考慮模型包含的變量能否被剔除,直至不再引入新的變量,這時回歸模型是最優模型。

3.1.2 基于VIF的多重共線性檢驗

假設存在不全為零的m+1 個數c0,c1,c2,…,cm,使得c0+c1xi1+c2xi2+…+cmxm≈0,i=1,2,…,n,此時自變量x1,x2,…xm有完全共線性。檢驗后若變量與變量出現多重共線性,消去共線性之后計算得到回歸方程系數并可以進行VIF 檢驗[14]。

自變量相關矩陣記為:

主對角線元VIFj=cjj是自變量xj的方差擴大因子(Variance Inflation Factor,VIF),若1≤VIF≤5,則無多重共線性。

3.1.3 特征選擇結果

如表1 所示,對采集的10 組數據進行逐步回歸分析,最終得到六個特征變量,包括給水流量、汽包液位、一次風量、二次風量、爐膛床壓和氧含量,以主蒸汽流量作為因變量建立多元回歸方程組,對模型都進行顯著性和VIF 檢驗。

表1 逐步回歸模型及VIF檢驗結果

檢驗結果顯示,x1,x2,…,x6的VIF 皆小于5,表明該模型無多重共線性。檢驗統計量F=9 501.770,顯著性p<0.05,表明該回歸方程顯著性較強,特征變量對主蒸汽流量影響性很強。將特征變量依次設為x1,x2,…,x6,主蒸汽流量設為y,可得:y=0.424x1+0.030x2+0.042x3-0.071x4-6.986x5+0.447x6+58.385。

3.2 實驗環境

實驗總計使用11 萬條電廠運行數據,預測模型中包括被選入訓練集的九萬個數據,和被隨機選入測試集用來評估模型效果的兩萬個數據。Hadoop集群實驗硬件平臺選用三臺主機,包含一臺主節點和兩臺副節點。

3.3 算法評估與比較

根據均方根誤差(RMSE)、平均絕對誤差(MAE)以及平均百分比誤差(MAPE)三種評價指標評價所有模型,定義如下:

為了全面評估CNN-ABC-BiGRU 模型的預測效果,將其與CNN-BiGRU[15]、BiGRU、GRU[16]、LSTM、BP五種常見的預測方法進行預測性能比較。

3.4 預測結果分析

使用特征篩選后的數據集對提出的組合模型與其他對比模型進行訓練和測試,所得預測結果如圖3、4 所示。

圖3 日期A預測曲線與真實曲線對比

圖3 中的主蒸汽流量波動較大,在21-30 個采樣點區間內,主蒸汽流量值從220.736 16 t/h 增加到236.267 78 t/h 又減少到222.145 31 t/h,只有CNNABC-BiGRU 模型GRU 實現了準確跟蹤變化趨勢。圖4 中的主蒸汽流量值較為平穩,除BP 算法以外,其余五種算法預測曲線都貼合真實值變化趨勢,其中CNN-ABC-BiGRU 模型預測曲線最接近真實值曲線。對比結果表明,自適應CNN-ABC-BiGRU 模型在預測變化范圍較大和近乎穩定的數據時,都具有良好的預測性能。

圖4 日期B預測曲線與真實曲線對比

如表2-3 所示,在兩天的預測結果中,所提組合模型相較于其他模型,具有最小的均方根誤差、平均絕對誤差和平均百分比誤差。

表2 2020年10月8日對比實驗結果

表3 2021年3月8日對比實驗結果

在六種模型的預測誤差對比中,深度學習模型誤差小于機器學習模型誤差,具體表現為深度學習的組合模型誤差最小,單一模型次之,機器學習模型誤差最大。在主蒸汽流量值波動較大的第一天,深度學習模型與機器學習模型誤差結果對比更為明顯,主蒸汽流量值較為平穩的第二天差距較小。產生這種結果的原因是,在處理火電廠大數據時,深度學習模型利用訓練集大量特征數據動態地進行學習,學習動態特征與預測目標之間的內在規律,在解決非線性波動問題時表現效果更好。

分布式訓練與單機訓練用時比較如圖5 所示。

圖5 分布式CNN-ABC-BiGRU算法訓練與單機用時對比

傳統單機CNN-ABC-BiGRU 算法運算用時表現為一次函數趨勢,樣本數量小于60 000 個時,單機運算和通過分布式運算用時相差不大,隨著訓練樣本不斷增加,基于Hadoop 的CNN-ABC-BiGRU 算法用時緩慢增加,二者用時差距隨著樣本數量的增加而增大。實驗結果表明,處理火電廠運行積累的大規模數據時,Hadoop 框架下的分布式運算相較于單機運算有效節省訓練時間,能夠更快得出預測結果,具有更好的可行性和高效性。

4 結論

文中面向大數據背景下的工業系統數據分析的現實需求,結合火電廠燃燒系統設備監測大數據的特點構建分布式深度學習模型,研究結果表明:

1)將CNN-ABC-BiGRU 網絡用于設備健康預測,避免了單一預測模型難以獲得最優結果的問題。

2)基于Hadoop 框架的算法訓練相較于傳統單機算法有效縮短模型訓練時間,實時處理速度相較于傳統的數據分析平臺顯著提升,對比結果表明了該方法的優越性。

3)該數據分析體系結合深度學習建模方法的提出為電力生產數據的處理提供了研究方向,實時追蹤鍋爐系統的動態運行過程,預測性維護可應用于故障檢測、工業設備評估等方面。在后續的研究中,可通過增加集群數量,對建模方法進行進一步優化研究。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产微拍一区二区三区四区| 在线欧美一区| 国产正在播放| 日本色综合网| 五月婷婷综合在线视频| 91综合色区亚洲熟妇p| 韩国自拍偷自拍亚洲精品| 四虎永久免费在线| 国产欧美日韩视频一区二区三区| 亚洲伊人电影| 国产精品hd在线播放| 2021天堂在线亚洲精品专区| 国产欧美日韩另类精彩视频| 亚瑟天堂久久一区二区影院| 久久久受www免费人成| 欧美视频在线不卡| 欧美福利在线| 91九色最新地址| 一区二区无码在线视频| 青青草国产一区二区三区| 亚洲综合婷婷激情| 欧美一道本| av一区二区无码在线| 91精品伊人久久大香线蕉| 欧美综合区自拍亚洲综合天堂| 9啪在线视频| 色窝窝免费一区二区三区 | 欧美日本中文| 97久久超碰极品视觉盛宴| 日本国产在线| 91丝袜美腿高跟国产极品老师| 在线无码av一区二区三区| 国产激情第一页| 国产菊爆视频在线观看| 久久精品国产国语对白| 国产黄网永久免费| 精品无码人妻一区二区| 国产一级做美女做受视频| 国产综合在线观看视频| 久久精品一卡日本电影| 亚洲综合久久成人AV| 午夜激情福利视频| 男人天堂亚洲天堂| 国产精品自拍合集| 国产成人综合亚洲网址| 国产欧美日韩视频怡春院| 亚洲美女一区二区三区| 久久久久亚洲精品无码网站| 国产xx在线观看| 免费A级毛片无码免费视频| 超清人妻系列无码专区| 伊人91视频| 色国产视频| 亚洲人人视频| 久久久久久午夜精品| 天天干天天色综合网| 精品国产美女福到在线直播| 一级看片免费视频| 亚洲精品桃花岛av在线| 91麻豆精品国产高清在线| 国产91视频观看| 亚洲AⅤ无码国产精品| 亚洲欧美自拍视频| 国产精品区视频中文字幕| 国产成人夜色91| 成人福利免费在线观看| 精品综合久久久久久97超人| 欧美性爱精品一区二区三区 | 天天爽免费视频| 国产一级在线观看www色| 精品国产成人三级在线观看| 免费国产黄线在线观看| 中文字幕在线日韩91| 国产成年无码AⅤ片在线| 狠狠色婷婷丁香综合久久韩国 | 国产麻豆另类AV| 亚洲国产成人自拍| 亚洲中文在线看视频一区| 亚洲精品欧美日本中文字幕| 国产美女丝袜高潮| 午夜性刺激在线观看免费| 国产高颜值露脸在线观看|