999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于多因素的LSTM瓦斯?jié)舛阮A(yù)測模型*

2022-03-07 08:02:16楊超宇
關(guān)鍵詞:特征模型

劉 瑩,楊超宇

(安徽理工大學(xué) 經(jīng)濟(jì)與管理學(xué)院,安徽 淮南 232001)

0 引言

煤礦井下開采地質(zhì)條件復(fù)雜。采礦過程中,在煤體地應(yīng)力和煤層瓦斯壓力的作用下,煤礦可能會出現(xiàn)煤層瓦斯向礦井采掘空間噴出的現(xiàn)象[1-4],某些征兆現(xiàn)象的難以察覺易使井下喪失事故最佳防范期[5]。

在煤礦瓦斯涌出量預(yù)測方面,學(xué)者們提出了許多算法模型,如隨機(jī)森林[6]、回歸樹[7]、支持向量機(jī)(SVM)算法[8]、神經(jīng)網(wǎng)絡(luò)算法[9]、多元線性回歸[10]等。郭瑞等[11]提出利用信息融合技術(shù)和遺傳支持向量機(jī)(GA-SVM)相結(jié)合的算法,該算法使用遺傳算法(GA)的全局優(yōu)化能力對支持向量機(jī)(SVM)進(jìn)行參數(shù)和特征向量的最佳組合查找,以達(dá)到對SVM優(yōu)化的目的;李超群等[12]基于集成學(xué)習(xí)的思想,采用將SVM與模型樹(Model Tree)相結(jié)合的方法,并利用交叉驗(yàn)證法對模型進(jìn)行訓(xùn)練和驗(yàn)證,獲得更具泛化能力和預(yù)測準(zhǔn)確性的瓦斯?jié)舛阮A(yù)測模型。為解決經(jīng)典CART回歸算法泛化性能差、易過擬合的缺陷,劉鵬等[13]利用SVM在回歸樹的葉節(jié)點(diǎn)部分進(jìn)行建模的方式,建立瓦斯涌出量的預(yù)測量化模型,該方法不但防止過擬合的發(fā)生,同時提高模型穩(wěn)定性、預(yù)測精度;劉曉悅等[14]在云計(jì)算的基礎(chǔ)上運(yùn)用Elman神經(jīng)網(wǎng)絡(luò)算法構(gòu)建瓦斯?jié)舛阮A(yù)測模型,通過遺傳算法優(yōu)化Elman神經(jīng)網(wǎng)絡(luò),并以該模型對海量數(shù)據(jù)進(jìn)行訓(xùn)練,該模型能夠在短期預(yù)測煤礦瓦斯?jié)舛确矫姹WC高效性,同時也確保了預(yù)測精度;張震等[15]在瓦斯歷史數(shù)據(jù)的基礎(chǔ)上,將LSTM算法應(yīng)用到礦井瓦斯?jié)舛阮A(yù)測,該方法的瓦斯?jié)舛阮A(yù)測曲線能夠高度吻合監(jiān)測數(shù)據(jù)曲線,但是,模型只考慮了瓦斯歷史數(shù)據(jù),忽略了其他井下環(huán)境因素對瓦斯?jié)舛茸兓挠绊憽?/p>

由此可見,在瓦斯預(yù)測領(lǐng)域,瓦斯?jié)舛阮A(yù)測方法多為單因素分析,并沒有考慮在當(dāng)前時間和空間中的其他環(huán)境影響因素。LSTM模型的應(yīng)用只根據(jù)單因素預(yù)測,且大都應(yīng)用在小樣本范圍。本文提出基于多因素的LSTM瓦斯?jié)舛阮A(yù)測模型,在融合井下多源監(jiān)測大數(shù)據(jù)的基礎(chǔ)上,通過巷道風(fēng)速、井下溫度、井下CO濃度、歷史瓦斯?jié)舛葦?shù)據(jù)分析出影響瓦斯?jié)舛茸兓臀磥碲厔莸奶卣鳎诰虺龆嘣幢O(jiān)測數(shù)據(jù)中的時間特征和空間因素特征,多步預(yù)測未來瓦斯?jié)舛融厔荨?/p>

1 LSTM網(wǎng)絡(luò)模型

長短期記憶(Long short-term memory,LSTM)網(wǎng)絡(luò)在處理序列數(shù)據(jù)時,能夠避免RNN的梯度爆炸和梯度消失問題。LSTM的關(guān)鍵在于神經(jīng)單元的信息狀態(tài),神經(jīng)單元的信息流傳通過3個邏輯門(遺忘門、輸入門、輸出門)控制,LSTM的網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。

圖1 LSTM網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 LSTM network structure

LSTM網(wǎng)絡(luò)的信息處理過程可用式(1)~(6)表達(dá):

ft=σ(Wf·[ht-1,xt]+bf)

(1)

it=σ(Wi·[ht-1,xt]+bi)

(2)

(3)

(4)

ot=σ(Wo·[ht-1,xt]+bo)

(5)

ht=ot·tanh(Ct)

(6)

2 基于多因素的LSTM瓦斯?jié)舛阮A(yù)測模型構(gòu)建

基于多因素的LSTM瓦斯?jié)舛阮A(yù)測模型的構(gòu)建主要包括6個模塊:獲取數(shù)據(jù)、多源數(shù)據(jù)預(yù)處理、特征工程、模型的構(gòu)建、模型的訓(xùn)練和優(yōu)化、模型的預(yù)測。

模型首先從數(shù)據(jù)庫中獲取井下CO濃度、溫度、風(fēng)速、瓦斯?jié)舛鹊木聜鞲衅鲾?shù)據(jù),將數(shù)據(jù)按照數(shù)據(jù)產(chǎn)生時刻進(jìn)行數(shù)據(jù)融合,構(gòu)成完整的樣本數(shù)據(jù)。其次,將數(shù)據(jù)中的異常值、缺失值、調(diào)校值等進(jìn)行數(shù)據(jù)預(yù)處理。然后,將樣本數(shù)據(jù)經(jīng)過特征工程處理,如:特征衍生、時間序列數(shù)據(jù)監(jiān)督化、無量綱化,使得樣本特征維度增加,同時將時間序列數(shù)據(jù)集轉(zhuǎn)化為機(jī)器學(xué)習(xí)的有監(jiān)督學(xué)習(xí)任務(wù)的數(shù)據(jù)集。接著,通過經(jīng)驗(yàn)法和逐步試錯法確定LSTM網(wǎng)絡(luò)的隱藏層神經(jīng)元的數(shù)目以及其他各個參數(shù)。最后,模型進(jìn)行訓(xùn)練、驗(yàn)證和測試,并且預(yù)測瓦斯?jié)舛取;诙嘁蛩氐腖STM瓦斯?jié)舛阮A(yù)測模型的主要構(gòu)建流程如圖2所示。

圖2 模型流程Fig.2 Model flow chart

2.1 多源監(jiān)測數(shù)據(jù)預(yù)處理

1)數(shù)據(jù)融合:煤礦井下傳感器類型多、數(shù)量大,每個傳感器每天產(chǎn)生大量的數(shù)據(jù)。因此,對井下監(jiān)測數(shù)據(jù)進(jìn)行分類、整理、選擇,以及多源數(shù)據(jù)的融合是使井下監(jiān)測數(shù)據(jù)產(chǎn)生價值的前提。本文選擇井下CO濃度、溫度、風(fēng)速、瓦斯?jié)舛鹊膫鞲衅鲾?shù)據(jù),對其整理、融合,構(gòu)成完整的數(shù)據(jù)樣本。

2)缺失值處理:瓦斯監(jiān)測數(shù)據(jù)中存在大量的缺失數(shù)據(jù),倘若將存在缺失值的樣本刪除,將會破壞時間序列數(shù)據(jù)的序列性、數(shù)據(jù)平穩(wěn)性,還會由于數(shù)據(jù)樣本過小而導(dǎo)致模型訓(xùn)練不足,最終導(dǎo)致預(yù)測效果差的現(xiàn)象。本模型采用缺失數(shù)據(jù)向前補(bǔ)齊的方法,用前1個非缺失值去填充該缺失值。

2.2 模型數(shù)據(jù)特征分析

1)特征衍生:由于原始的瓦斯監(jiān)控?cái)?shù)據(jù)中,樣本數(shù)據(jù)特征數(shù)量較少,且多為低效特征。為了最大限度提取瓦斯監(jiān)控?cái)?shù)據(jù)中的特征信息以供LSTM算法訓(xùn)練模型,采用特征多項(xiàng)式融合法衍生新特征。特征多項(xiàng)式融合法不但可以得到交叉項(xiàng)特征,還可以得到高次項(xiàng)特征。多項(xiàng)式特征的衍生將低維特征進(jìn)行組合,得到高維特征,使得LSTM模型更大程度地捕捉數(shù)據(jù)的基本關(guān)系,“學(xué)習(xí)”更多的數(shù)據(jù)信息。特征衍生表達(dá)式如式(7)~(8)。

(7)

(8)

式中:Poly()n為n階特征衍生;a,b,c為數(shù)據(jù)集的3個特征;Numnew為新衍生的特征數(shù)量。

本文中,原始數(shù)據(jù)特征數(shù)量為3,經(jīng)過三階多項(xiàng)式增項(xiàng)后,得到的特征數(shù)量為19,其中新特征數(shù)目為16。

2)有監(jiān)督化:由于瓦斯?jié)舛仁芏鄠€環(huán)境因素影響,且通過歷史數(shù)據(jù)的變化趨勢預(yù)測未來的發(fā)展,因此,為了充分考慮影響瓦斯?jié)舛鹊臅r空特性,將一定滯后期的瓦斯?jié)舛葦?shù)據(jù)作為新的特征信息,使模型將數(shù)據(jù)的時間性特征和空間因素特征充分學(xué)習(xí)。同時,將樣本的時間序列數(shù)據(jù)組合成成對的輸入輸出格式,將時間序列預(yù)測問題轉(zhuǎn)化為監(jiān)督學(xué)習(xí)問題。

本文將滯后期為20的瓦斯?jié)舛茸鳛閠時刻的時間性特征,與3個環(huán)境因素特征經(jīng)特征衍生后得到的19個特征共同構(gòu)成模型的特征,處理后的樣本數(shù)據(jù),見表1。表1中的3個樣本數(shù)據(jù)均由39個特征數(shù)據(jù)和1個對應(yīng)的實(shí)測瓦斯?jié)舛?jw)數(shù)據(jù)組成。

表1 處理后的樣本數(shù)據(jù)示例Table 1 Examples of sample data after processing

3)無量綱化:由于數(shù)據(jù)中涉及多個可能影響瓦斯?jié)舛鹊闹笜?biāo),每個指標(biāo)的數(shù)值范圍不同。為了統(tǒng)一指標(biāo)數(shù)值對模型產(chǎn)生的影響,本文使用數(shù)據(jù)歸一化的方法對樣本數(shù)據(jù)無量綱化,歸一化數(shù)學(xué)表達(dá)如式(9):

(9)

式中:x為某個指標(biāo)特征無量綱化前的數(shù)據(jù)值;max,min分別為該指標(biāo)在所有樣本中的最大值、最小值;x′為該指標(biāo)無量綱化后的數(shù)據(jù)值。

2.3 樣本數(shù)據(jù)集劃分

樣本數(shù)據(jù)在輸入模型之前,需要將數(shù)據(jù)分割為訓(xùn)練數(shù)據(jù)集、驗(yàn)證數(shù)據(jù)集、測試數(shù)據(jù)集。為了保持時間序列數(shù)據(jù)的時間相關(guān)性,數(shù)據(jù)分割時不能采用隨機(jī)分割的方式。本文將2個數(shù)據(jù)分割點(diǎn)插入瓦斯?jié)舛葧r間序列數(shù)據(jù),第1個分割點(diǎn)前的序列樣本數(shù)據(jù)作為訓(xùn)練集,第1個分割點(diǎn)和第2分割點(diǎn)間的樣本數(shù)據(jù)作為驗(yàn)證集,第2分割點(diǎn)后的數(shù)據(jù)作為測試集。

2.4 LSTM模型構(gòu)建

本文基于多因素的LSTM瓦斯?jié)舛阮A(yù)測模型的實(shí)現(xiàn)基于python語言的keras庫完成。LSTM模型的結(jié)構(gòu)主要分為3部分:數(shù)據(jù)輸入層、隱藏層、結(jié)果輸出層。LSTM模型的隱藏層數(shù)目為1,隱藏層神經(jīng)元個數(shù)通過逐步試錯法進(jìn)行確定,輸出層神經(jīng)元個數(shù)為1。模型輸入數(shù)據(jù)結(jié)構(gòu)為(1,39),其循環(huán)層間斷開神經(jīng)元的比例設(shè)置為0.6,模型優(yōu)化器選用Adam,完成模型的自適應(yīng)學(xué)習(xí)率的參數(shù)更新過程。模型損失函數(shù)選用平均絕對誤差MAE(Mean Absolute Error),計(jì)算瓦斯?jié)舛阮A(yù)測值距離真實(shí)值的偏差。模型訓(xùn)練的epochs為200輪,batch_size為72,其余參數(shù)采用默認(rèn)參數(shù)。

本文借鑒文獻(xiàn)[15]中的經(jīng)驗(yàn)法計(jì)算出隱藏層神經(jīng)元的數(shù)量,在經(jīng)驗(yàn)法確定神經(jīng)元數(shù)量范圍的基礎(chǔ)上,采用逐步試錯法選擇模型的最小均方根誤差,從而確定預(yù)測模型的隱藏層神經(jīng)元數(shù)量。確定隱藏層神經(jīng)元數(shù)目范圍的經(jīng)驗(yàn)計(jì)算公式如式(10):

(10)

式中:a,b為神經(jīng)網(wǎng)絡(luò)模型數(shù)據(jù)輸入層、結(jié)果輸出層的神經(jīng)元數(shù)量;c為整數(shù),取值范圍為1~10;q為根據(jù)公式計(jì)算確定的隱藏層神經(jīng)元數(shù)量。

基于多因素的LSTM瓦斯?jié)舛阮A(yù)測模型的預(yù)測性能指標(biāo)選用均方根誤差RMSE(Root Mean Squard Error)和MAE,RMSE和MAE的公式如式(11)和(12):

(11)

(12)

3 實(shí)驗(yàn)與分析

實(shí)驗(yàn)數(shù)據(jù)來自貴州省某煤礦的10901工作面的2021年1月14日10時49分至2021年4月9日19時26分的井下CO濃度、風(fēng)速、溫度、瓦斯?jié)舛缺O(jiān)測數(shù)據(jù),樣本數(shù)據(jù)量為103 779條。井下監(jiān)測數(shù)據(jù)經(jīng)過數(shù)據(jù)融合、數(shù)據(jù)預(yù)處理和特征工程后,得到樣本條數(shù)為102 759條,其中訓(xùn)練集樣本大小為99 650條,驗(yàn)證集樣本大小為2 034條,測試集樣本為1 075條。

LSTM模型設(shè)計(jì)的重要步驟是隱藏層節(jié)點(diǎn)數(shù)目的確定,本文根據(jù)公式(10)計(jì)算LSTM模型的隱藏層神經(jīng)元數(shù)量。當(dāng)前數(shù)據(jù)輸入層神經(jīng)元數(shù)目為39,結(jié)果輸出層神經(jīng)元數(shù)目為1,則LSTM隱藏層神經(jīng)元的數(shù)量可取范圍為7~17。使用逐步試錯法確定LSTM隱藏層神經(jīng)元數(shù)量。基于多因素的LSTM瓦斯?jié)舛阮A(yù)測模型在不同隱藏層神經(jīng)元數(shù)目下的模型測試誤差如圖3所示。

圖3 不同神經(jīng)元數(shù)量下的模型誤差Fig.3 Diagram of model errors under different numbers of neuron

由圖3可得:當(dāng)隱藏層神經(jīng)元數(shù)目為15時,RMSE為0.021,MAE為0.01,模型綜合誤差最小。因此,基于多因素的LSTM瓦斯?jié)舛阮A(yù)測模型的隱藏層神經(jīng)元數(shù)目確定為15。

3.1 模型預(yù)測性能

為了對比LSTM單變量預(yù)測模型、RNN預(yù)測模型與基于多因素的LSTM瓦斯?jié)舛阮A(yù)測模型的瓦斯?jié)舛阮A(yù)測性能,使用相同的數(shù)據(jù)集,對這3個模型進(jìn)行瓦斯?jié)舛阮A(yù)測實(shí)驗(yàn)。實(shí)驗(yàn)采取控制變量法,模型取滯后期為20的瓦斯?jié)舛葦?shù)據(jù)作為時間特征。使用測試樣本集進(jìn)行預(yù)測效果的對比,圖4為利用相同井下傳感器監(jiān)控?cái)?shù)據(jù)進(jìn)行RNN模型、LSTM單變量模型、基于多因素的LSTM瓦斯?jié)舛阮A(yù)測模型進(jìn)行預(yù)測的效果圖。其中,LSTM單變量模型、基于多因素的LSTM瓦斯?jié)舛阮A(yù)測模型的隱藏層神經(jīng)元數(shù)目均為15。由于測試集樣本數(shù)量較大,將前200條樣本數(shù)據(jù)進(jìn)行對比。

圖4 不同模型的瓦斯預(yù)測效果Fig.4 Gas prediction effect of different models

表2為模型預(yù)測的誤差和模型訓(xùn)練及預(yù)測所耗時。

由圖4和表2可知:在不同模型預(yù)測過程中,RNN模型耗時最短,其次是LSTM單變量模型,最后是LSTM多因素模型;但是在模型預(yù)測的RMSE,MAE誤差上,LSTM多因素模型預(yù)測誤差最小,其次是LSTM單變量模型,最后是RNN模型。雖然LSTM多因素模型在模型訓(xùn)練時耗時更長,但是模型的預(yù)測準(zhǔn)確性更高。

表2 模型預(yù)測性能對比Table 2 Comparison of model prediction performance

3.2 長期、短期瓦斯?jié)舛阮A(yù)測

長期瓦斯?jié)舛阮A(yù)測中,取間隔期為20個序列點(diǎn)前的滯后期數(shù)據(jù);短期預(yù)測取最近的滯后期數(shù)據(jù),長期和短期瓦斯預(yù)測滯后期均為10,20,30,40,50,60。長期和短期的瓦斯?jié)舛阮A(yù)測RMSE,MAE如圖5所示。從總體上看,短期預(yù)測中,LSTM多因素模型的瓦斯?jié)舛阮A(yù)測誤差在RMSE和MAE的誤差均為最小。在短期預(yù)測時,滯后期為10和60時,LSTM單變量和多因素預(yù)測結(jié)果不相上下,但是在長期預(yù)測過程中,LSTM多因素預(yù)測誤差均遠(yuǎn)小于LSTM單變量和RNN,說明LSTM多因素預(yù)測模型在長期預(yù)測中更有優(yōu)勢。

圖5 不同時間間隔預(yù)測Fig.5 Prediction under different time intervals

4 結(jié)論

1)通過融合多源監(jiān)測數(shù)據(jù),為模型提供了多個影響瓦斯?jié)舛茸兓沫h(huán)境因素,結(jié)合LSTM網(wǎng)絡(luò)模型,高效地預(yù)測未來瓦斯?jié)舛鹊淖兓厔荨?/p>

2)利用特征多項(xiàng)式衍生新特征,將環(huán)境因素特征和歷史瓦斯?jié)舛葧r間性特征相結(jié)合,產(chǎn)生交叉項(xiàng)特征和高次項(xiàng)特征,使得模型充分挖掘監(jiān)控?cái)?shù)據(jù)中的信息。

3)將瓦斯?jié)舛葧r間序列預(yù)測問題轉(zhuǎn)化為監(jiān)督學(xué)習(xí),既避免了人工標(biāo)注成本,又通過機(jī)器學(xué)習(xí)找到特征和標(biāo)簽之間的更多隱藏聯(lián)系,使模型充分挖掘數(shù)據(jù)中的信息,提高模型的預(yù)測性能。

4)與LSTM單變量模型、RNN模型相比,基于多因素的LSTM瓦斯?jié)舛阮A(yù)測模型在瓦斯?jié)舛乳L期預(yù)測中更具優(yōu)勢。

猜你喜歡
特征模型
一半模型
抓住特征巧觀察
重要模型『一線三等角』
新型冠狀病毒及其流行病學(xué)特征認(rèn)識
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
如何表達(dá)“特征”
不忠誠的四個特征
抓住特征巧觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
主站蜘蛛池模板: 午夜少妇精品视频小电影| 最新亚洲人成无码网站欣赏网 | 亚洲Av激情网五月天| 91精品小视频| 这里只有精品在线播放| 日韩高清中文字幕| 青青青草国产| 91人人妻人人做人人爽男同| 久久中文字幕av不卡一区二区| 色有码无码视频| 成人福利在线视频| 亚洲高清中文字幕| 国内精品视频| 国产欧美综合在线观看第七页| 波多野结衣的av一区二区三区| 国产成人喷潮在线观看| 欧美性天天| 亚洲IV视频免费在线光看| 在线精品自拍| 成人国产小视频| 国产剧情国内精品原创| 鲁鲁鲁爽爽爽在线视频观看 | 老司机精品一区在线视频| 乱色熟女综合一区二区| 亚洲欧美自拍视频| AV在线天堂进入| 免费高清a毛片| 色男人的天堂久久综合| 国产91无码福利在线| 国产乱子伦手机在线| 在线色综合| 九九久久99精品| 人人看人人鲁狠狠高清| 无码aaa视频| 国产中文在线亚洲精品官网| 色丁丁毛片在线观看| 国产第四页| 自偷自拍三级全三级视频| 玖玖精品在线| 日本一本在线视频| 中文字幕在线永久在线视频2020| 日本午夜网站| AV熟女乱| 高清色本在线www| 亚洲国产午夜精华无码福利| 国产欧美日韩在线一区| 在线观看精品自拍视频| 噜噜噜久久| 国产在线第二页| 亚洲另类色| 永久免费av网站可以直接看的| 无码一区二区三区视频在线播放| 国产精品一区二区无码免费看片| 欧美www在线观看| 国产另类视频| 日本午夜影院| 91成人在线观看视频| 亚洲AV无码乱码在线观看代蜜桃| 一本大道东京热无码av| 久久网综合| 久草青青在线视频| 91在线丝袜| 欧美一级特黄aaaaaa在线看片| 日韩在线第三页| 免费观看无遮挡www的小视频| 97青草最新免费精品视频| 国产成人亚洲无吗淙合青草| 久久性妇女精品免费| 国产亚洲精品va在线| www成人国产在线观看网站| 亚洲91精品视频| 成人亚洲国产| 亚洲无线观看| 久久99国产精品成人欧美| 国产精品福利导航| 成人国产精品视频频| 久青草免费在线视频| 国产精品yjizz视频网一二区| 亚洲美女一级毛片| 成人年鲁鲁在线观看视频| 成人看片欧美一区二区| 亚洲av无码片一区二区三区|