999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于RVM-GRNN組合模型的天然氣負荷預測研究

2023-02-18 05:36:04邵必林
軟件導刊 2023年1期
關鍵詞:模型

邵必林,劉 通,饒 媛

(西安建筑科技大學 管理學院,陜西 西安 710055)

0 引言

隨著中國城市化進程加快,我國能源面臨匱乏問題,環境與資源代價高昂。煤炭、石油等傳統能源一方面因過度開采而儲存量越來越少,另一方面也給環境帶來了巨大污染,因此發展低碳經濟、開發清潔能源、減少大氣排放成為長遠發展的必然要求。天然氣作為一種清潔能源,因其排放的溫室氣體較低,并且沒有硫化物等污染物排放而逐漸受到關注。2020 年,我國天然氣產量為1 925 億立方米,同比增長9.8%,天然氣探明新增地質儲量1.29 萬億立方米,我國天然氣能源儲量豐富。但是隨著天然氣使用的逐漸普及,許多城市已出現天然氣供求矛盾,“氣荒”問題日益嚴重。因此,合理把握天然氣用戶用氣規律,分析影響用戶需求的各種因素,對天然氣負荷值進行預測是當前亟待解決的問題。

通過對國內外文獻進行梳理發現,現有天然氣負荷預測模型主要分為單一模型和組合預測模型兩種。單一模型的天然氣負荷預測主要分為兩個階段,第一階段主要是通過傳統數理統計、相關性分析和回歸分析進行預測分析。Sarak等[1]將度日法應用于天然氣負荷預測,將城市的度日、人口和居民分布記錄用來估計全國范圍的天然氣需求,結果表明,該種方法能夠定位能源需求分布。Ding[2]設計一種自適應灰色預測模型,對比于傳統灰色模型,改進模型的擬合性能和預測性能優于原始模型。Ying 等[3]在自回歸模型中加入外生變量,提高了模型計算效率。第二階段是在人工智能、大數據、機器學習背景下,使用群智能算法、機器學習算法等進行預測分析。2012 年,Demirel[4]運用多元回歸模型、ARMAX 模型和BP 神經網絡對天然氣負荷進行預測,通過預測結果比較發現,相較于ARMAX 和多元線性模型而言,BP 神經網絡預測效果更好。Kodogiannis 等[5]用乘法小波神經網絡代替模糊規則的THEN 部分,提出一種新型的神經網絡模型,通過與傳統神經網絡相比,本文提出的負荷預測模型具有更高的準確性。Szoplik[6]、Laib[7]、Taspinar[8]對多層神經網絡進行設計和訓練,比較了使用多層神經網絡模型在隱層神經元數量和訓練過程中使用的數據集大小方面的預測結果,實驗證明,該模型可用于任何情況。郭琳[9]對比分析了LSTM 模型、GM 模型、SVM 模型和BP 神經網絡對燃氣負荷預測的效果,結果證明LSTM 模型在燃氣負荷預測領域優于其他3 個模型。王晨[10]對比分析了PCA-WNN 模型與BP 神經網絡、灰色預測模型、廣義回歸模型預測效果,最終確定PCA-WNN 模型在精確性和運算速度上具有優勢。舒漫[11]建立基于XGBoost 算法的成都市城市燃氣日負荷及季度負荷預測模型,首次將XGBoost 算法應用于燃氣負荷領域。何恒根[12]針對BP 神經網絡預測時間長的缺點,采用主成分分析法進行數據降維,減少BP 神經網絡預測時間。黃維[13]在深度信念神經網絡中添加了自適應學習率,補足了傳統的DBN 在預訓練和調優過程中注重調節w和b的值,忽視學習率的缺點。

組合預測法一般分為橫向和縱向兩種:橫向是將數據分解,使用不同的方法分別預測,最后相加;縱向是將前一種模型的預測結果當作數據集,輸入后面的模型進行訓練和預測。組合模型法可以將多種模型的優點集合起來,缺點是預測時間長、模型建立復雜度高。Sánchez-úbeda等[14]提出一種分解組合模型,該方法結合了預測模型的簡單表示,使專家能夠綜合判斷分析和統計預測調整情況,具有較高的計算效率和準確性。Forouzanfar 等[15]將Logistic 方法與自然語言處理和遺傳算法結合,實驗結果證明了Logistic 函數可以應用于天然氣預測領域。Liu 等[16]提出一種基于多小波變換和多神經網絡的短期負荷預測方法。仿真結果表明,組合的負荷預測模型精度高于任何一個單一的網絡模型和未經多小波變換預處理的3 種神經網絡組合預測模型。Zhu 等[17]提出一種基于SVR 的支持向量回歸局部預測方法和FNF-SVRLP 局部預測方法,對天然氣短期需求進行預測,與單一模型相比,該模型具有更高的預測精度。Zhang[18]提出一種貝葉斯模型平均組合預測天然氣消費量的方法,其能夠有效地處理模型結構和參數的不確定性,提高預測精度。Wang 等[19]將非線性模型與線性模型相結合,建立了自回歸綜合移動平均模型,有效地融合了線性模型和非線性模型的優點,提高了預測性能。劉媛華[20]將BP 神經網絡和SVR 兩種方法加以組合并對空氣質量指數進行預測,實驗證明,該模型泛化能力更強。朱青等[21]將LSTM 和XGBoost 兩種模型進行組合,實驗結果表明組合模型的RMSE 低于3種單一模型。

以上方法沒有考慮不同階段的天然氣負荷值變化規律,以及未提出精確度更高的預測模型。針對該問題,本文采用RVM 模型與GRNN 模型組合的形式進行不同階段的天然氣負荷預測。相關向量機模型(RVM)對天然氣負荷數據線性部分具有良好的分析能力。廣義回歸神經網絡(GRNN)能夠很好地適應非線性映射,具有不容易過擬合、泛化錯誤率低、結果易解釋的優勢。

1 相關理論基礎

1.1 RVM模型

相關向量機(Relevance Vector Machine,RVM)是由Tipping[22]在2001 年提出的機器學習算法,該模型基于貝葉斯框架指導,保留相關向量點。貝葉斯理論是在先驗概率約束條件下,經過自身相關運算去除沒有關系的點,最后獲得一個稀疏化模型。相關向量機模型在對數據進行訓練預測的過程中,許多參數的后驗概率值會逐漸接近于零,而這些數據實際上與天然氣負荷預測沒有關系,僅有較少數量的數據點即相關向量參數的后驗概率非零,對模型預測起關鍵作用,原理如式(1)所示。其中,z為目標變量,x為輸入數據,λ為權值,θ為數據噪聲精度,值為σ-2。

其中,y(x)為均值,由線性模型給出,模型如式(2)所示。其中,k(x,xn)為核函數,b為偏置參數。

在相關向量機中,若對輸入向量進行N 次檢測,與之對應的目標值為z=(z1,z2,…zN)T,其似然函數為如(3)所示。

對零均值以下的高斯先驗而言,由于線性模型與相關向量機的先驗概率部分相似,故需加以考慮,權參數向量λ先驗函數如式(4):

式(4)中,αi是參數λi的精度值,超參矩陣為α=(α1,α2,…,αM)T。通常需對α進行賦值,這也意味著每個參數精度的初始值相同。超參數矩陣與相對應的權參數后驗概率值成反比關系,即超參數矩陣增大時,后驗概率值便會不斷減小,當其后驗概率越小,與它有關的函數預測作用率也越低,需將其刪掉,因而新的概率檢驗模型會呈現出稀疏化的形式。

經過實驗發現,將相關向量機模型與線性模型結合,其權值參數后驗概率分布仍符合高斯分布,結果如式(5)所示。其中,μ為均值,∑為方差。

對于α、θ的最優值,可以使用第二類最大似然方法進行確定。該方法是將邊緣似然函數進行最大化得到,邊緣似然最大化如式(6)所示,其中,z=(z1,z2,…zN)T。

通過對上式進行對數求導可實現目標最大化,從而求出超參數α、θ最優解,求解結果如式(7)所示。其中,μi為均值μ的第i個向量分量,δi=1 -為協方差矩陣對應的第i個元素。

1.2 GRNN模型

廣義回歸神經網絡(General Regresion Neural Network,GRNN)是由Specht[23]于1991 年提出的一種新型網絡結構。對比于傳統神經網絡,廣義回歸神經網絡采用最大概率原則計算神經網絡輸出,因此該網絡具有很強的非線性映射能力,對非線性數據的預測優于一般徑向基函數,在樣本較多或較少時都具有很好的學習能力。

廣義回歸神經網絡結構有輸入層、模式層、求和層和輸出層4 種,其計算邏輯如式(8)所示。其中,X是訓練集的輸入向量;Xi為訓練集中第i個樣本,Xi=表示當前樣本X與Xi間的歐式距離平方。

模式層中,第i個神經元的輸出為X與Xi之間歐式距離平方的指數形式,如式(9)所示,其中,σ為平滑因子。

求和層由兩部分組成。其中,第一部分與輸出向量維數m對應,共有個j=1,2,…,m節點。第j個節點輸出Sj為網絡訓練集中第i=1,2,…,N個樣本的輸出向量Yi=[yi1,yi2,…yim,]T中的第j個元素yij與模式層第i個神經元輸出Pi的加權和(以yij當作模式層中第i個神經元Pi與求和層中第j個神經元間的連接權值),其計算式如式(10)所示。

求和層第二部分只有1 個節點,輸出SD為模式層各節點輸出Pi之和(作為輸出層各節點計算的公共分母項),其計算式如式(11)所示。

輸出層神經元個數與輸入向量Y維數m相同,各神經元的輸出為求和層中兩種求和結果相除,如式(12)所示。

因此,對于廣義回歸神經網絡參數,確定平滑因子σ的值是最重要的工作。

2 基于RVM-GRNN的天然氣負荷預測模型

2.1 影響因素選取

在天然氣負荷的諸多影響因素中,氣象條件是影響其變化的重要因素,主要包含溫度、天氣類型、濕度、降雨量等。溫度是導致氣象敏感負荷變化的主要因素,溫度一般分為日最高溫度、最低溫度和平均溫度。溫度一般與天然氣負荷值呈現負相關關系,特別是對于居民用氣而言,當溫度較低時,取暖用氣以及外出減少、室內活動的增加都會導致天然氣使用量的增大。而天氣類型的變化也會影響人們的出行,進而影響天然氣的使用,比如當天氣類型為晴天時,人們一般會外出,因此天然氣使用量較少,當天氣比較惡劣時,人們會選擇在家里,天然氣使用量較大。此外,還有節假日、突發性事件、商業活動、供熱取暖用氣等因素也對天然氣負荷值有一定影響。但是過多的影響因素會導致預測模型構建復雜、預測時間過長。通過對天然氣負荷影響因素進行皮爾遜相關性分析,然后剔除掉影響因子低的因素,留下相關性高的影響因素用于訓練,這樣既可以減少預測時間,還可以提高預測精度。皮爾遜相關性計算公式如式(13)所示。其中,Rxy表示變量x與變量y的相關性值;n為變量x、y觀測值的數量;xi表示變量x的第i個觀測值,yi表示變量y的第i個觀測值;表示變量x的平均值,表示變量y的平均值。

經過皮爾遜相關系數法分析,各影響因素與天然氣負荷值的相關系數值如表1 所示。當皮爾遜相關系數絕對值小于0.1 時,判斷為影響因素與天然氣負荷值相關性不強,因此本文最終選定影響因素為最高溫度、最低溫度、歷史負荷值、風力值。此外,近年來西安市供熱能源中天然氣所占比例越來越高,西安市集中供熱時間為11 月15 日至次年的3 月15 日。因此,本文將天然氣負荷預測分為兩部分,分別為非供熱階段預測和集中供熱階段預測。

Table 1 Pearson coefficient value of natural gas load influencing factors表1 天然氣負荷影響因素皮爾遜系數值

2.2 數據處理

天然氣負荷值數據樣本的質量和數量會對預測模型的效果產生很大影響。由于數據在采集過程中會出現各種各樣的問題,本文使用的數據處理方法主要有3 種:缺失數據補齊、異常數據修正和數據歸一化。缺失數據補齊主要是依靠樣本之間的相關性修補數據,根據具體變量的實際分布情況采用平均值、眾數、中位數進行修補。異常數據主要是受到一定隨機因素和潛在波動的影響,因此天然氣負荷值的走勢會不同于之前的數據點,對整體負荷序列發展趨勢產生干擾,不利于預測。針對連續突變的異常情況,可以歷史相同日期的正常數據取平均值。未進行歸一化時,由于特征向量中不同特征值的差異很大,會導致預測模型訓練過程中梯度下降方向容易偏離,從而增加了訓練時間并且擬合效果較差。進行歸一化后,數據評價標準統一,避免了小數據值被大數據值吞食。梯度在下降過程中更為平順,會使網絡快速收斂,更快尋找到目標函數的極小值。目前,常見的歸一化方法有Z-score 分數法、最大最小歸一化方法。本文采用最大最小歸一化方法,將原始數據規范到[0,1]區間,其公式如式(14)所示。其中,X為原始天然氣負荷值數據,Xmax、Xmin分別為原始負荷值數據的最大值和最小值,Xnorm為歸一化后的數據。

2.3 RVM-GRNN天然氣負荷預測模型

天然氣負荷數據具有非平穩、周期性波動特點,RVM和GRNN 組合模型能夠擬合數據中線性部分和非線性部分。天然氣負荷數據中線性部分由RVM 模型進行擬合。GRNN 模型則是擬合RVM 模型殘差中的非線性部分。

令Rt為RVM 模型t 時刻的預測結果,Zt為天然氣實際值,gt為t時刻實際值與RVM 模型預測結果的差值,表示為gt=Zt-Rt。{gt}為RVM 模型所有預測差值的集合。{gt}用GRNN 模型進行逼近,其預測結果設為Gt,則組合時間序列預測模型結果如式(15)所示。

RVM-GRNN 天然氣負荷預測模型結構如圖1所示。

Fig.1 RVM-GRNN model structure圖1 RVM-GRNN模型結構

具體建模步驟為:①對天然氣負荷值數據進行預處理,修補缺失值和異常值,并對數據歸一化;②構建RVM天然氣負荷預測模型,輸入訓練集,得到預測結果Rt;③使用實際值Zt減去Rt得到殘差gt;④構建GRNN 殘差預測模型,將殘差gt導入訓練好的GRNN 模型中,進行殘差預測,得到預測結果Gt;⑤將步驟②所得Rt和步驟④所得Gt相加則為RVM-GRNN 模型的預測結果。

2.4 模型檢驗

為檢驗各模型對天然氣負荷預測效果,本文選用平均絕對誤差(MAE)、均方誤差(MSE)及平均絕對誤差百分比(MAPE)3 個指標,計算公式如式(16)—式(18)所示。其中,n 為樣本數量,Zt為天然氣負荷實際值,為天然氣負荷預測值。

3 實例分析

3.1 數據來源

考慮數據完整性和可得性,以西安市某氣站2010-2015 年每日天然氣負荷值為算例,收集天然氣負荷值數據1 826 條,負荷值單位為萬m3/日。根據西安市集中供熱時間段將數據集劃分為非供熱階段和集中供熱階段,其中,非供熱階段數據1 220條,集中供熱階段數據606條。

3.2 比較方法設置

為顯示本文所提組合模型效果,選用天然氣負荷領域預測常用方法BP 神經網絡(Back Propagation Neural Network,BPNN)、多元線性回歸(Multivariable Linear Regression model,MLR)和 極 限 學 習 機(Extreme Learning Machine,ELM)進行比較。BPNN 模型是通過輸入變量對預測值進行擬合,通過賦予輸入向量不同的權重,這種層次結構的正向傳播過程可以得到預測誤差,之后再利用反向傳播法得到各層參數的梯度,根據梯度下降法更新參數,重復這種訓練過程使得預測誤差最小化。MLR 模型在訓練階段計算出天然氣負荷值與影響因素之間的回歸系數,再將需要進行預測時間段的相關數據輸入,得出預測值。ELM 模型具有良好的泛化性能,比起傳統神經網絡模型,其訓練過程簡單、輸入權值和閾值隨機獲得、計算量小,已廣泛應用于各種預測領域。

3.3 模型預測效果

3.3.1 RVM與GRNN模型參數設置

相關向量機的預測效果受到核函數選擇和核參數設置影響,對常用核函數進行對比分析發現,使用柯西核函數預測效果更好,同時使用控制變量法確定核參數,最終確定核寬度為5,迭代次數為30。GRNN 模型參數主要是平滑因子,本文對平滑因子使用交叉驗證的方式進行確定,最終設置為0.1。完成參數設置后,將本文提出的RVM-GRNN 組合模型、RVM 模型及GRNN 模型進行對比,驗證組合模型天然氣負荷預測的有效性。

3.3.2 非供熱階段天然氣負荷預測

非供熱階段天然氣負荷預測使用900條數據作為模型訓練集,100 條數據作為測試集。最終預測結果及評價指標如圖2和表2所示。

Fig.2 Comparison of prediction results of various models of natural gas load in non-heating stage圖2 非供熱階段天然氣負荷各模型預測結果比較

Table 2 Comparison of prediction and evaluation indexes of three models in non-heating stage表2 非供熱階段3種模型的預測評價指標比較

由圖2 可知,3 種模型的預測走勢與天然氣負荷實際值大致相同,但是RVM-GRNN 組合模型比起單一的RVM和GRNN 模型而言,RVM-GRNN 組合模型的天然氣負荷預測效果更優。為了對預測結果作進一步分析,本文使用MAE、MSE、MAPE 3 種評價指標進行判斷,從表2 可以看出,組合模型的MAE、MSE、MAPE 值均小于RVM 和GRNN模型,由此可以斷定RVM-GRNN 組合模型的預測效果更優。

為了驗證本文RVM-GRNN 組合模型的有效性,與傳統常用天然氣負荷預測模型進行比較。圖3 為傳統天然氣負荷預測模型與組合模型的誤差曲線比較,可以看出,組合學習方法的誤差分布點在零附近波動,表明其誤差較小,而傳統天然氣負荷預測模型誤差分布波動較大。

Fig.3 Error comparison of prediction models in non-heating stage圖3 非供熱階段各預測模型誤差比較

從表3 可以看出,傳統模型的評價指標均大于組合模型,進一步證實了組合模型的適用性,預測效果優于傳統模型。

Table 3 Comparison of evaluation indexes of traditional prediction models in non-heating stage表3 非供熱階段傳統預測模型評價指標比較

3.3.3 集中供熱階段天然氣負荷預測

集中供熱階段天然氣負荷預測使用500條數據作為模型訓練集,100 條數據作為測試集,其預測結果及評價指標如圖4和表4所示。

Fig.4 Comparison of prediction results of various models of natural gas load in heating stage圖4 供熱階段天然氣負荷各模型預測結果比較

由圖4 可以看出,在集中供熱階段,天然氣負荷值波動幅度較大,3 種模型中,GRNN 模型預測效果相對較差,有多個數據點的預測值偏差較大,RVM 模型和RVMGRNN 組合模型預測效果較好,預測結果與負荷值走勢相同。從表4 評價指標可以看出,RVM-GRNN 組合模型的MAE、MSE、MAPE 均小于RVM 和GRNN 模型,因而對于供熱階段而言,組合模型優于單一模型,也表明RVM-GRNN組合模型在供熱階段天然氣負荷預測也具有適用性。

Table 4 Comparison of prediction and evaluation indexes of three models in heating stage表4 供熱階段3種模型的預測評價指標比較

集中供熱階段組合模型與傳統預測模型的誤差結果比較如圖5 所示。結果顯示,傳統模型預測誤差波動較大,組合模型預測誤差相對較小。

Fig.5 Error comparison of prediction models in heating stage圖5 供熱階段各預測模型誤差比較

從表5 也可以看出,組合模型的評價指標均小于其他模型,表明在集中供熱階段,組合模型的預測效果依然優于傳統天然氣負荷預測模型。

Table 5 Comparison of prediction error indexes of three models in heating stage表5 供熱階段傳統預測模型的評價指標比較

4 結語

本文在現有天然氣負荷預測研究成果的基礎上,分析了西安市天然氣負荷量在非供熱階段和供熱階段的特征,并利用RVM 和GRNN 組合預測的優化方式,擬合天然氣負荷值的線性和非線性特征。通過與單一模型預測效果進行比較,非供熱階段組合模型的MAPE 比RVM 模型降低7.76%,比GRNN 模型降低16.13%。集中供熱階段組合模型的MAPE 比RVM 模型降低10.29%,比GRNN 模型降低73%。為進一步驗證模型適用性,對組合模型和傳統預測模型預測結果進行比較。數據表明,RVM-GRNN 組合模型預測效果更好,不論是在非供熱階段還是集中供熱階段,組合模型都可以對天然氣負荷值進行準確預測,可以為供氣公司供氣提供指導。但是影響天然氣負荷的影響因素眾多,本文僅考慮了供熱、溫度、歷史負荷和風力等因素。對于天然氣使用而言,還受政策、商業活動、人口流入流出等多種因素影響。因此,后續研究可以考慮引入更多因素,以提高天然氣負荷預測準確性。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产激爽大片高清在线观看| 国产aaaaa一级毛片| 老熟妇喷水一区二区三区| 制服无码网站| 91丝袜美腿高跟国产极品老师| 丁香婷婷在线视频| 成人福利免费在线观看| 波多野结衣无码中文字幕在线观看一区二区 | 国产伦片中文免费观看| a毛片在线播放| 日韩午夜福利在线观看| 日韩欧美中文字幕在线精品| 日韩美毛片| 91九色国产porny| 97se亚洲| 国产成人一二三| 国产香蕉国产精品偷在线观看 | 免费看av在线网站网址| 99精品伊人久久久大香线蕉| 国产精品久线在线观看| 黑人巨大精品欧美一区二区区| 久久人人爽人人爽人人片aV东京热 | 亚洲成人77777| 99re这里只有国产中文精品国产精品 | 国产黑丝视频在线观看| 国产成人永久免费视频| 久一在线视频| 国产网站一区二区三区| Aⅴ无码专区在线观看| 欧美亚洲综合免费精品高清在线观看| 欧美亚洲国产精品第一页| 欧美色视频在线| 精品小视频在线观看| 在线观看免费国产| 欧美翘臀一区二区三区| 国产视频一二三区| 国产黑人在线| 97se亚洲| 亚洲一区二区日韩欧美gif| 国产在线八区| 久久综合色播五月男人的天堂| 国产h视频免费观看| 亚洲欧美自拍中文| 亚洲中文在线看视频一区| 国产精品亚洲va在线观看| 国产视频资源在线观看| 国产成人亚洲无吗淙合青草| 少妇精品在线| 五月婷婷伊人网| 国产v精品成人免费视频71pao | 亚洲成人77777| 久久国产精品麻豆系列| 久草视频福利在线观看| 亚洲午夜综合网| 欧美一区二区三区国产精品| 19国产精品麻豆免费观看| 久久永久精品免费视频| 亚洲人成网站观看在线观看| 成人福利在线免费观看| 91精品视频网站| 国产一级片网址| 亚洲综合片| 久久精品女人天堂aaa| 婷婷六月综合网| 欧美第二区| 国产男女免费完整版视频| 久久精品国产在热久久2019| 在线无码九区| 欧美国产日本高清不卡| 亚洲欧美成人| 欧美成人精品一级在线观看| 拍国产真实乱人偷精品| 午夜精品福利影院| 中文无码日韩精品| 国产成人精品一区二区三区| 国产av剧情无码精品色午夜| 国产精品毛片一区| 色综合五月婷婷| 九九线精品视频在线观看| 91外围女在线观看| 六月婷婷精品视频在线观看| 九色综合伊人久久富二代|