999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于PCA-ESN模型的潘家口水庫水位預測研究

2020-09-14 05:30:30彭宏玉
唐山學院學報 2020年3期
關鍵詞:模型

龔 莎,彭宏玉

(1.西南交通大學 唐山研究生院,唐山 河北 063000;2.唐山學院 計算機科學與技術系,唐山 河北 063000)

0 引言

灤河來水量在時間分布上很不均勻,一年之內的來水量主要集中在七、八、九三個月內,且來水量的年際變化懸殊[1]。潘家口水庫是整個引灤工程的源頭,對其水位進行預測,對于提高灤河水資源的利用率、加強水資源的分配管理以及防洪減災都具有重要意義。

目前,很多學者致力于湖泊流域水位預測方法的研究,采用的技術主要有遙感技術、物聯網技術、機器學習和神經網絡。其中應用機器學習和神經網絡進行預測在國內外已有不少研究成果。Makhtar等[2]使用Apriori算法從數據集中生成最佳規則,用于查找頻繁項集,通過建立洪水預報模型來發現水位與洪水面積之間的相關性,這項研究的結果證明了在水位預測中Apriori算法的可用性。Jangyodsuk等[3]基于貝葉斯的方法,提出了一種新的因果發現算法,利用降水和水文數據來尋找未來洪水的影響特征,但此研究只考慮了降水這單一因素對洪水的影響。趙春雷等[4]采取歷史資料回歸和機器學習方法,對白洋淀水位隨區域降水量變化的規律進行分析,并通過建立最低水位預測模型對已有的數據進行驗證。但此研究只考慮了影響水位的雨季自然降水量和白洋淀基礎水位這兩個因素,造成一定的結果誤差,預測精度有待提高。劉亞新等[5]提出了一種基于長短時記憶(Long Short-Term Memory,LSTM)的水位預測方法,用于葛洲壩水電站上下游水位的預測,此方法采用水位和出力等直接監測數據,避免了出入庫流量等間接計算值帶來的二次誤差,但預測精度仍有待進一步提高。Ghorbani等[6]將混合模型的預測能力與FFA集成在一起,作為具有多層感知器(MLP-FFA)的啟發式優化工具,用于土耳其埃利迪爾湖水位的預測,實驗表明Firefly算法作為優化器,可以使模型預測的準確性更高。Khan等[7]為拉姆甘加河開發了一個人工神經網絡模型,使用日常用水對模型化網絡進行訓練、驗證和測試,由于河流流量和水位值難以測量,不能直接預測隱藏層神經元最佳數量,必須通過枚舉技術獲得最佳網絡拓撲結構,計算成本較高,增加了運行時間。Xu等[8]提出了一種基于ARIMA-RNN組合模型的水位預測方案,解決了單個預測模型不能同時考慮數據中線性和非線性成分的問題,實驗結果證明,預測模型可以取得較好的效果,但精度仍有待提高。

針對應用傳統神經網絡進行水位預測存在的問題,本文提出了一種基于PCA-ESN模型的水位預測方法。首先,在數據預處理部分利用主成分分析法(Principal Component Analysis,PCA)有效提取多元時間序列數據的特征并對原始數據進行重組,降低了水位數據的信息冗余;其次,使用回聲狀態網絡(Echo State Network,ESN)建立水位預測模型,克服了傳統遞歸神經網絡梯度消失和梯度爆炸問題,網絡具有較好的信息處理能力和泛化能力。具體過程為,根據河北省潘家口水庫的水位日數據,先通過PCA算法選取影響水位的相關變量,然后設計ESN模型預測水位。

1 數據預處理

對數據預處理是實驗結果準確的前提。作為多元統計中常用的數據分析方法之一,主成分分析法能夠在降低原始數據變量維數的同時有效提取各個變量的特征,產生新成分,新成分能夠克服因原始變量信息重疊而對數據分析結果造成的不良影響[9]。

設原始數據集包括n個數據樣本,每個樣本具有p個變量,對此數據集的主成分分析計算流程如下。

(a)對原始數據集進行標準化處理,組成標準化數據矩陣Z。

(b)引入Pearson相關系數(式(1))計算各個變量數據間的相關性,組成相關系數矩陣R。

(1)

(c)求解相關系數矩陣R的特征方程,對求出的特征值按從大到小的順序進行排序λ1≥λ2≥…≥λp,并求出每個特征值相對應的單位特征向量li,li組成如式(2)的主成分得分矩陣L。

(2)

其中,lij(i=1,2,…,n;j=1,2,…,p)。

(d)根據式(3)計算累計貢獻率ki,保留累計貢獻率在85%以上的前m個成分作為新主成分。

(3)

(e)根據第(c)步、第(d)步計算新主成分Y的各個主成分,得到原始數據集經過PCA處理后的重組數據集,第m個新主成分的數學模型Ym如式(4)所示。

Ym=l1m×X1+l2m×X2+…+lnm×Xp。

(4)

原始數據為河北省潘家口水庫2009年9月3日至2019年12月29日的3 770組水位日數據,數據來源于實驗室搭建的野外人工湖水位智慧預警系統的數據采集部分。該系統的數據采集部分比較完善,經過了長時間的運行,已經采集到定量的水位及相關信息。部分歷史水位及相關信息數據如表1所示。

表1 部分歷史水位及相關信息數據

在進行ESN模型構建之前,要把ESN結構中輸入層因子的具體數值進行預處理,輸入層因子的選擇和主成分分析相關性很強,無論是因子初選還有因子精選都是其范圍內的,因子選擇過程本質上來說就是主成分分析過程。

將歷史水位、降水量、水溫、濕度、壓力作為主成分分析過程的備選因子。數據集的變量分別為歷史水位(X1)、降水量(X2)、濕度(X3)、水溫(X4)、壓力(X5)。對5個初始因子進行主成分分析,結果如表2所示。

表2 PCA分析結果表

經主成分分析,得到各個主成分的特征值、貢獻率、累積貢獻率。由表2可知,歷史水位和降水量2個主成分的累計貢獻率已經達到92.986%,說明這2個主成分取代先前的5個因子可以讓信息丟失的程度降低,主成分的分析效果更穩定。

數據集經過PCA處理得到2個新主成分PA1,PA2,由主成分得分矩陣計算得到新主成分的模型如式(5)所示:

(5)

2 模型設計

回聲狀態網絡ESN由2001年Jaeger提出[10],是典型的儲備池計算網絡,具有復雜的動力學特征。目前ESN已經在智能控制、語音識別、非線性時間序列預測等領域取得了廣泛的應用。ESN主要由輸入層、儲備層和輸出層組成,其特點是儲備層由一個包含大量神經元的動態儲備池(DR)構成,儲備池內的神經元采用隨機、稀疏的方式連接,其蘊含了網絡的運行狀態,具有短期記憶功能。儲備池是回聲狀態網絡結構的核心部分,對于網絡最終的性能起著至關重要的作用。ESN結構如圖1所示。

圖1 ESN結構圖

設輸入矩陣、狀態矩陣、輸出矩陣分別為:

u(t)=(u1(t),u2(t),…,uK(t))T,

(6)

x(t)=(x1(t),x2(t),…,xN(t))T,

(7)

y(t)=(y1(t),y2(t),…,yM(t))T,

(8)

其中,K為輸入維數,N為儲備池內部神經元個數,M為輸出維數,t=1,2,…,T。

狀態矩陣的更新如式(9)所示:

x(t+1)=f(Winu(t+1)+Wx(t)),

(9)

y(t)=fout(Woutxout(t)),

(10)

其中,Win是N×K輸入層到儲備層的權重矩陣,W是儲備層權重矩陣,Wout是M×K儲備層到輸出層的權重矩陣,此矩陣的更新如式(11)所示:

Wout=((STS+βI)-1STD)T,

(11)

其中,β表示非負正則化系數,S表示全部狀態矩陣,I表示單位矩陣,D為全部輸出矩陣。

3 算法設計

在設計算法前首先需要進行關鍵參數選擇,具體參數包括儲備池規模、稀疏度、譜半徑、輸入縮放因子。

(ⅰ)儲備池規模N是指ESN儲備池內神經元的個數。儲備池是隨機生成的,其規模必須足夠大,以捕捉潛在的數據特征。一般來說,如果采取適當的正則化措施,則儲備池規模越大,獲得的網絡性能就越好。但過大也會導致“過擬合”。文中選取N為500。

(ⅱ)稀疏度s是指儲備池中存在相互連接的神經元個數與神經元總個數的百分比,反映了儲備池神經元間連接的稀疏程度。ESN儲備池內神經元是稀疏連接的,即連接輸入層與儲備層的輸入權重矩陣Win中大部分元素值為0。文中設定稀疏度為5%。

(ⅲ)譜半徑ρ(W)是指儲備層權重矩陣W的特征值絕對值中的最大值。當譜半徑介于[0,1]之間時,回聲狀態網絡具有回聲狀態特性。但由于激活函數引入非線性因素,最佳ρ(W)值有時可能會比1大得多,意味著ρ(W)<1并不是網絡具有回聲狀態特性的必要條件。因此,實際任務中的譜半徑應更大,需要更大的輸入存儲空間。

(ⅳ)輸入縮放因子是指在輸入信號傳送到網絡儲備池前,對輸入權重矩陣Win進行尺度變換的一個縮放因子。輸入縮放因子的大小與網絡處理問題的非線性程度有關,非線性程度越強,輸入縮放因子值越大。

ESN模型訓練:

Step1:進行初始化操作,先確定儲備池的規模,即神經元的個數。

Step2:隨機生成輸入權重矩陣Win和儲備層權重矩陣W。調整輸入縮放因子,使ρ(W)譜半徑小于1。

Step3:樣本數據依次加載到輸入、輸出,更新儲備池內部狀態。

Step4:前n個數據因受到初始瞬變的影響,所以刪除x(1)至x(n),即前n個數據不用于學習Wout,并收集第n個數據以后的狀態變量。

Step5:計算輸出權重矩陣Wout。

Step6:用新輸入和訓練好的Wout計算相應輸出進行測試。

4 仿真實驗

將基于PCA-ESN的預測模型用于潘家口水庫水位的預測。

首先對輸入數據進行歸一化處理:

x′=(xy-xmin)/(xmax-xmin),

(12)

其中,xy為數據序列的原始值,x′為歸一化后的值,xmin為序列的最小值,xmax為序列的最大值。

將3 770組數據歸一化處理后,利用PCA算法對數據進行分析處理,選取新主成分。取前2 000組數據用作訓練樣本,后面1 770組數據用作測試樣本。ESN網絡的輸入節點為2,儲備池神經元個數為500,稀疏度為5%,輸出節點數為1。

基于處理的數據集,對PCA-ESN模型進行水位預測的實驗模擬。將模型運行30次以求得較為穩定的模擬結果,采用30次的平均值繪制ESN測試效果圖圖2。由圖2可知,ESN的測試輸出接近真實水位數據,效果較好。

圖2 ESN測試效果圖

為了進一步說明ESN的優越性,本實驗選取均方誤差(MSE)作為模型預測性能的評價指標,計算公式如下:

(13)

ESN誤差測試如圖3所示。由于ESN模型的輸入權重矩陣與儲備層權重矩陣在每次訓練時均需隨機生成,因此ESN模型的誤差分布有一定波動,但基本比較平穩,誤差控制在7.278E-05左右,預測效果較好。說明ESN的神經網絡數據處理能力強,訓練效果好。

圖3 ESN誤差測試圖

5 結論

采用PCA算法對數據集進行預處理,選取新的主成分作為輸入變量,建立ESN預測模型,對潘家口水庫水位進行預測。仿真實驗結果表明,采用PCA算法對數據進行預處理,提取到歷史水位和降水量的累計貢獻率達到92.986%,將這2個主成分作為輸入變量,減少了重復率,降低了復雜度。實驗展示了ESN預測非線性時間序列數據的優勢,收到了較好的預測效果。因此,基于PCA-ESN模型預測水位的誤差小,準確性高,具有一定的實用價值。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 九九热这里只有国产精品| 91久久夜色精品| 免费观看国产小粉嫩喷水| 国产99欧美精品久久精品久久| 亚洲精品福利视频| 四虎永久免费地址| 天堂成人av| 波多野结衣一区二区三区四区| 综合人妻久久一区二区精品| 69av免费视频| www.亚洲一区| 日韩av电影一区二区三区四区 | 日韩在线永久免费播放| 欧美日韩中文字幕在线| 欧美19综合中文字幕| 国产制服丝袜91在线| 国产又大又粗又猛又爽的视频| 日韩毛片视频| 亚洲免费黄色网| 91无码国产视频| 亚洲精品色AV无码看| 欧美一区二区三区不卡免费| 97狠狠操| 一本一本大道香蕉久在线播放| 色妞永久免费视频| 露脸一二三区国语对白| 久久久久亚洲AV成人网站软件| 久久国产V一级毛多内射| 国产成+人+综合+亚洲欧美| 一级高清毛片免费a级高清毛片| 久草国产在线观看| 日本在线视频免费| 亚洲精品欧美日韩在线| 青青草国产在线视频| 国产白浆一区二区三区视频在线| 在线亚洲精品自拍| 亚洲天堂网视频| 精品无码人妻一区二区| 又大又硬又爽免费视频| 午夜视频日本| 国产精品成人一区二区| 国产一级裸网站| 精品国产免费第一区二区三区日韩| 亚洲第一视频区| 97在线碰| 亚洲区欧美区| 久久国产亚洲偷自| 久久一本精品久久久ー99| 欧美日韩中文国产va另类| 毛片视频网址| 国产精品思思热在线| 色亚洲激情综合精品无码视频| 天堂av综合网| 欧美日本二区| 日韩欧美91| 日韩精品久久无码中文字幕色欲| 亚洲a级在线观看| 伊人成色综合网| 欧美有码在线观看| 亚洲精品第1页| 亚洲大学生视频在线播放 | 污污网站在线观看| 日韩精品一区二区三区免费| 色播五月婷婷| 无码国产偷倩在线播放老年人| 欧美日韩中文字幕在线| 日韩无码视频播放| 91伊人国产| 亚洲人成人无码www| 久久精品视频一| 91精品福利自产拍在线观看| 久久这里只精品热免费99| 一区二区三区四区精品视频 | 香蕉视频在线观看www| 无码粉嫩虎白一线天在线观看| 免费毛片网站在线观看| 免费人成在线观看成人片| 亚洲九九视频| 亚洲精品视频免费| 人妻精品久久无码区| 国产欧美网站| 熟妇丰满人妻|