999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于隨機森林的風力發電預測

2018-12-06 06:17:28中國礦業大學吳東劍張龍港朱大君高鵬超
電子世界 2018年22期
關鍵詞:模型

中國礦業大學 吳東劍 張龍港 朱大君 高鵬超

1.背景

隨著科技的進步,社會的發展,對電力的需求會越來越大,工廠、家庭等方方面面都需要電力的供應,對電力的需求是一沉不變的么?顯然不是的,像家庭用電,在每天的波動中,晚上是絕對的用電高峰期,而白天和夜里則相對較少。如果按照每月負荷來考慮,某些地方在夏天會達到用電高峰期,但是在另一些地方,冬天所帶來的燈具照明時間的增加,會使用電量高于夏天的用電量。工廠用電則與家庭用電完全不同。根據實際工廠的生產制度不同,三班倒、二班倒和全天不停工生產的日負荷波動是不相同的。同樣的,月負荷會根據生產不同的產品、不同的經營策略都有所不同。既然所需要的電力供應在不同的時間段是不同的,那么我們就需要對電網內所提供的電力供應進行調整,使其滿足實時電力需求。火力發電作為現階段我國的主要供電手段,其發電量無法快速根據需求進行調整。因此,調節的重任就落在了可再生能源的頭上,可再生能源又叫做清潔能源,主要生產是靠著風機(風能)、和輪機(水電站)來實現的。

2.國內外現狀

2015 年上半年能源局統計數據:2015 年上半年風力發電后無用電量為 175 億千瓦時,電能無用率為15.2%,其中甘肅(無用電量為 31億千瓦時、電能無用率達到 31%)、新疆(無用電量達到了29.7 億千瓦時、電能無用率為 28.82%)、蒙西(無用電量 33 億千瓦時、電能無用率 20%)、吉林(無用電量 22.9億千瓦時、電能無用率 43%)等地區。因此需要一種切實有效的方法來防止可再生能源發電的浪費,實現與電力需求的匹配。

在國外也是相同的情況,早在19世紀末,丹麥人就首先研制了風力發電機。而在1891年,丹麥就建成了世界第一座風力發電站。現在丹麥已擁有風力發電機3000多座,年發電100億度。但是風力發電量與負荷量不匹配問題依然大量存在。

發電量大帶來的不僅僅是能源充足,更多的是機械損耗和浪費能源地區不匹配帶來的能源浪費。中國棄風率最大的吉林省,半年棄風達22.9億千瓦時,這些能源如果輸送到電力缺乏的地區將帶來巨大的收益。同時,生產這些電力所造成的風機老化、磨損導致的經濟損失,我們不能忽略不計。因此,必須使用一種方法來預測接下來的地區負荷情況,若負荷降低。在基礎發電(火力發電)基本不變的情況下,使可再生能源(風能,海洋能)發電設備停運,這可以降低設備運轉所產生的磨損,減少維護費用,同時減少能源浪費。當負荷過大,或者與本地區的電網相連的其他區域發生電力供應不足的情況下,我們可以使更多的可再生能源發電設備運行,甚至滿負荷運行,在電力系統能承受的負荷下,最大程度的滿足地區電力需要和實現電力的區域性匹配。

3.方法介紹

我們所采用的方法就是負荷預測。負荷預測是根據系統的運行方式、決策方式、本身條件與對社會的影響等諸多因數,在滿足一定精度要求的條件下,確定未來某特定時刻的負荷數據,其中負荷是指電力需求量或用電量。由于電力負荷是一個非周期,規律不明顯的變化數值,因此,傳統的預測方法對負荷預測效果不佳。目前短期負荷預測理論已趨于成熟,可分為經典預測方法、傳統預測方法與智能預測方法三類。傳統預測方法對于波動性大,規律不明顯干擾大的地區不適用。但其結構原理簡單,易于實現。在智能預測方法里,人工神經網絡算得上是一大熱門,它具有很強的自主學習能力,能模仿人的思考方式,對于非結構、非精確性具有極強的適應能力,能夠擬合非線性曲線,得出接近于實際情況的模型結構。但是基礎的數學模型依賴于主觀經驗,泛化誤差大,由于它需要不斷的學習,它的收斂速度很慢,要達到實際可用的狀態需要進行大量的計算和學習。

本文將基于隨機森林回歸算法對某個區域的負荷進行預測,從而對可再生能源的出力情況給出建議。隨機森林回歸算法具有精度高、收斂速度快、調節參數少和不會產生過度擬合的問題。最后實驗結果表明,該方法可有效的預測地區負荷波動情況,準確度較高。

4.風力發電

為什么要集中對風力發電進行預測。眾所周知,風電作為清潔能源中最大的出力部分,在電網供電系統中具有重要作用。風力發電有他獨特的有利因素:首先是政策支持,我國現如今需要將傳統的火力發電等污染型發電方式轉換為清潔的發電方式,風力發電是最成熟、可靠的一種,國家會對風力發電進行大量扶持和幫助,在未來風力發電裝機容量會大幅度上升。其次是發展潛力大,風在自然界中廣泛存在,不會消失和停止,經過建造的風力發電設施可以出力很長時間,實際的產生價值遠大于本身建造成本。最后就是互聯網+,隨著科技和社會的發展,通過網絡實現對設備的控制變得越來越流行,由于風力發電常常位于偏遠或者人煙稀少的地區,以往對于發電機組的控制是很復雜的,從最近互聯網產業發展以來,對風力發電的控制變得很容易和精確。如果電力供應不足,可以使更多的風機轉動,當供應富余時,可以使部分風機停止轉動,減少發電量同時減少機械磨損。要想實現精準、可靠、高效的發電-用電匹配,就要進行負荷的預測。

5.決策樹,隨機森林原理

隨機森林算法是Leo Breiman結合bagging集成學習和隨機屬性子空間理論提出的監督學習算法。算法通過bootsrap重采樣方法對原始樣本進行采樣,每個樣本大小與原始樣本相同;為每個bootsrap樣本建立CATR決策樹模型;最后,將多個CATR決策樹組合為隨機森林,森林中每個決策樹的投票結果是最終的預測結果。

5.1 CATR決策樹

1970年末到1980年初,Quinlan提出了ID3決策樹算法,后來改進了ID3決策樹算法,提出了C4.5決策樹算法。1984年,Breiman和其他統計學家提出了CATR決策樹算法。CATR是一種二元遞歸分割技術,每個非葉節點被劃分為兩個葉節點。三種算法都使用自頂向下的貪心方法來構造決策樹,但不同的是屬性選擇度量。在每個決策樹的生長過程中,選擇某一屬性作為分裂節點,根據屬性選擇度量選擇最優屬性,這就決定了節點屬性分裂的條件。其中,ID3決策樹算法采用信息增益作為屬性選擇度量,C4.5決策樹算法選擇增益率作為屬性選擇度量,CATR決策樹算法使用gini index作為屬性選擇度量,CATR決策樹算法使用gini index作為屬性選擇度量。采用最小二乘偏差作為回歸樹的屬性度量。

5.2 隨機森林算法

隨機森林回歸是由很多回歸決策樹模型組成的組合分類模型,且參數集是獨立同分布的隨機向量,在給定自變量 X 下,每個決策樹回歸模型都會有一個預測結果。它的基本思想與流程如圖1所示:

圖1

首先,利用 Bootstrap 抽樣從原始訓練集抽取 k 個樣本,這 k 個樣本的樣本容量都與原始訓練集一樣,如上圖1所示。然后,對這些樣本分別建立 k 個決策樹模型,得到 k 個回歸結果;最后,對這 k 個結果取均值,得到最終預測結果,具體的結構圖如圖2所示:

圖2

隨機森林算法的基本數學流程如下:

(1)首先利用bootstrap 重抽樣的方法采取訓練集并隨機產生k 個訓練集θ1,θ2,…,θk這每個訓練集可以生成對應的決策樹也即是隨機森林中樹的個數。

(2)已知樣本的維數為M,在節點分裂的過程中,就從M 維特征中隨機抽取 m 個特征作為此節點的分裂特征集,m 值根據樣本量的大小設定,在不進行其他改進方法下,一般 m 的值在整個隨機森林形成過程中維持不變,在 R 語言中的 Random forest 包中就是M 的大小確定。

(3)對每個決策樹都不進行剪枝處理,使其得到最大程度的生長。

(4)當有一個新的數據X=x,單棵決策樹T()的預測可以通過葉節點的觀測值取平均獲得。假如一個觀測值Xi屬于葉節點且不為0,則權重向量為:

(5)在給定自變量 X=x下,單棵決策樹的預測值就通過因變量預測值加權平均得到。單棵決策樹的預測值由下式得到:

因此,在給定X=x的條件下,所有因變量觀測值的加權和就是所得的預測均值。權重隨自變量X=x的變化而變化,且當給定下 Y的條件分布與X=x下Y的條件分布越相似,其權重越大。

6.在隨機森林回歸算法上進行短期負荷預測實際應用分析

在電力系統中,進行負荷預測時,我們主要是根據已經有的一些數據,去建立相應的模型,進而對負荷進行預測,從而進一步描述其發展規律。作為現代社會中的一種新型算法,隨機森林回歸算法在于支持向量機等算法在各方面進行比較時,對于不同的研究者來說,每個人的觀點都是不一樣的,一般在用這兩種算法進行負荷預測時,主要是從精度與性能兩方面進行比較。從算法的性質上來說,這兩種算法都是智能的,所以,在對二者的結果進行分析時,除了對應選擇的特征量不同進行比較是,還應對所選取的樣本量大小進行一定的分析,較大或較小時,對預測的準確程度進行分析。在本篇文章中,所用數據為2016年1月到2017年12月的樣本集。

本篇文章中,所用的數據全部來源于山東省某地區所提供的電力負荷信息,電力負荷數據包括發電類型,同時還有每個月的具體發電量,以及各種不同的負荷的用電比例。

6.1 負荷預測結果的評估標準

(1)平均絕對誤差

回歸預測所預測的是負荷的具體值,當我們對一個模型的效果進行評估時,一般來說,我們常常通過與實際值之間的差值來評判好壞。在預測類的文章中,常用平均絕對誤差(MAPE)進行分析與評估。平均絕對誤差是所有單個觀測值與算術平均值的偏差的絕對值的平均。與平均誤差相比,平均絕對誤差由于離差被絕對值化,不會出現正負相抵消的情況,因而,平均絕對誤差能更好地反映預測值誤差的實際情況。

在對具體的模型進行分析時,平均絕對誤差越小,說明我們所使用的算法及模型的準確率越高,預測的結果也就越好。其中:Ri是實際的負荷值,Xi是利用模型得到的預測值,n是預測的數量。

(2)單個變量分析

在本篇文章中,對單個變量進行分析,來判定在單個變量的情況下,預測效果的不同,根據p的值,其實并不能說明預測結果究竟是怎樣的, 只是可以從統計學的角度上來說明結果差距的大小。

P值的大小對于二者之間的預測差異率有著很大的指導意義,一般來說,P 值越大,說明存在的差異就越小,相反的,P值越小,差異越大。而當P小于某一個確定值時,二者間就可以看成是完全不同的,這個值一般取0.05。

6.2 實際數據分析

從前文中,通過對變量以及一些相關性的分析,我們可以得到,對于電力負荷來講,很多因素對于負荷的預測都有著很大的影響,最典型的就是溫度、濕度以及季節的不同。本部分將在這些因素的基礎上,進行電力負荷的預測,另外處于嚴謹以及全面性的考慮,我們選取的數據橫跨四個季節兩年,基本上可以滿足預測的要求。

在進行預測時,我們根據隨機森林回歸算法進行了模型的建立,并且進行了仿真程序的編寫,并在調試后進行檢驗,在誤差允許的范圍內,我們發現,該仿真程序基本可以正常預測電力負荷,具體程序如下:

在將我們所取得的兩年的真實數據代入到程序中進行運行以后,我們變可以得到具體的預測結果。如圖3所示:

圖3

對預測所得圖形進行分析,我們可以得出,樣本中采集了24個月的風力發電數據,并且數據分為訓練集和測試集,比例為0.7:0.3。建立回歸隨機森林模型后,通過上圖我們可以發現,樹木數量對于隨機訓練結果存在影響,隨著樹木數量增加,正確率有所上升,但是當樹木數量超過40時,正確率就基本保持不變了。并且通過最終的分析計算,我們可以得出該模型用于預測本文中的電力負荷時,回歸正確率為0.81。

7.綜述

由上述分析可以得知,采用隨機森林的預測模型可以對某地區短期負荷進行比較準確和有效的預測,得出的結果可以幫助當地供電站對風力發電機組的運行狀態進行調整,以便于實現更精確的電力供需匹配和降低機械損耗。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 99精品伊人久久久大香线蕉| 永久免费AⅤ无码网站在线观看| 亚洲成人黄色网址| 日韩a级毛片| 手机在线国产精品| 国产一区在线视频观看| 日韩欧美国产中文| 欧美日本不卡| 嫩草影院在线观看精品视频| 毛片基地视频| 日韩欧美网址| 久久综合九色综合97婷婷| 国产第一页屁屁影院| 老色鬼久久亚洲AV综合| 国产亚洲精品无码专| 人妻丰满熟妇αv无码| 激情综合网址| 伊人91在线| 国产极品粉嫩小泬免费看| 亚洲视频免| 婷婷伊人久久| 国产毛片片精品天天看视频| 中文字幕第1页在线播| 国产偷国产偷在线高清| 又爽又大又黄a级毛片在线视频| 福利小视频在线播放| 国产亚洲精久久久久久久91| 色偷偷一区| 欧美另类精品一区二区三区| 五月激情婷婷综合| 中文字幕亚洲专区第19页| 国产成人亚洲欧美激情| 67194在线午夜亚洲 | 亚洲一区二区三区国产精品| 片在线无码观看| 中文字幕在线不卡视频| 亚洲国产欧美目韩成人综合| 欧美成一级| 国产剧情无码视频在线观看| 国产色伊人| 欧美日韩91| 国产精品自拍露脸视频 | 99精品在线看| 色香蕉网站| 亚洲精品视频在线观看视频| 一区二区三区国产| 亚洲成aⅴ人片在线影院八| 色网站免费在线观看| 欧美乱妇高清无乱码免费| 91无码人妻精品一区| 国产成人综合日韩精品无码不卡| 久久久久久久久18禁秘| 成人一区在线| 国内精品91| 三上悠亚精品二区在线观看| 日韩欧美中文字幕在线精品| 国产精品伦视频观看免费| 国产福利微拍精品一区二区| 欧美精品一区二区三区中文字幕| 日韩视频福利| 成人午夜久久| 亚洲国产成人久久精品软件 | 91视频首页| 无码aⅴ精品一区二区三区| 美女视频黄又黄又免费高清| 亚洲无码不卡网| 91小视频在线观看| 欧美成在线视频| 色AV色 综合网站| 国产一区二区三区视频| 久久国产毛片| 亚洲永久精品ww47国产| 91www在线观看| 国产亚洲欧美在线人成aaaa| 久久精品人妻中文系列| 四虎成人免费毛片| 亚洲中文制服丝袜欧美精品| 成人国产精品一级毛片天堂| 亚洲天堂日韩av电影| 国产18在线播放| 久久精品人妻中文系列| 蝴蝶伊人久久中文娱乐网|