沈陽工程學(xué)院 寇金馳 高 陽 許傲然 劉寶良
天氣是風(fēng)電等可再生能源的主要驅(qū)動(dòng)器,但同時(shí)也讓預(yù)測(cè)風(fēng)電功率值、運(yùn)營、交易和平衡可再生能源面臨最大的不確定性風(fēng)險(xiǎn)。根據(jù)在風(fēng)電預(yù)測(cè)過程中需要的各類數(shù)據(jù)的箱線圖可以分析出風(fēng)速、風(fēng)向、溫度、濕度、氣壓等數(shù)據(jù)的數(shù)值區(qū)間和變化范圍,可以得出風(fēng)電場所在地是否處在風(fēng)口位置,此處是否時(shí)常發(fā)生強(qiáng)對(duì)流天氣等信息。同時(shí),在箱線圖中也會(huì)觀察到一些數(shù)據(jù)的異常值,比如在溫度的箱線圖中,有的數(shù)據(jù)顯示為-273K,達(dá)到了絕對(duì)零度,這是絕對(duì)不可能的現(xiàn)象,同樣的還有在高海拔地區(qū)收集到接近于0Pa的氣壓值,這些數(shù)據(jù)表明,在風(fēng)電功率預(yù)測(cè)數(shù)據(jù)收集過程中存在一定數(shù)量的異常值,類似的NWP數(shù)據(jù)的異常值可能由于儀器故障或者偶發(fā)的氣旋等因素產(chǎn)生。考慮到NWP氣象數(shù)據(jù)、測(cè)風(fēng)塔收集到的數(shù)據(jù)和風(fēng)電場的實(shí)際功率數(shù)據(jù)往往質(zhì)量不高,給風(fēng)電功率預(yù)測(cè)帶來了極大的難度。因此分別對(duì)NWP數(shù)據(jù)、測(cè)風(fēng)塔數(shù)據(jù)和實(shí)際功率數(shù)據(jù)首先進(jìn)行“去重處理”,然后進(jìn)行數(shù)據(jù)的完整性檢驗(yàn)和處理及合理性的檢驗(yàn)和處理,進(jìn)而通過對(duì)比(以風(fēng)速數(shù)據(jù)為例)處理后的數(shù)據(jù)與功率值的關(guān)系散點(diǎn)圖和處理前數(shù)據(jù)的關(guān)系散點(diǎn)圖得出,處理后的數(shù)據(jù)精度大大提高,為風(fēng)電功率預(yù)測(cè)提供了良好的數(shù)據(jù)支持。
對(duì)原始數(shù)據(jù)根據(jù)時(shí)間進(jìn)行重復(fù)數(shù)據(jù)檢驗(yàn),主要檢驗(yàn)行的重復(fù),即去重處理;保證處理后無重復(fù)行數(shù)據(jù)。
數(shù)據(jù)的時(shí)間順序應(yīng)符合預(yù)期的開始、結(jié)束時(shí)間,中間應(yīng)連續(xù)。檢驗(yàn)和處理方案:通過配置文件讀取開始時(shí)間和結(jié)束時(shí)間,將所有時(shí)間數(shù)據(jù)按這個(gè)區(qū)間排序,設(shè)置當(dāng)時(shí)間不連續(xù)時(shí),對(duì)時(shí)間數(shù)據(jù)進(jìn)行插補(bǔ)的時(shí)間間隔為15min,用下一時(shí)刻和上一時(shí)刻的時(shí)間相減,若超過設(shè)置的時(shí)間間隔(15min),則對(duì)時(shí)間進(jìn)行插補(bǔ),否則不用插補(bǔ)。在進(jìn)行時(shí)間數(shù)據(jù)插補(bǔ)時(shí),首先檢驗(yàn)待插補(bǔ)的時(shí)間間隔是否是15min的倍數(shù),如果是15min的倍數(shù),則按每15min一個(gè)插值進(jìn)行插補(bǔ);反之,則計(jì)算時(shí)間差的余數(shù),若余數(shù)小于3min,使用上一時(shí)刻的時(shí)間值,若余數(shù)大于等于3min,使用下一時(shí)刻的時(shí)間值。比如:時(shí)間差為0:17:0,對(duì)15取余數(shù),余數(shù)為2,故將該條數(shù)據(jù)的時(shí)間變?yōu)?:15:0,然后再進(jìn)行插補(bǔ)。在對(duì)時(shí)間數(shù)據(jù)進(jìn)行插補(bǔ)后,將插補(bǔ)的部分和不需插補(bǔ)的部分進(jìn)行合并,保證在時(shí)間上是連續(xù)完整的一份數(shù)據(jù)。
在保證時(shí)間數(shù)據(jù)是完整連續(xù)的前提下,對(duì)其他缺失數(shù)據(jù)的字段主要關(guān)注:溫度、10m風(fēng)向、30m風(fēng)向、100m風(fēng)向、170m風(fēng)向、地表風(fēng)向、10m風(fēng)速、30m風(fēng)速、100m風(fēng)速、170m風(fēng)速、地表風(fēng)速、濕度、地表氣壓針對(duì)于時(shí)間插補(bǔ)過的如上這些字段的數(shù)據(jù),要進(jìn)行插補(bǔ)。
若數(shù)據(jù)缺失,缺失數(shù)據(jù)應(yīng)以前后相鄰15min的數(shù)據(jù)進(jìn)行插補(bǔ),具體規(guī)則為:
(1)若同時(shí)擁有前后相鄰15min的數(shù)據(jù),取前后兩點(diǎn)數(shù)據(jù)的平均值進(jìn)行插補(bǔ)。
(2)若只有前面/后面相鄰15min的數(shù)據(jù),則用前面/后面相鄰的數(shù)據(jù)進(jìn)行插補(bǔ)。
(3)若同時(shí)沒有前,后相鄰15min的數(shù)據(jù),則用前一天同一時(shí)刻的數(shù)據(jù)進(jìn)行插補(bǔ)。
對(duì)風(fēng)電功率預(yù)測(cè)的NWP數(shù)據(jù)的離群值采用“四分位法”進(jìn)行檢驗(yàn)和處理。
四分位法:將一組數(shù)據(jù)從小到大排列并平均分成4份,其中每份數(shù)據(jù)各占總數(shù)據(jù)的25%。將Q1稱為下四分位數(shù);Q2稱為中位數(shù);Q3稱為上四分位數(shù),其中:總數(shù)據(jù)中的1/4數(shù)據(jù)的值小于Q1,1/4的數(shù)據(jù)大于Q3,Q1與Q3之差為四分位數(shù)間距IQR。

由間距IQR能得出數(shù)據(jù)異常值的范圍,其中超出異常值內(nèi)限[D1,Du]的數(shù)據(jù)將被剔除,內(nèi)限范圍的計(jì)算式如下:

所有不在[Q1-1.5IQR,Q3+1.5IQR]區(qū)間內(nèi)的值為離群值。
對(duì)NWP的溫度、風(fēng)向、風(fēng)速、濕度和氣壓數(shù)據(jù)分別進(jìn)行離群值的檢驗(yàn)和處理,如果數(shù)據(jù)為離群值,處理方法如下:
(1)小于等于Q1-1.5IQR的值,用Q1-1.5IQR的值進(jìn)行替換。
(2)大于等于Q3+1.5IQR的值,用Q3+1.5IQR替換。
對(duì)于NWP的越限數(shù)據(jù)應(yīng)以前后相鄰15min的數(shù)據(jù)進(jìn)行插補(bǔ),插補(bǔ)規(guī)則為:
如果前后相鄰15min的數(shù)據(jù)都有,取前后兩點(diǎn)的平均值,進(jìn)行插補(bǔ);如果有前面相鄰15min的數(shù)據(jù),用前面相鄰的數(shù)據(jù)進(jìn)行插補(bǔ);如果有后面相鄰15min的數(shù)據(jù),用后面相鄰的數(shù)據(jù)進(jìn)行插補(bǔ)。如果(1)不滿足條件,用下面的方式處理:
用前一天同時(shí)刻的數(shù)據(jù)進(jìn)行插補(bǔ)
用上一年同時(shí)刻的數(shù)據(jù)進(jìn)行插補(bǔ)
對(duì)清洗后的NWP數(shù)據(jù)基于時(shí)間進(jìn)行整體排序,確保每15min的數(shù)據(jù)是完整的連續(xù)值。
在對(duì)測(cè)風(fēng)塔的數(shù)據(jù)進(jìn)行預(yù)處理時(shí),要先對(duì)測(cè)風(fēng)塔的數(shù)據(jù)基于時(shí)間的完整排列進(jìn)行數(shù)據(jù)的插補(bǔ),與NWP數(shù)據(jù)的處理方式類似,只是對(duì)時(shí)間的分辨率設(shè)置為5min,首先將測(cè)風(fēng)塔測(cè)出的風(fēng)速和風(fēng)向數(shù)據(jù)按時(shí)間進(jìn)行排序,下一時(shí)刻與上一時(shí)刻進(jìn)行相減,如果超過設(shè)置時(shí)間(5min),計(jì)算時(shí)間差的余數(shù),若余數(shù)小于3min,按照上一時(shí)刻的數(shù)據(jù)進(jìn)行插補(bǔ),若余數(shù)大于3min,則按照下一時(shí)刻的數(shù)據(jù)進(jìn)行插補(bǔ)。
然后對(duì)測(cè)風(fēng)塔的風(fēng)速及風(fēng)向等數(shù)據(jù)進(jìn)行缺失值的檢驗(yàn)和處理,以風(fēng)速數(shù)據(jù)為例:首先,計(jì)算不同高度風(fēng)速值之間的斯皮爾曼相關(guān)性系數(shù),具體計(jì)算公式如下:

繼而結(jié)合不同高度處風(fēng)速數(shù)據(jù)的箱線圖對(duì)風(fēng)速缺失值進(jìn)行處理,由箱線圖可知,測(cè)風(fēng)塔的風(fēng)速數(shù)據(jù)隨著高度的升高,風(fēng)速值增大,因此具體的處理方式如下:
(1)當(dāng)?shù)吞幍娘L(fēng)速數(shù)據(jù)缺失時(shí),在高處的風(fēng)速數(shù)據(jù)中,查找與低處的風(fēng)速數(shù)據(jù)相關(guān)系數(shù)最大的位置的風(fēng)速數(shù)據(jù)乘以相關(guān)性系數(shù),作為低處風(fēng)速數(shù)據(jù)的替代值。
(2)當(dāng)高處的風(fēng)速數(shù)據(jù)缺失時(shí),在低處的風(fēng)速數(shù)據(jù)中,查找與高處的風(fēng)速數(shù)據(jù)相關(guān)性系數(shù)最大的未知的風(fēng)速數(shù)據(jù)除以相關(guān)性系數(shù),作為高處風(fēng)速數(shù)據(jù)的替代值。
對(duì)測(cè)風(fēng)塔測(cè)到的風(fēng)向數(shù)據(jù)的缺失值處理方法與風(fēng)速數(shù)據(jù)的處理方法類似,結(jié)合不同高度處風(fēng)向數(shù)據(jù)的箱線圖可知,不同高度處風(fēng)向數(shù)據(jù)的變化范圍不大,因此,具體處理方式如下為:只需查找與缺失高度處的風(fēng)向值相關(guān)性系數(shù)最大的高度處的風(fēng)向值,將此風(fēng)向數(shù)據(jù)乘以相關(guān)性系數(shù),作為缺失風(fēng)向值的替代值。
對(duì)風(fēng)電場實(shí)際功率同樣用“四分位法”進(jìn)行數(shù)據(jù)的異常值檢驗(yàn)和處理,對(duì)實(shí)際功率限值檢驗(yàn)和處理的方式是依據(jù)風(fēng)電場裝機(jī)容量的限值來處理,具體方法為:小于實(shí)際功率的最小值(即0值),用0值進(jìn)行替換;大于實(shí)際功率的上限值,用風(fēng)電場的裝機(jī)容量值進(jìn)行替換。
將東北地區(qū)該風(fēng)電場一年的NWP數(shù)據(jù)、測(cè)風(fēng)塔數(shù)據(jù)及實(shí)際功率數(shù)據(jù)進(jìn)行預(yù)處理后,與處理前的數(shù)據(jù)進(jìn)行對(duì)比,以風(fēng)速數(shù)據(jù)為例,數(shù)據(jù)處理前的風(fēng)速-功率散點(diǎn)圖如圖1所示。

圖1 數(shù)據(jù)處理前的風(fēng)速-功率關(guān)系散點(diǎn)圖
由圖1可知,風(fēng)速數(shù)據(jù)預(yù)處理前存在著大量的異常值和缺失值,為準(zhǔn)確的風(fēng)電功率預(yù)測(cè)增加了極大地難度。對(duì)風(fēng)速數(shù)據(jù)處理之后,風(fēng)速-功率關(guān)系的散點(diǎn)圖如圖2所示。

圖2 數(shù)據(jù)處理后的風(fēng)速-功率關(guān)系散點(diǎn)圖
通過對(duì)比散點(diǎn)圖1和圖2,可以清晰地看出,經(jīng)過數(shù)據(jù)預(yù)處理后,風(fēng)速的缺失值和異常值大量的減少,風(fēng)速-功率關(guān)系呈現(xiàn)的比較清晰。說明此時(shí)經(jīng)處理過后的數(shù)據(jù)質(zhì)量較好,可以為風(fēng)電功率的準(zhǔn)確預(yù)測(cè)提供很好的前期數(shù)據(jù)支持。
結(jié)論:本文為了實(shí)現(xiàn)風(fēng)電功率的準(zhǔn)確預(yù)測(cè),分別對(duì)NWP數(shù)據(jù)、測(cè)風(fēng)塔數(shù)據(jù)及風(fēng)電場的實(shí)際功率數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,通過處理前后的數(shù)據(jù)(以風(fēng)速數(shù)據(jù)為例),驗(yàn)證了經(jīng)數(shù)據(jù)預(yù)處理后獲得的數(shù)據(jù)質(zhì)量較好,可以為風(fēng)電功率的精準(zhǔn)預(yù)測(cè)提供較好的數(shù)據(jù)支持。