華電電力科學研究院 李雪玉
風電場運行狀態參數特性取決于其運行工況,受氣候、湍流、風機尾流、葉片污染的氣動損失、風電場內線損失、氣候等多方面的影響。因此,風電場采集的大數據之間的關系復雜,大量的干擾信息難于直接將采集的數據用于后期對于風電場的分析。因此對于風電場大數據的有效預處理是非常重要的,這就需要深入研究風電場中各種數據的相關性并剔除無效數據的干擾,為后期風電場的分析奠定基礎。
風電場狀態參數主要包括各風機的機艙、齒輪箱、主軸、發電機、變流器、電網環境、自然環境等的監測數據。表1例舉了風電場中監測的風電機組的主要狀態參數。其中,發電機繞組溫度包括定子繞組的三相溫度、轉子繞組的三相溫度共6個繞組溫度。

表1 風電機組狀態參數
風電場SCADA數據主要分布在0~13.5m/s的風速區間。考慮到風電機組的切入風速為3m/s,本文初步選取風速區間為3~13.5m/s的SCADA數據。大多數風電機組數據采集與監控 (SCADA) 系統可以對機組各子系統的運行狀態參數進行監測和存儲,一般為每10min存儲1次,本文從機組運行狀態參數時間序列中每10min隨機抽取一個運行參數,得到一組非等間隔時間序列。
風電場SCADA系統的狀態參數具有不同的測量單位,原始數據的量綱也各不相同,因此需對SCADA數據標準化處理再進行相關性分析。
設原始數據矩陣為X=(xij)n×p,按 (3.1)對原始數據進行標準化變換。

式中:zij為標準化變換后的數據矩陣Z=(zij)n×p的元素;D(xj)為變換前的方差;為平均值,按(3.2)計算。

設 (Xi,Yi) (i=1.2…,n)為取自總體 (X,Y) 的樣本,則樣本的Preason相關性系數為:

式中:rs為Pearson相關性系數;X為X的平均值;為Y的平均值;n為樣本數。
Pearson相關性系數r反映了兩個參數X、Y之間的線性相關性,|r|的值越接近于1,說明參數X、Y之間的線性相關性越強。當r=0時,說明參數X、Y不相關。
設兩個樣本X和Y為數據對 (x1,y1),(x2,y2),…,(xn,yn)。用Ri表示xi在 (x1,x2,…,xn) 中的秩;Qi表示 yi在(y1,y2,…,yn)中的秩;為Ri的平均值;為Qi的平均值;n為樣本數。
將水熱預處理后的微藻生物質離心15 min,離心機轉速為 5 000 r·min-1(RCF=5 000×g),取離心后的固體物質用于DSC的實驗分析。

將 (4.2) 和 (4.3) 代入(4.1),rs簡化為:


表2 風速與風電機組狀態參數的相關性分析
rs取值區間為 [-1,1],rs>0為正相關,rs<0為負相關,rs=0為完全不相關。通常認為當|rs|>0.8時相關程度較高。
當兩個樣本存在線性相關性時,Pearson相關性系數比較適合;當樣本存在嚴重非線性畸變或者樣本中存在脈沖干擾時,Spearman秩相關系數較為合適。由于風電場風速的波動性 、環境溫度的季節性、運行控制方式的動態性、電網負荷的隨機性等多種因素使風電場SCADA數據包含各種干擾數據,同時風電機組的多種狀態參數之間的相關關系十分復雜。因此,結合兩種相關系數建立風電機組狀態參數的綜合相關性指標CCI(Comprehensive Correlation Index),從理論上是更好的一種方法。即:

式中,r、rs分別為Pearson、 Spearman相關系數。
表2表明,風速參數與齒輪箱輸出軸溫度、繞組溫度、相電流、有功功率的參數相關性較大。風速與齒輪箱油溫的CCI值大于風速與入口油溫的CCI值,說明風速與齒輪箱油溫的參數相關性大于風速與入口油溫的參數相關性。與實際經驗符合,可見CCI值能正確反映風電機組狀態參數與風速的相關性。
相電流與風速具有較大的參數相關性,是由于機組采用穩壓控制,使得風電機組的相電壓基本恒定,相電流直接影響機組功率。
風速對機艙振動影響小的原因是振動信號的的低采樣頻率導致某一風速的振動幅值分散性較大,對風速與振動信號的相關性指標的計算結果產生了較大干擾,掩蓋了風速與振動幅值的相關性。
表3說明塔頂柜、塔底柜與環境溫度的參數之間具有較大的相關性,其原因是在風電機組中,塔頂柜、塔底柜的安裝位置與發電機、齒輪箱、主軸等發熱量大的部件距離較遠,易受環境溫度影響。葉輪側軸承、齒輪箱側軸承、軸承A的溫度與環境溫度的參數之間相關性較高,這與實際經驗相符。

表3 環境溫度與風電機組狀態參數的相關性分析
由表4可知,繞組溫度之間的參數相關性較大;繞組溫度與軸承B溫度的參數相關性比繞組與其它參數的相關性大;與冷卻風溫度參數相關性較大的是軸承A溫度參數。

表4 發電機溫度參數的綜合相關性分析
從表5可以看出,齒輪箱輸入軸溫度參數與輸出軸溫度參數的相關性高;同時,齒輪箱油溫受入口油溫的影響較其它參數大。
由表6可知,機艙的振動參數與溫度參數具有較小的相關性;機艙的塔底柜溫度參數與塔頂柜溫度參數具有較大的相關性。
表7表明,主軸的葉輪側軸承溫度參數和齒輪箱側軸承溫度參數具有較大的相關性。
從表2到表7可以看出,同一部件的狀態參數中存在CCI值較大的參數對,說明參數具有較大的相關性,參數之間相互影響大,從某種程度上也反映了同一部件的狀態參數所包含的狀態信息具有一致性。同時,狀態參數中存在CCI值比較小的參數對,一方面說明參數的相關性較小,另一方面說明參數不僅受到同一部件狀態參數的影響,某一部件的狀態參數還會受到其它部件的影響。

表5 齒輪箱溫度參數的綜合相關性指標

表6 機艙狀態參數的綜合相關性指標

表7 主軸狀態參數的綜合相關性指標
從表8可知:機艙的塔底柜溫度與塔頂柜溫度;齒輪箱油溫與輸入軸、輸出軸、入口油溫之間;主軸葉輪側軸承溫度、齒輪箱側軸承溫度與機艙塔底柜溫度、塔頂柜溫度之間的相關性均較高。這說明風電機組的狀態參數不僅與同一部件狀態參數有較大的相關性,也與其它部件的狀態參數有不可忽略的相關性。其原因是,風電機組由多個復雜部件或子系統構成,機組正常工作依賴于各部件緊密聯系協調運行,在運行過程中各部件的狀態參數同時受多種因素的影響。
根據Pearson、Spearman相關系數的特點提出了風電機組狀態參數的綜合相關性指標,并采用綜合相關性指標量化風電機組狀態參數之間的相關性,通過分析風速、環境溫度、狀態參數的綜合相關性指標CCI,研究了風電機組狀態參數之間的關聯規律,為建立風電機組狀態參數異常辨識模型奠定基礎。

表8 不同部件部分狀態參數的綜合相關性指標