任君, 岳鵬飛, 張智宇, 王彪, 劉慧源
(1.中國農業機械化科學研究院呼和浩特分院有限公司,呼和浩特 010010;2.內蒙古農業大學機電工程學院, 呼和浩特 010018)
新能源發電領域當中,風力發電是目前技術最成熟、最具規模化開發條件發電方式之一[1]。風功率曲線描述機組凈電功率輸出與風速的函數關系,是反映風電機組功率特性與運行特性的重要指標[2],為獲取準確的風功率曲線中外學者進行大量研究。
孔維勝等[3]提出了基于密度的噪聲應用空間聚類(density-based spatial clustering for noise applications, DBSCAN)和區間DBSCAN (DBSCAN-Interval DBSCAN)組合的異常檢測模型,對環繞型分散數據、堆積型數據有良好的識別效果。喬伊林[4]對于異常越線數據建立高維經驗Copula模型,清洗后數據質量顯著提升。臧鵬等[5]針對離散型異常數據提出基于K-means的數據清洗方法,數據的真實性與可用性得到較好提升。封焯文等[6]將基于密度的聚類算法、局部離群因子算法、Thompson-tau 四分位法和孤立森林法用實例測試比較,得出孤立森林法較其他方法有更高的精度。Rauh等[7]提出一種區間最大值的取點方法,并以實際數據證明其可行性。
風功率曲線擬合也有研究者提出較多的擬合方法,其中參數方法主要包括分段線性模型、函數擬合模型、四參數/五參數 logistic 模型和七階多項式模型等;非參數方法主要有模糊邏輯回歸模型、人工神經網絡模型、K最近鄰以及樣條回歸模型等[8-10]。
綜上所述發現被動式偏航系統的風電機組數據處理方法應用較少,故現提出對于被動側偏限速小型風電機組預數據處理方法,將孤立森林法[11]應用于風電機組數據異常數據處理,后續采用比恩法[12]、最大值法比較確立最優方法并建立擬合直線,最后選用內蒙古自治區蘇尼特右旗賽漢塔拉風場,FD4.0-2 kW/10機組數據驗證該方法的有效性。
(1)風電機組輸出功率P。
(1)
式(1)中:P為小型風力發電機的輸出功率,W;ρ為空氣密度,kg/m3;Cp為風能利用系數;R為風輪半徑,m;V為額定風速,m/s;η為發電機效率。
風力發電機將在自然風中的能量通過風輪轉換為機械能,驅動發電機,轉換為電能存儲在蓄電池或并入電網。空氣密度受當地大氣溫度壓力等影響,額定風速由當地風資源選定。
(2)風能利用系數Cp。風能利用系數Cp作為風電機組特性的系數,可以反映風輪轉化風能效率及其風輪的性能優劣。
(2)
(3)尖速比。
(3)
式(3)中:n為風輪轉速,rad/min。
尖速比λ是葉片的葉尖線速度與風速的比值,由式(3)中風輪轉速、來流風速、風輪半徑均對尖速比有直接影響。
小型風電機組的側偏尾限速機構(圖1),尾翼與風電機組機艙及風輪不在同一軸線上,FD4.0-2 kW/10機組組具有一定偏心距ε=0.05 m。尾翼桿安裝在側偏軸上可以自由轉動。

f為風輪到偏轉中心距離;ε為偏心距;φ為風輪軸線與來流風向之間夾角
當風速大于額定風速及以上時,尾翼側偏,使風輪偏離主風向,風輪以及發電機艙所在直線在水平面上具有一定過夾角φ,實現限速功率控制。
偏航限速機構原理主要為力矩平衡原理:風輪繞偏轉軸偏轉時風輪側偏產生的力矩與尾翼產生的氣動力矩相等,尾翼對斜絞軸的氣動力矩與重力回位力矩相等[13]。
孤立森林法(isolation forest)孤立森林算法的主要思想是:給定n個樣本數據X={X1,X2,…,Xn},特征維度為d,隨機選擇特征q和其分隔值p,遞進分割數據集X來構建孤立樹,直到無法繼續分割或達到孤立樹預設最大高度。孤立樹中樣本點x的路徑長度h(x)定義為第i棵樹的根節點到葉子節點所經過的邊的數量。由n個樣本組成的數據集,生成模型樹的平均路徑長度c(n)定義為
(4)
(5)
式中:H(i)為調和數,通常設置為lni+ε,其中ε為歐拉常數取0.577 215 664 9;E[h(x)]為每棵樹關于x的路徑期望值取值在(0,1);s(x,n)為異常值函數,取值在(0, 1)。s靠近0判斷為正常,s靠近1判斷為異常[15-16]。
(1)最大值法。先將所有數據以極小時間區間為一間隔分成N個互不交叉、大小相等的數據區間,區間名字定義為j,在j區間內取更小區間i=1,在此區間取最大值Nk1,取第二個小區間i=2(此區間包含i=1區間)k次取值后小區間與j區間重和停止,取其中最大值為Nk(j),即對于給定區間j的第k次取值Nk中的最大值k(j)定義為功率曲線P(t)中的一點。
(6)
Nk(j)≥Nki
(7)
(2)比恩法。比恩法把風速等間隔地分成N個區間,稱作風速比恩。例如,取每比恩的寬度為0.5 m/s,求出分布在各比恩中數據點的風速Vi、功率平均值Pi,共得到個N組(Vj,Pj)。
(8)
(9)
式中:i為比恩個數;j為第j個數據;n為區間內數據個數。
對于風功率曲線擬合,其中多項式擬合方法方法響應迅速、擬合精度較高,其原理就是將區域內的點用多項式建立的平滑曲線鏈接起來,并繪制出散點圖的大致走向。多項式展開系數由最小二乘法確定。
P=aC+b
(10)
(11)
a=(CTC)-1CTP
(12)
多項式擬合應適度擬合,過度擬合會使其擬合直線準確性大大下降。
根據上述理論搭建處理流程如圖2所示,處理流程實現平臺基于軟件MATLAB2021(a)孤立樹設定100棵,每棵樹可獨立選取256個數據。先將數據按照風速區間1 m/s進行數據拆分,后將數據輸入系統,設定異常值函數閾值,開始計算篩選出異常點,提取不失真數據。數據篩選整體離散性較大,采用最大值法與比恩法分別進行選點處理對比分析。

圖2 數據處理整體流程圖Fig.2 Overall flowchart of data processing
最大值法:對所選數據進行分組,以風速0.1 m/s增量間隔為一組,以最小數據為初始點以0.1為增量,并選出每組最大風速和對應功率作為該組得最大實測數據值。將分組后產生的最大值實測數據與其相對應功率進行散點圖繪制,在選取風速區間增量時不宜過大,應相對于風電機組工作的風速區間進行選取小型風電機組工作風速一般處于4~16 m/s若風速區間選擇過大會使整體分組較少,進而數據點數量過少失去參考價值。
比恩法:風速增量劃分同上述最大值法,將所測數據以風速區間增量0.1 m/s進行區間劃分,將每個區間中的功率、風速進行均值計算,所得出平均風速Vj及平均功率Pj作為該風速區間的平均實測數據,將(Vi,Pi)作為一個數據對進行散點圖繪制。
將兩種方法進行比較以數據點離散程度、連續程度、趨勢等作為評價指標。選擇出可清晰表達出功率曲線特征的散點圖,進行下一步多項式擬合。多項式擬合曲線,其中多項式系數最小二乘法進行確定,采用四次多項式擬合,最終得出功率曲線及其擬合方程。
選用被動側偏限速FD4.0-2kW/10風電機組,具體參數如表1所示。

表1 小型風力發電機組系統參數Table 1 Small wind turbine system parameters
在符合GBT 19068.2—2017標準下進行數據采集,測試地點為內蒙古自治區蘇尼特右旗賽漢塔拉風場,測試機組為FD4.0-2kW/10機組,將在農牧區、偏遠無電地區應用。測風塔位置在風輪前10 m水平高度9.0 m并與風力發電機組沿來流風向呈同一直線位置。氣溫、壓力傳感器同樣安裝在測風塔水平高度1.2 m。機組輸出功率如圖3所示。

圖3 采集系統采集原始的數據Fig.3 The acquisition system collects raw data
圖3所示采集數據整體展現“噴灑狀”,數據在風速達到11 m/s之前呈現出密集,且形成一定方向的數據帶,在11 m/s以上16 m/s以下數據開始呈現大范圍的離散狀態,說明風速范圍超過本風力發電機組額定風速,風力發電機組已經偏航,風輪已不再正對來流風速方向,與尾翼向地面垂直的某一平面發生偏轉。
(1)異常數據篩選。從圖4可知,孤立森林法將原始數據中功率過高、過低等離散度較大的點進行篩選。

紅色點為異常點;藍色點為正常數據
(2)最大值法。圖5所示,整體較原始數據有了很大的簡化,功率在風速6 m/s前離散度小功率數值處于0附近,風速6 m/s之上達到11 m/s之前,數據離散度進一步加大呈現一定函數關系的上升趨勢,變化趨勢隨著風速的增大逐漸減小,風速在11 m/s以上16 m/s數據離散度達到最大,出現功率數值下降的情況,但數據過于分散,無法直觀呈現功率與風速兩者之間的函數關系。最大值法處理,可以從直觀上看出數據一定的變化趨勢,但是無法精確數據變化趨勢變化的點,數據隨著風速的增加,在風電機組不同階段的工作區間離散度逐漸加大。

圖5 最大值法處理數據結果Fig.5 The maximum method processes data results
(3)比恩法。對原始數據進行比恩法分析,以0.1 m/s為一個風速區間,數據可劃分為121個風速區間,對每個區間風速,功率取平均值,取得121組數據對(Vmax,Pmax)數據對組成散點如圖6所示。

圖6 比恩法處理數據結果Fig.6 The Bean method processes the data results
圖6數據整體體現某種函數關系,數據點較為緊湊,無明顯間斷,在風速12 m/s之前中點功率的變化趨勢呈現先平緩后增高再平緩狀態,符合風力發電機組功率隨風速變化的趨勢,12 m/s以上16 m/s以下數據點開始出現波動數據離散性加大,但數據整體線性度較好,數據點呈現隨著風速增大,輸出功率減小的。
比恩法與最大值法相比從圖像來看較為簡潔數據離散程度較小,數據整體連續性較好無明顯間斷。在達到額定功率之前的變化趨勢符合風力發電機組功率隨風速變化的關系,故選用比恩法。
(4)多項式擬合。根據文獻[14,18]進行適當階數多項式擬合,使其誤差最小,減少因過度擬合造成的誤差,如圖7和表2所示。

表2 2 kW風電機組功率擬合曲線

圖7 2 kW風電機組功率擬合曲線Fig.7 2 kW wind turbine power fitting curve
所測得實際風速與功率呈“噴灑狀”的帶狀散點分布,擬合后的曲線估計值與實際功率之間存在著一定偏差,與實際功率之間誤差越小的曲線越能代表風電機組的實際輸出功率。常用的誤差衡量指標為均方根誤差(root mean square error, NRMSE)[17]以及歸一化平均絕對誤差(normalized mean absolute error, NMAE)。
(13)
(14)
式中:Pai為實際功率;Pbi為擬合估計值;Pe為額定功率;N為樣本總數。
表3給出使用該處理方法進行曲線擬與原始數據直接擬合的功率曲線的NRMSE和NMAE指標。

表3 方法使用前后的等值曲線誤差Table 3 The method uses the equivalence curve error before and after
使用該方法處理后的數據NRMSE與NMAE分別相對原數據直接擬合出功率曲線降低了65%和71%說明該處理方法對降低擬合誤差有著明顯的效果。
風能利用系數Cp是風力電機組的一個重要指標,以式(2)、式(8)和式(9)聯立,后續處理數據來源于FD4.0-2 kW/10機組實測數據,得出121組數據對Cp值,式(3)、式(8)和式(9)聯立,得出相應的尖速比,建立Cp與尖速比λ散點圖如圖8所示。

圖8 Cp-λ關系圖Fig.8 Cp-λ diagram
如圖8所示該風電機組定槳距角下最大Cp為0.3對應尖速比7.08處,在達到最大尖速比之前過程中Cp隨著λ增大而增大,達到而定尖速比之后Cp隨著λ增大逐漸階梯式下降。風輪啟動時轉速較低其尖速比高風能利用系數較低,隨著風輪轉速的增加尖速比逐漸降低至額定尖速比,風能利用系數逐漸增加到額定風能利用系數,故圖8中尖速比3.99增長至7.08區間為該風力發電機組偏航限速區間,區間數據點緊湊,過渡平滑是該風力發電機組偏航限速機構穩定降低風輪所受過量氣動力的表現。
FD4.0-2kW/10機組,其額定功率為2 kW,以其擬合功率曲線為參照,符合GBT 19068.1—2017規定其性能要求,在11 m/s時達到額定功率2 kW。并且在額定風速以上運行時其輸出功率不小于額定功率,例如:12 m/s時代入擬合曲線,輸出功率為2.14 kW。切出風速為4 m/s,停機風速為18 m/s。該風電機組的擬合曲線在風速達到13 m/s時輸出功率開始下降。
提出了一種對于被動式偏航的風力發電機組風功率曲線的處理方法,以2 kW被動側偏限速風力發電機組輸出數據輸入流程處理,驗證數據處理流程效果良好。并對該風力發電機組側偏限速機構性能進行分析。
(1)該流程數據篩選采用孤立森林法進行,對照未處理前數據明顯去除一定風速下功率過高點以及過低點。選點流程對比一種最大值法與比恩法選點效果,對比結果表示比恩法取點的平滑性、連續性及離散性遠優于最大值法。
(2)用整體流程對FD4.0-2 kW/10 被動側偏限速風電機組實測數據進行算例分析,使用均方根誤差(NRMSE)以及平均絕對百分比誤差(NMAE)為評價指標,驗證該數據處理方法的準確性。
(3)對該小型風電機組在達到額定功率前其輸出功率呈現上升趨勢,并且在超過額定風速之后出現下降趨勢。該機組Cp-λ所呈現變化趨勢與其輸出功率的變化趨勢相同。說明該機組的被動側偏限速機構設計合理。