新疆龍源風力發電有限公司 謝 強
風能以其清潔性、可再生性以及儲量豐厚的優勢,受到電能開發領域的廣泛關注,無限潛力等待挖掘。隨著清潔能源戰略實施與推廣,風力發電場規模擴增,單個風電場的風電機組數量相應增加。風電機組需要采集大規模的風能,所以場所往往設立在偏遠、惡劣的山區沿海等地,遭受意外因素侵襲的概率較大,影響風能向電能轉換的效果,因此保障風電場所安全運行是實現風力發電效率增長的基本要求。近年大數據在信息監測與分析領域展現了良好的性能,風電場運行期間產生大規模狀態數據以及性能信息,恰好符合風電安全分析預警的需求,可用于指導風電安全監控行為。
傳統的風電安全監控預警系統僅能在故障發生時發出警告,風電機組面臨停工的風險,經濟損失巨大。為此,基于大數據構建嶄新的風電安全監控預警云平臺,提前預測風電機組的故障隱患,將風電運行的風險扼殺在源頭。云平臺采用Spark 作為內存計算模型,在云端完成風電大數據處理;原始風電安全數據經清洗、轉換后,采用隨機森林模型展開深度故障挖掘,平臺根據故障挖掘結果進行安全監控預警,安全狀態評估以及預警警報在預警模塊顯示。
本次平臺設計采用了經典的Spark 大數據計算平臺,其運用彈性分布式數據集實現數據集緩存在內存中的存儲;Spark 采用Lineage 容錯機制集成了SQL、MapReduce、Streaming 等多個數據處理模型,構成一個完整的、多場合使用的大數據處理系統;容錯機制起到了減少數據處理時間開銷的作用[1]。
基于Spark 內存計算構建的大數據風電安全監控預警云平臺架構為:數據采集層(機械狀態傳感器,機組功率傳感器,風速傳感器,GIS)-數據存儲層(數據清洗、轉換,分布式文件系統,分布式文件數據庫)-數據計算層(Spark 內存計算,MapReduce 模型,Streaming 模型)-分析數據分析層(數據挖掘算法-分電故障預測-風電安全分析)-風電安全預警。其中數據存儲層、數據計算層、數據分析層構成終端大數據處理平臺。由此架構可知,平臺以互聯網為中介將采集層獲得的風電安全數據上傳至云端大數據處理平臺中,上傳至云端之前已經完成數據加密處理;在云平臺上完成大數據的存儲、計算與分析。同樣,風電安全主控中心人員需要訪問云平臺獲得安全預警數據。
風電安全監控預警主要包括風電安全狀態數據采集、數據預處理與存儲、數據計算、數據分析四個主要過程。其中,風電安全狀態數據采集類型主要有風電機械狀態信息、風電機組運行功率信息、風電運行風速信息等,綜合監控風電機組運行數據以全面了解其是否即將發生故障,為機組維修與安全運營提供參考依據。在風電大數據存儲方面,平臺采用了分布式文件系統(HDFS)與分布式文件數據庫(HBase),實現風電安全大數據在多個計算機節點上的分散式存儲,數據丟失風險大大降低,安全系數提升。此外云平臺集成了數據挖掘算法,基于風電安全監控大數據預測機組故障趨勢,一旦出現機組故障或存在故障風險及時向監控中心界面發出故障預警。
預警云平臺的硬件環境設計如下:核心交換機、數據庫與應用服務器是平臺網絡技術的主要構成,網絡與平臺內部計算機節點信息傳輸則以路由交換技術來完成。在此網絡環境中,風電安全狀態數據通信網絡的通信速度可達1000Mbps,對應的接口設備和工作站WMCS 的最小通信速度也在100Mbps 及以上。風電主控制中心具備遠程監控機組運行狀態的功能,因此設置在各個風電機組處的子站受控于主站,且二者通過專門性網絡完成數據共享與傳輸。
數據采集功能。本文在數據采集層中設置了風電機械狀態傳感器、風電機組運行功率傳感器、風電運行風速傳感器等數據采集設備,保障了數據采集的全面性與多樣化。平臺具備多數據源數據采集接口,以支持預警平臺高效、穩定的傳輸風電安全監控信息。數據采集接口操作簡單,接口安裝完畢后,將對應的接口協議驅動程序、IP、權限等內容集成在平臺端即可。由于風電機組安全監測的對象、數據類型均有差異,所以需考慮好同類數據的維護與管理問題;數據向下一模塊傳輸的方式與傳輸頻率可由用戶自行定義。
預處理模塊。各類傳感器采集的原始數據規模較大、數據殘缺、冗余信息量大,需進行數據清洗提高原始風電安全狀態數據的利用價值[2]。數據清洗操作主要包括刪除同類型重復數據、合并同源數據等,用戶可使用清洗預覽功能查看數據清洗效果,檢查已被清洗掉的數據。隨后采用平滑、規格化等方式實施大數據轉換與歸并,以獲取適合數據處理的數據描述形式。各部分風電安全數據預處理完畢后,以數據接口為介質傳輸到安全狀態預測模塊進行深度挖掘與分析,進一步發送到故障預警模塊。
傳統的安全預警平臺預警原理是設置一個風電安全狀態閾值,當前風電機組運行超過閾值則發出不同程度的警報,通知技術人員進行維護與修整。本文基于大數據技術布局預警平臺,采用故障預測的方式取代閾值預警法,基于數據挖掘算法探索風電安全狀態發展的深度規律,預測風電故障發生情況,從而做出科學詳細的風電安全狀態預警。平臺采用隨機森林模型作為預測風電安全狀態的數據挖掘模型,其原理是采用分類與回歸的方式建造一個整體性之的決策樹,屬于近鄰預測算法范疇[3]。該模型優勢是不受數據規模的干擾而提高運算量,具有良好的預測性能。隨機森林模型中的決策樹個體數據挖掘過程中高方差與高偏差問題頻發,隨機森林使用較少的參數生成一個科學的決策模型,旨在解決此問題。
基于決策樹判斷風電故障主要是對風電狀態數據進行分類,假設存在一個類別X,則有I(X=xi)=-log2p(xi),式中不確定信息為I(X),xi發生的可能性用p(xi)表示。上述公式中風電安全狀態預測是通過熵來實現的,熵的功能是估計不確定的事物,熵較小的情況下X=xi隨機性越弱。由此總結風電安全狀態預測的隨機森林模型的生成規則為:風電安全狀態訓練樣本數據-測試樣本采集(多個)-樹分類器(多個)-隨機森林-故障分類結果。本文平臺集成了隨機森林數據挖掘算法,用于進一步預測風電機組故障類型,例如齒輪故障等,依次挖掘出風電機組的機械狀態信息、風電機組運行功率信息、風電運行風速信息。
風電安全預警模塊具有可視化顯示功能:可視化仿真技術應用。模塊采用三維仿真模擬顯示技術設計了風場設備流程圖,直觀的展示機組所在位置以及安全狀態信息,一旦出現安全事故預警會出現紅色提示[4];診斷報告生成。點擊故障對象可實時顯示風電機組設備的詳細狀態信息、生產風險評價曲線、安全狀態評估報告、故障診斷報告,平臺預警產生的故障診斷報告將一同發送到機組管理人員手中,作為故障分析歷史依據。風電安全狀態信息將展示一日內、一周內或是一個月內該設備的安全狀態變化趨勢。安全預警模塊具備全面的警報管理功能,警報詳細時間及持續時長、警報頻率、追蹤維修水平等信息均可在客戶端查詢到,便于維修人員綜合分析故障發生的原因,盡可能在故障萌芽初期解決風電安全隱患。
風電屬于清潔型新能源,利于環境友好型、資源節約型社會構建,逐漸發展成為新時期電能生產的主流途徑。本文基于大數據技術設計的風電安全監控預警云平臺存在兩點優勢:改變以往閾值判斷風電機組故障的傳統方式,采用數據挖掘算法預測風電故障,對可能存在故障的機組設備提前預警,提醒維修人員進行設備檢修,阻止深度安全事故發生,避免機組停止工作帶來的經濟損失;大數據技術將各類型風電安全狀態信息進行匯總分類,在海量信息中篩選有價值信息,方便新能源專家對風機模型的深入探究,為新能源技術革新、效率優化提供便利。