文/李浩
近幾年中國風電產業發展迅速,截至2015年,中國新增安裝風電機組已達16740臺,同比上漲32.6%。目前,風電產業已逐漸成為中國電力系統的重要構成部分。伴隨風電機組裝機容量升高,機組系統也越發復雜,使得故障產生率隨之升高,風電機組維護成本及運行成本提升。為提高風電機組運行及維護水平,基于數據挖掘技術構建大數據平臺具備重要意義。
伴隨大數據技術在各行業中的廣泛應用,風電領域也引入大數據技術,主要應用如下:如借助氣象大數據分析技術引入,可根據濕度及溫度等氣象因素對環境風速加以預測,借此增強風電系統可靠性。通過大數據計數分析風電場運行數據,可為風機制造商進一步增強風力發電機組使用性能提供科學參考。大數據技術的推廣為推動中國風力行業快速發展的重要原因,在風電領域應用大數據分析技術,可有效加強對風電場運行狀態的監控力度,增強風電機組整體使用性能。風力發電領域的運維數據資源來源主要可分為兩方面:其一為調度自動化系統借助SCADA對開關、頻率、電流及電壓狀態等信息加以采集,每年均會生成大量運行數據。現階段大數據的應用多為對實時運行數據的計算及統計分析,但并未對歷史運行數據展開深入挖掘。其二為風電設備生產管理系統將會存儲大量設備數據信息等結構化數據,多種傳感器也會定期、定時對設備運行狀態信息加以收集,主要包括視頻、圖片等非結構化數據。以應用視角展開分析發現,半自動化評價為現階段風電設備狀態的主要監測模式,此監測環境下,設備狀態信息數據價值難以被充分發揮,需對設備狀態數據展開深入分析,借此也可為風電機組故障預警體系的建立提供數據基礎。隨著數據規模日漸擴大,對數據處理時效性也提出更高要求,加之傳統技術手段已無法對數據處理業務性能需求予以充分滿足,因此,引入大數據技術尤為必要,借此也可為國內風電行業的運營、發展創造良好條件。

圖1:風電故障診斷及預警流程
大數據平臺在集控系統的應用可主要分為故障預警及性能分析兩方面。故障監測即為對控制器類復位后恢復性故障、風機自檢頻次、風機故障頻次等歷史性故障予以統計分析,并同實時數據加以比對,為故障預警提供數據參考;性能監測即為實時監測預警風機高負荷運行能力差、風機爬坡能力差、風力出力不足等風機運行性能。實時狀態監測為統計并分析設備運行的各個工況,獲取設備在不同時間因素、環境條件下的正常運行值,并同健康模型、設備參數等實時比對,評估狀態得分。當分數低于設定值時報警。大數據平臺所具備功能主要包括數據可視化功能、數據交互功能、平臺管理功能、實時預警功能、分析建模功能、實時清洗、存儲及數據實時接入等功能。
2.2.1 數據實時接入及分析
大數據平臺以Kafka集群自商用實時庫中對實時數據加以采集,并引入實時流處理系統,展開數據規則過濾及數據清洗等后續處理環節。當所接入廠站增加時,Kafka集群也可隨之擴展。當Kafka集群完成商用數據庫中實時數據接收后,Spark Streaming將會針對Kafka集群中所收集的數據展開實時流處理,完成數據處理后,數據實時存儲。大數據分析平臺為以自主研制的全量數據分析平臺、開源產品為基礎的,將多態、異構及以指數級上升的數據作為分析對象,分析全量數據并展開建模工作,此平臺可支持多種數據接口,并具備預處理、數據轉化等功能,提供非實時及實時統一接口,可應用至多種企業業務處理中,以H2O、Python、R為基礎,分析、挖掘歷史數據,完成模型構建工作。以Spark作為技術支持,可完成全量數據的評估、驗證及模型鍛煉等工作,因計算方式為并行計算結合內存計算方式,為大數據分析可在大規模集群上的良好運行提供保障,除可對數據量予以保證外,也可對數據的計算性能予以保證,完善數據分析服務。
2.2.2 數據展示平臺
大數據可視化平臺應用優勢即為可對用戶在大數據可視化過程中將所遇到的眾多問題予以處理。首先,同各行業客戶展開深入交流時發現,伴隨用戶管理水平提高、數據信息的完善,傳統固化主題分析圖表已難以對客戶所提出的使用需求予以充分滿足,客戶要求系統應具備可供用戶自由設置的多指標主題分析功能,對客戶業務發展需求予以充分滿足,實現所提供數據價值的最大化研究。由信息技術部分完成數據整理及模型構建等工作,業務人員則可于客戶端對數據分析、數據報表加以查看。但此方式在實際應用過程中存在部分問題,如數據報表的修改、規則制定中,若需求突然更改,無法及時加以處理。其次,客戶每天需面對由各業務系統所生成的大量數據,而為實現不同系統數據可視化問題的處理,則需對多數據源可視化問題加以處理。最后,伴隨大數據時代進程加快,數據數量已逐漸由百萬增加至上億,部分以Excel完成數據分析的企業針對提高企業大數據處理分析能力提出迫切需求。實際上,分布式數據分析系統的構建針對一般企業而言存在較高技術難度。為此,企業可引入大數據可視化平臺,大數據可視化平臺結合技術平臺要求、客戶需求,借助不同度量及維度的儀表盤的構建,并引入大數據引擎,完成數據融合處理及降維度等工作,實現復雜數據的抽取及轉化等功能,將數據向客戶展現。
2.2.3 風資源評估及微觀選址
風資源的準確評估為風電開發可提供有效支持,而借助大數據技術的引入可為評估風能資源提供良好平臺。基于機組SCADA數據、氣象站、附近風電場及中尺度數據間互相關聯的深度挖掘,構建后期、中期及前期一體化的數據評估模型,形成多元化評估參數,實現評估預測結果精度的進一步提升。此外,大數據平臺構建中微觀選址也尤為必要。選址的論證及專項研究、風機安全性復核、風機優化設置及風數據的處理、預測為微觀選址主要內容。此過程中,需實現大數據的數據挖掘能力、數據處理能力的充分應用。
2.2.4 故障預警及診斷
將風電機組 SCADA系統作為技術基礎,可完成數據的在線監測。隨后可在風電機組運行狀態評估中引入大數據分析技術,以此為風電機組的故障預測及故障診斷提供技術支持。因風電場選址具備一定特殊性,加之負荷的不穩定,使得部分機組在實際運行過程中產生運行故障。業內調查數據指出,風機75%的故障將會造成5%的停電時間,而25%的故障將會造成95%的停機時間,且風電機組部件的更換成本、維修成本較為高昂,對于風電場的經濟效益、安全性造成嚴重影響。所以,針對機組監控系統的監測指標等同機組運行狀態相關的指標展開故障預警、故障診斷工作尤為必要。通常情況下,風電場監測數據內容主要包括連續量、離散量等內容。風電機組在大數據環境下的故障診斷、故障預警流程如圖1所示。
借助此流程的應用,可對重要部件的非正常運行狀態予以及時監測,以免產生嚴重故障,增強風電機組運行的經濟性及安全性。
國家能源局在2016年11月所指出臺的風電發展“十三五”規劃中指出,可借助大數據技術的應用實現智能化風電場的運維管理,推動風電行業向信息化管理發展。目前,大數據多應用至數據決策、數據分析過程中,分析數據越全面,所得出分析結果將越真實。大數據分析技術的應用可實現數據信息價值的最大化應用,而以機器學習模型作為技術支持的實時故障預警也可實現風機故障率的大幅降低,提高風電機組運行的安全性、可靠性。