張國斌,張叔禹,劉永江,郭瑞君
基于大數據與人工智能技術的電力在線技術監督平臺建設方案
張國斌,張叔禹,劉永江,郭瑞君
(內蒙古電力科學研究院,內蒙古 呼和浩特 010020)
本文結合內蒙古電網特點,介紹了內蒙古全區發電側電力在線技術監督平臺的設計方案。首先,明確提出了內蒙古電力在線技術監督平臺的架構設計方案及應遵循相關要求,并對基于源、網、荷綜合數據基礎上重點開發的功能模塊進行介紹;同時,結合平臺建設中數據預處理等實際案例,詳細闡述了云計算、人工智能與大數據技術相結合的具體應用策略以及在未來電力行業的應用;重點分享了在平臺定位、功能設計、模塊開發、網絡架構設計等方面的一些思考和經驗,以期為電力系統大數據技術的應用與開發提供有益借鑒。
大數據;人工智能;云平臺;智能算法;建模;評價;在線監控平臺
大數據(big data,BD)[1]是相對于小數據樣本的高質量、海量、多源異構的數據資源,與傳統數據庫(database,DB)相比,無論在數據來源、處理方式以及在數據的思維等方面都帶來了顛覆性的變化[2]。在對已獲得的數據進行流處理(stream processing)、批處理(batch processing)[3-4]等處理后,才能利用大數據專用深度挖掘、分析的算法和工具,構建數據模型和分析體系。目前,很多發電集團、電網公司都建立了自己的數據中心,但目前還處于數據的存儲、監測及初級開發層面,沒有實現真正意義上的大數據挖掘利用,尚未實現橫跨源、網、荷綜合數據的收集、分析與處理,也沒有實現政府層面對整體電力工業安全、能耗與環保的監督與管理。究其原因主要有3點:一是其數據中心“先天不足”,非基于Hadoop、Spark平行大數據架構[5]因而后期難以利用大數據工具開展大規模數據挖掘開發工作;二是受限于發電、電網公司各自獨立的企業屬性,無法打破壁壘、實現相互間數據貫通;三是數據平臺的開發建設方不具備政府授權,無法代行政府技術監督職能。
內蒙古電力科學研究院主導開發建設的內蒙古電力在線技術監督平臺能夠實現源、網、荷數據的融合與貫通,并能夠以整體全區電力工業的視角開展大數據平臺建設和開發。內蒙古電力在線技術監督平臺是國內目前第一個基于大數據架構設計并落地實施的遠程在線技術監督平臺,從網絡架構設計、建設和功能開發等方面在全國都有一定的示范效應。
本文結合大數據、人工智能最新技術和內蒙古電力在線技術監督平臺設計、開發、建設過程中的實際經驗,首先明確提出了內蒙古電力在線技術監督平臺的架構設計方案及應遵循相關要求,并對基于源、網、荷綜合數據基礎上重點開發的功能模塊進行介紹;同時,結合平臺建設中數據預處理等實際案例,詳細闡述了云計算、人工智能與大數據技術相結合的具體應用策略以及在未來電力行業的應用。
內蒙古電力在線技術監督平臺整體規劃設計為主站平臺和數據子站兩大主體部分。主站平臺包括云計算平臺、大數據平臺及支撐應用開發的基礎服務。其中,云計算支撐多種硬件和應用軟件,并具備按需擴展的彈性。大數據平臺提供采集、存儲、清洗、挖掘建模(元數據管理、計算、利用)、分析、聯機查詢、運行維護等能力,并通過基礎服務提供各高級應用的通用支撐。主站平臺配備2臺核心交換機,交換容量為31.1Tbps/153.6Tbps,配備12臺主服務器,其中5臺大數據計算及控制服務器、5臺虛擬化服務器、2臺數據庫服務器,系統采用開放式設計能夠滿足后期系統擴建,具有足夠的延展性。具體網絡架構如圖1所示。

圖1 內蒙古電力在線技術監督平臺網絡
數據子站主要是通過在電網調度側和發電側設立數據采集終端,完成數據接入、顯示及傳輸。其中,電網調度側數據針對數據實時性與系統安全性的不同要求,采用了網絡規約通信和異步數據包2種并存的數據采集方式。這里需要強調的是,對于異步數據包采集方式,要提前建立詳細的數據點表并明確數據屬性,數據點表形式見表1。
表1 數據測點

Tab.1 The data measuring points
內蒙古電力在線技術監督平臺電廠側數據的采集使用大唐先一科技公司研發的智能數采通裝置,其支持國內外主流DCS/PLC并滿足TCP/CP、OPC/DDE、Profibus等電力規約和RS232/485等通信協議。為方便現場數據采集裝置投運后的監視和運維,內蒙古電力大數據平臺特別設計開發了數據采集前端的本地存儲和顯示功能,投運后能夠達到預期目標,使用效果良好。
1.2.1規范化
基于大數據分析的內蒙古電力在線技術監督平臺建設嚴格遵循規范化原則,嚴格遵循國家標準和行業標準,同時提供標準的數據交換格式,以開放式的數據結構保證支持與其他系統的數據集成應用。平臺建設過程中,還將逐步明確并制定相關的標準規范體系,包括數據規范、編碼規范、功能規范、接口規范、管理制度等。
1.2.2擴展性
在平臺設計與建設初期就應全面考慮到系統部署方式的可擴展、空間數據模型的可擴展、應用功能的可擴展和服務的可擴展,使平臺在后期擴展及升級過程平滑穩定。
1.2.3實用性與先進性相結合
平臺建設要在確保實用可靠的前提下,采用先進的云計算、大數據技術,以實現對系統軟硬件 系統資源、計算能力的有機整合與靈活定制,使系統能夠適應未來的擴展需要,確保系統的先進性 和實用性。
1.2.4安全性
平臺建設必須符合國家電力信息安全相關規范要求,做好大數據平臺數據安全的技術防護[6],通過數據分類分級、數據細粒度訪問控制、數據加密、數據脫敏等技術保證數據的安全,杜絕各種數據安全隱患。同時,也應考慮遵從例如內蒙古電力公司等具體實施個體在技術架構和信息安全規范等方面的具體要求。
1.2.5可維護性及可靠性
平臺應具有可維護性和可靠性,能夠對系統運營狀態進行實時、動態監視,并根據監測結果及時啟動相應的及平臺資源維護能力。
內蒙古電力在線技術監督平臺在統一的標準和規范下,采取模塊化設計[7-9],主要包括基礎軟硬件管理、分布式文件系統、虛擬計算管理、安全控制管理、資源調度管理、基礎硬件狀態和性能監控、統計分析及異常情況報警等技術模塊。
內蒙古電力在線技術監督平臺功能包括:大數據通用采集、存儲、清洗、挖掘建模、分析、聯機查詢、運行維護等;支持常用海量數據存儲方案、數據處理方法和分析挖掘算法[10];支持結構化數據、半結構化數據和非結構化數據的采集、存儲、分析挖掘、檢索;提供統一的數據服務訪問機制。支持時序、關系數據庫及非結構化文件數據存儲;支持分布式文件系統以保證平臺的可擴展性;采用分布式集群拓撲架構以確保支持平滑擴充容量及計算能力;提供硬件基礎設施集成服務,根據平臺及高級應用的系統需要提供分布式微服務架構的系統集成服務,完成包括交換機、服務器、分布式系統的基礎資源池化系統集成服務。
內蒙古電力在線技術監督平臺于2017年完成方案設計,按照總體規劃、分步實施的原則進行,現已基本完成一期建設。平臺最終建成后將涵蓋50多家火電廠150多臺機組、200多家新能源場站以及電網側變電站和區內主要電力大用戶。綜合考慮海量數據、功能要求等各項因素,平臺采用了基于Hadoop[11]的大數據架構,其通過分布式文件系統(HDFS),構成對大數據平臺所有數據的文件支撐,包括實時數據庫、分布式數據倉庫HIVE、分布式列式HBASE等。同時,大數據平臺也保留了傳統的關系型數據庫(例如Oracle),并通過大數據專用工具實現Hadoop中數據和關系型數據庫之間的數據轉換和互通。大數據平臺構架圖如圖2所示,該大數據平臺系統可高效支持大數據集運算,并具有高度容錯性和可擴展性。
根據電力大數據平臺服務對象的準確定位,就可以開展相應的各應用子功能的設計與開發。內蒙古在線技術監督平臺一期主要側重于解決網源協調及火電機組安全等重大問題,主要開展網源協調在線監測分析、熱電聯產機組在線監測分析、機組能耗在線監測分析、機組安全監測分析、火電機組污染物排放監測分析、電站金屬設備大數據分析6方面工作。
1)網源協調在線監測分析
開展涉網機組自動發電控制(AGC)、一次調頻、自動電壓控制(AVC)、電力系統穩定器(PSS)、勵磁調節(AVR)在線監測分析與診斷;對電網波動、線路保護、機組非計劃停運、重要電力用戶異常情況的監測、統計分析;火電機組技術出力與調峰能力監測、分析及診斷。
2)熱電聯產機組在線監測分析
熱電聯產機組冬季供熱能力在線監測、分析與診斷、預測;調峰能力在線監測、分析與診斷、預測;基于大數據分析挖掘網域內供熱機組熱電解耦潛力。
3)機組能耗在線監測分析
對涉網電廠煤耗指標進行統計、分析;分析計算機組發電熱耗、汽缸效率、熱效率等能耗指標;對發電機、高壓廠用變壓器、主變壓器、起備變壓器進行線路電量平衡監測,分析計算廠用電率,測算損耗,指導企業生產節能降耗。
4)機組安全監測分析
監測機組涉及安全穩定運行的保護類參數如振動、溫度類(如瓦溫、缸溫、風溫、鐵芯溫度等)、間隙類(如膨脹、脹差、軸向位移等),進行指標計算、分析、預警和診斷。
5)火電機組污染物排放監測分析
對二氧化硫、氮氧化物、粉塵等減排關鍵指標進行統計、分析;依據機組發電量、污染物排放合格率、環保設施運行投入率等參數核算發電廠及機組環保電價;為制定污染物超標處理及電網電量分配和節能減排方案提供依據。
6)電站金屬設備大數據分析
挖掘金屬設備生命周期中不同階段的性能數據(包括制造、運行、維護更換、失效分析),結合電力大數據平臺采集的設備運行溫度和壓力變化趨勢或者分布,根據設備或者部件的特征參數(氧化皮厚度、管壁厚度、應力因子),實現設備性能老化在線分析,完成設備失效概率預測,設備潛在失效模式預判。電力大數據平臺建設是一個龐大的工程,做好頂層設計,制定合理的分期計劃和技術路線非常重要,內蒙古電力在線技術監督平臺在建設之初,結合項目實際需求制定了相應的技術路線,具體技術路線如圖3所示。

圖2 內蒙古電力在線技術監督平臺架構

圖3 內蒙古電力在線技術監督平臺技術路線
大數據時代對傳統的分析技術如數據挖掘、統計分析、機器學習等提出了不同的要求,比如小數據中挖掘信息的算法可能就不適用于大數據挖掘。因此,不僅要開發出新的算法如在線機器學習算法如在線的機器學習算法(online machine learning),而且要依靠云計算作為大數據處理的有效工具,使算法具有強大能力并具有可擴展性。對于電力大數據平臺而言,可以通過建立企業私有云或租用公用云的方式,搭建電力數據專屬云平臺。針對電力行業在國民經濟中具有的特有屬性,建議云平臺的建設以獨立開發企業私有云為宜。
內蒙古電力在線技術監督平臺建設同時考慮了使用計算虛擬化技術,包括對服務器硬件資源的虛擬化,以及對虛擬資源、用戶側資源、業務層資源的集中管理,同時虛擬化技術也為上層應用云平臺,不同業務調度與應用部署提供了技術支撐。利用云平臺虛擬化特性可以有效提高計算平臺資源利用效率,保障運算系統的連續可靠,加速新版塊、新功能的開發與上線。
內蒙古電力在線技術監督平臺建設著力打造大數據與人工智能的深度融合。其中,數據的清理和有效是數據平臺運行的基礎。為此,該平臺在數據處理過程中除采用了機理分析、數理統計的方法之外,還采用了基于相關性檢驗的方法。這即考慮到了參數變量間的相關與耦合,通過交叉驗證檢測不良數據,對于2個存在線性關系的變量,采用了線性回歸、殘差分析實現對離群點的檢測,而對于復雜的多變量則采用了多元置信域的分布檢測方法,具體而言,就是將數據群視為維正態分布數據總體,其均值的100(1-)%置信域由滿足 式(1)[12]的集合構成:


以對某發電廠1號機組給煤機煤量與磨煤機一次風量運行數據的檢測為例,選取為0.4,得到置信域如圖4所示。各參數檢測結果如圖5所示。由圖4、圖5可見,該檢測方法可確保現場采集到的運行數據有效、可用。

圖4 數據置信域

圖5 檢測結果
內蒙古電力在線技術監督平臺一期建設設計的6個主要業務功能模塊就運用Kmeans聚類[13]、隨機森林[14]、神經網絡[15]、決策樹[16]、線性回歸[17]等人工智能算法進行數據建模,并運用分類模型評價、回歸模型評價等評價工具對已建成的模型質量進行評估,以驗證模型有效。數據挖掘及建模流程如圖6所示。

圖6 數據挖掘及建模流程
通過人工智能技術和大數據的結合,內蒙古電力在線技術監督平臺現已開發完成涉及參數測量、安全分析診斷、性能分析評估等多個數學模型。例如:選取磨煤機電流、壓差、溫差、一次風壓、飛灰含碳量等多個監測參數,構建了基于BP神經網絡算法的煤質預測模型,實時預測入爐煤基水分、基灰分、干燥無灰基揮發分和低位發熱量;基于汽輪機診斷監測管理系統(TDM)收集的數據利用快速傅里葉變換后形成相應的專業圖表,實現汽輪機振動遠程診斷和分析;基于大數據平臺實現了電廠DCS數據的實時采集和存儲,開發了火電機組節能監測與分析平臺,自動生成月度能耗分析報告;搭建了機組煤耗監測的目標值求取模型,利用梯度提升數GBT回歸算法搭建了熱耗率預測模型;利用多項式回歸搭建了重要經濟技術指標隨發電負荷變化的特性曲線預測模型,回歸效果滿足技術監督監測與分析需求;通過廣域監測系統(WAMS)采集全網頻率、機組實發功率與轉速等實時數據,建立一次調頻綜合性能指標體系,在大小擾動下全面分析機組一次調頻動作合格率,并根據綜合性能指標全面分析機組一次調頻能力等等。
下一階段,內蒙古電力在線技術監督平臺將逐步納入風電、光伏、水電等新能源系統數據,在氣象災害預警、風電的集中功率預測、風機性能分析和水電的精準調度、機電設備狀態監測與故障分析等方面開展研究和探索。
大數據是信息化發展的新階段,大數據技術、人工智能技術、云計算技術同實體經濟的深度融合,將推進經濟數字化建設,并為國家創新發展提供重要動能。建設內蒙古電力在線技術監督平臺,以其為載體開展了智能計算、數據挖掘等一系列研究與實踐工作,初步實現了項目啟動之初的“三服務一對接”的戰略定位,即服務電網、服務電廠、服務全區主要電力用戶,對接政府監督職能。平臺的建成將促進內蒙古電力工業的技術創新和產業升級,在提升電力工業整體安全的同時也將創造出明顯的經濟、社會效益。
[1] 劉冰, 龐琳. 國內外大數據質量研究述評[J]. 情報學報, 2019, 38(2): 111-120.
LIU Bing, PANG Lin. Review of domestic and international research on big data quality[J]. Journal of the China Society for Scientific and Technical Information, 2019, 38(2): 111-120.
[2] 李清泉, 李德仁. 大數據GIS[J]. 武漢大學學報(信息科學版), 2014, 39(6): 641-644.
LI Qingquan, LI Deren. Big data GIS[J]. Geomatics and Information Science of Wuhan University, 2014, 39(6): 641-644.
[3] 宋亞奇, 周國亮, 朱永利. 智能電網大數據處理技術現狀與挑戰[J]. 電網技術, 2013, 37(4): 927-935.
SONG Yaqi, ZHOU Guoliang, ZHU Yongli. Present status and challenges of big data processing in smart grid[J]. Power System Technology, 2013, 37(4): 927-935.
[4] 劉智慧, 張泉靈. 大數據技術研究綜述[J]. 浙江大學學報(工學版), 2014, 48(6): 957-972.
LIU Zhihui, ZHANG Quanling. Research overview ofbig data technology[J]. Journal of Zhejiang University (Engineering Science), 2014, 48(6): 957-972.
[5] 王賽一, 余建平, 孫豐潔, 等. 電力大數據的價值密度評價及結合改進-means的提升方法研究[J]. 智慧電力, 2019, 47(3): 8-15.
WANG Saiyi, YU Jianping, SUN Fengjie, et al. Evaluation and promotion methods with improved-means for value density of electric power big data[J]. Smart Power, 2019, 47(3): 8-15
[6] 包英明. 大數據平臺數據安全防護技術[J]. 信息安全研究, 2019(3): 242-247.
BAO Yingming. Data security protection technology in big data platform[J]. Journal of Information Security Research, 2019(3): 242-247.
[7] 王元卓, 靳小龍, 程學旗. 網絡大數據現狀與展望[J]. 計算機學報, 2013(6): 1125-1138.
WANG Yuanzhuo, JIN Xiaolong, CHENG Xueqi. Network big data: present and future[J]. Chinese Journal of Computers, 2013(6): 1125-1138.
[8] 王珊, 王會舉, 覃雄派, 等. 架構大數據挑戰現狀與展望[J]. 計算機學報, 2011(10): 1741-1752.
WANG Shan, WANG Huiju, QIN Xiongpai, et al. Architecting big data: challenges, studies and forecasts[J]. Chinese Journal of Computers, 2011(10): 1741-1752.
[9] 張東霞, 苗新, 劉麗平, 等. 智能電網大數據技術發展研究[J]. 中國電機工程學報, 2015, 35(1): 2-12.
ZHANG Dongxia, MIAO Xin, LIU Liping, et al. Research on development strategy for smart grid big data[J]. Proceedings of the CSEE, 2015, 35(1): 2-12.
[10] 孟小峰, 慈祥. 大數據管理: 概念、技術與挑戰[J]. 計算機研究與發展, 2013,50(1): 146-149.
MENG Xiaofeng, CI Xiang. Big data management: concepts, techniques and challenges[J]. Journal of Computer Research and Development, 2013, 50(1): 146-149.
[11] 嚴亞寧. 基于Hadoop的數據處理平臺的設計與開發研究[J]. 現代信息科技, 2019(3): 5-7.
YAN Yaning. Design and development of data processing platform based on Hadoop[J]. Modern Information Technology, 2019(3): 5-7.
[12] JOHNSON R A , WICHERN D W. Applied multivariate statistical analysis[M]. New Jersey: Prentice Hall, 2002: 4-10.
[13] 侯敬儒, 吳晟, 李英娜. 基于Spark的并行Kmeans聚類模型研究[J]. 計算機與數字工程, 2018(3): 537-540.
HOU Jingru, WU Sheng, LI Yingna. Research on parallel Kmeans clustering model based on Spark[J]. Computer and Digital Engineering, 2018(3): 537-540.
[14] 關曉薔, 龐繼芳, 梁吉業. 基于類別隨機化的隨機森林算法[J]. 計算機科學, 2019(2): 196-201.
GUAN Xiaoqiang, PANG Jifang, LIANG Jiye. Randomization of classes based random forest algorithm[J]. Computer Science, 2019(2): 196-201.
[15] 孫志軍, 薛磊, 許陽明, 等. 深度學習研究綜述[J]. 計算機應用研究, 2012(8): 2806-2810.
SUN Zhijun, XUE Lei, XU Yangming, et al. Overview of deep learning[J]. Application Research of Computers, 2012(8): 2806-2810.
[16] 劉小虎, 李生. 決策樹的優化算法[J]. 軟件學報, 1998(10): 797-800.
LIU Xiaohu, LI Sheng. An optimized algorithm of decision tree[J]. Journal of Software, 1998(10): 797-800.
[17] 王惠文, 夢潔. 多元線性回歸的預測建模方法[J]. 北京航空航天大學學報, 2007(4): 500-504.
WANG Huiwen, MENG Jie. Predictive modeling on multivariate linear regression[J]. Journal of Beijing University of Aeronautics and Astronautics, 2007(4): 500-504.
Construction scheme of power online technical supervision platform based on big data and artificial intelligence technology
ZHANG Guobin, ZHANG Shuyu, LIU Yongjiang, GUO Ruijun
(Inner Mongolia Electric Power Science and Research Institute, Huhhot 010020, China)
On the basis of the characteristics of Inner Mongolia power grid, this paper introduces the design scheme of electric power online technical supervision platform in Inner Mongolia power generation side. First of all, the architecture design scheme of the Inner Mongolia electric power online technical supervision platform is put forward and the relevant requirements that should be followed are pointed out, and the functional modules developed on the basis of source side, grid side and load side comprehensive data are introduced. Moreover, combined with the actual cases of data pre-processing in platform construction, the specific application strategies combined with cloud computing, artificial intelligence and big data technologies as well as their applications in the furture electric power industry are introduced in detail. It focuses on sharing some experiences in platform positioning, function design, module development and network architecture design, hoping to provide useful reference for the application and development of big data technology in electric power system.
big data, artificial intelligence, cloud platform, intelligent algorithm, modeling, evaluation, online monitoring platform
TK323
B
10.19666/j.rlfd.201904108
2019-04-22
張國斌(1972—),男,碩士,正高級工程師,主要研究方向為電廠熱能動力及自動化控制,zgb7230@163. com。
張國斌, 張叔禹, 劉永江, 等. 基于大數據與人工智能技術的電力在線技術監督平臺建設方案[J]. 熱力發電, 2019, 48(9): 94-100. ZHANG Guobin, ZHANG Shuyu, LIU Yongjiang, et al. Construction scheme of power online technical supervision platform based on big data and artificial intelligence technology[J]. Thermal Power Generation, 2019, 48(9): 94-100.
(責任編輯 楊嘉蕾)