楊鳳玖
【摘?要】在當今大數據和互聯網的時代,數據資源已經被公認為是和自然資源一樣具有重要的價值,也是推動經濟與社會發展的重要戰略資源。大數據不僅是引導國家經濟建設轉型的信息引擎,更是企業通過數據分析發現機會、搶占市場的制高點,大數據之于企業經營的重要性不言而喻。電力行業是國民經濟以及國家發展戰略的重要支撐行業,隨著信息技術與電網建設的快速融合與發展,電力大數據已經成為電力行業未來發展的核心。基于此,本文主要對電力大數據基礎體系架構與應用進行分析探討。
【關鍵詞】電力大數據;基礎體系;架構;應用
1、前言
隨著電網企業信息化建設的不斷推進,電網企業數據量、數據類型、來源等都有了巨大變化,數據量以幾何級爆炸式速度增長,同時數據類型越來越復雜、多樣。利用大數據的概念和技術,深度分析利用電網企業大容量、類型繁多的數據,能夠獲取大量的數據附加價值,為電網企業在大數據背景下的發展、管理、規劃提供有效支撐。
2、電力大數據基礎體系框架的研究方法
2.1 現狀及發展趨勢研究
從技術、產品、應用3個維度對業界大數據研發情況進行梳理,提煉不同層面的研發方向及要點,依據梳理及提煉的調研要點,對業界大數據的技術、產品、案例進行深入分析,結合業界大數據技術的實際成果,進行深入分析和研討,對各家廠商分別編寫調研分析報告,形成《業界大數據技術現狀與發展趨勢調研匯總表》以及《大數據技術現狀與發展趨勢調研分析報告》。
2.2 應用現狀、方式與需求
從軟硬件基礎環境、應用、業務、數據現狀和技術現狀5個維度對國家電網公司內“三集五大”體系中大數據的應用情況、應用方式及業務需求進行調研,綜合現階段調研取得的主要成果,對各業務需求調研分析的整體情況進行匯總,并將應用分析結果和示范建設內容寫入《國家電網公司大數據應用研究報告》。
2.3 制定大數據發展規劃
總結提煉出契合國家電網公司的大數據概念和技術研究方向,確定公司大數據總體目標與原則,明確大數據技術研究和業務應用方向,確定大數據研究的主要任務和典型應用場景,確定公司大數據應用分析及大數據總體架構與技術路線,并統籌制定大數據工作開展的相關保障措施。
2.4 大數據基礎框架與演進路線
1)技術篩選:結合電力大數據的定義和內涵,選取大數據所包含的詳細技術。
2)分層技術研究:從管理層、計算層和應用層梳理電力大數據涉及的關鍵技術以及各種技術之間的關系。
3)基礎框架提出:對業界大數據技術路線進行比對,結合業務系統數據現狀和需求,分析并提出電力大數據基礎體系框架。
2.5 大數據管理規范
在國家電網公司層面形成電力大數據統籌管理機制和規章規范制度,保障公司各業務部門及省(市)電力公司在進行電力大數據建設時,滿足國家電網公司大數據相關政策、總體規劃及基本要求,保證電力大數據建設的高效管控與有序開展;建立公司級跨部門協調、決策機制,公司各部門統籌協調,統一組織內部科研產業單位、省(市)電力公司開展電力大數據的研究、建設和推廣。
2.6 大數據相關應用標準
通過梳理國內外大數據相關標準,深入分析公司信息通信、智能電網和“三集五大”已有的相關標準,并結合電力大數據技術研究、產品研發、試點建設,總結凝練形成大數據標準規范,覆蓋數據計算、數據存儲、數據安全、數據挖掘等層面。
2.7 大數據建設與應用規范化模式
綜合分析公司業務對大數據應用需求的成熟度和緊迫度,擬定未來大數據應用的主要業務領域。研究并分析業界大數據應用建設的成功經驗,結合公司大數據建設情況,對技術研究、組件研發、標準制定、應用驗證等進行全局統籌把控,制定電力大數據建設的模式,同時開展各業務典型場景的應用規范化研究工作,實現電力大數據對各業務場景應用流程的全程把控,從而對電力大數據的廣泛應用提供指導依據。
3、電網大數據應用關鍵技術
3.1集成管理技術
電網企業數據集成管理技術是將多個應用系統數據合并,建立擁有更多功效的企業應用程序的過程。從集成的角度來講,便是把不同來源、方式、特征的數據在邏輯上或者存儲介質上有機地集中,針對系統中存儲的一系列面向主題、集成化、相對穩定、體現歷史的數據集,從而提供一個全面的數據共享系統。借助數據挖掘技術,提供對業務狀況和趨勢精細化的監測分析手段,在大數據存儲管理的最重要的技術是NoSQL數據庫技術,采用分布式數據存儲模式,消除了關系數據庫的關聯特性,具有良好的可擴展性,解決了海量數據的存儲難題。
3.2數據分析技術
基于大數據挖掘的客戶用電行為分析,以龐大海量的客戶用電行為數據為基礎,通過識別不同客戶群體的行為特征,從而達到科學的客戶認知、風險管理、個性化營銷和服務的目的要求。數據挖掘和機器學習算法在大數據環境下,可以從3個方面入手:一是從大數據治理與采樣、特征選擇角度,將大數據小數據化;二是對大數據進行聚類,分類算法研究。
3.3數據處理技術
電力大數據的數據處理技術包括分布式計算技術,內存計算技術,流處理技術等。分布式計算技術是為了解決大規模數據的分布式存儲與處理。內存計算技術就是為了解決高效的數據讀取和處理問題。流處理技術是處理數據的實時到達、速度和尺度。分布式計算是研究如何將計算能力強的問題分解成許多小部件的一種新的計算方法,最后將結果結合起來,得到最終的結果。問題庫建設為包含運營重大問題、運營問題根源、管理措施的多維知識庫,其設計分為結構設計、標準設計和分類框架設計。主要汲取卓越績效、精益管理、全面質量管理、標準化、價值鏈、BPR等先進管理思想和理念,并結合電網企業運營特征進行提煉和總結。
4、結語
隨著電力系統的快速發展,數據量的增加,專業需求的變化,電力企業大數據將依托應用體系架構實現統籌管控、匯聚共享,為企業高效運營、戰略決策提供有力支撐。
參考文獻:
[1]張吉生,張波,于燁.基于大數據架構的變電設備運行質量智能評價[J].貴州電力技術,2017,20(09):37-41.
[2]陳武.基于多類數據及模型融合的設備評價分析研究[J].電力大數據,2017,20(09):14-16.
(作者單位:國網蒙東供電服務監管與支持中心)