王 棟
(1.南通供電公司,江蘇 南通 226006;2.復旦大學管理學院,上海 200433)
近年來,隨著智能電網建設不斷推進,電網企業積累了大量的電網業務數據,這部分電網業務數據主要分為三類:電網調控運行及設備狀態數據;電網客戶供用電數據;電網企業內部管理流程數據等。這些海量的電網業務數據給電網企業的大數據挖掘工作帶來了機遇與挑戰。目前電網企業大數據挖掘工作蓬勃發展,并在一些數據處理與分析的領域取得了一定的突破。但如何快速從海量的電網業務數據中挖掘出企業需要的信息,并直接指導于企業業務的發展,顯得尤為迫切。大數據可視化技術作為數據挖掘工作的一個發展方向,已經被證明是一種解決大規模數據分析的有效方法,并在實踐中得到了多個行業的廣泛應用[1]。
在電網企業中,運用大數據可視化技術可以將海量的電網業務數據在有限的大屏幕上予以直觀的展現,高效地進行大規模的數據分析,進而提高了電網管理的各項業務水平。目前,電網企業中的大數據可視化技術處于初步的發展階段,相關技術難點如高維、時變數據的特征追蹤、圖像合成算法研究等仍有待進一步解決[2]。
數據可視化技術的發展按照時間順序大致有如下幾個階段:多維信息的可視編碼(1950~1974年),該階段主要確定了構成圖形的基本要素;多維統計圖形階段(1975~1987年),該階段主要建立起數據分析的基本框架,將可視化引入統計分析,將信息可視化發展為一門學科;交互可視化階段(1987~2004年),該階段主要將計算機圖形學和圖像方法推廣應用于計算科學,并正式定義了科學可視化(scientific visualiztion);可視分析學階段(2004年至今),作為一門新興的學科,可視分析學的主要研究對象是海量、高維、多源和動態數據分析與挖掘,輔助用戶做出有用的決策[3]。
數據可視化的主要處理對象包括科學數據以及抽象的非結構化信息,結合數據分析的重要性與可視化技術的發展歷程,數據可視化相應的可以分成3個分支:科學可視化、信息可視化和可視分析[1]。
(1)科學可視化主要面向的領域是物理、化學、氣象、醫學、生物等學科,對數據和模型進行測量、解釋、模擬和交互分析。其數據通常表達的是三維或二維空間量,可以粗略地分為標量場可視化、向量場可視化、張量場可視化三類。由于電網企業大數據絕大多數不屬于科學可視化數據的范疇,在此對科學可視化不做詳細介紹。
(2)信息可視化主要研究對象是抽象的、非結構化數據集合,實現非空間復雜數據的視覺呈現[4]。信息可視化的關鍵研究問題是在有限的空間中以直觀的方式傳達大量的復雜抽象信息。實現信息可視化的方法主要決定于數據類型,主要有時空數據可視化、層次與網絡結構數據可視化、文本和跨媒體數據可視化、多變量數據可視化四類。電網企業的大數據如電網運行數據、電力客戶數據和電網企業管理數據基本上都屬于以上數據類型,因此信息可視化是電網企業的可視化技術研究主要方向之一。
(3)可視分析涉及多個學科,由圖形學、數據挖掘分析、人機交互等學科交叉組成,是數據可視化發展的一個較高階段。可視分析能通過先進的方法與工具,實現人與海量數據之間的復雜信息高速交流[3]。可視分析能在電網的運行管理、應急事件處理、負荷預測等方面發揮較大的作用,因此可視分析也是電網企業數據可視化研究的熱點。
電網企業的主營業務主要包括電網運行維護、電力客戶服務、人財物等核心資源運營管理等,相應的電網企業大數據可以分為電網運行數據、電力客戶數據及電網企業管理數據三類[4]。
(1)電網運行數據主要包括電網運行關鍵指標及電網潮流數據、設備狀態監測遙信(測)數據、變電場所視頻監測數據等。除視頻、圖像數據為非結構化數據以外,其余數據均為結構化數據,且具有一定的時序分布特點。隨著智能電網建設的進一步推進,大量的物聯網智能終端設備投入運行[5],采集點的覆蓋范圍愈加廣泛,電網調度與生產管理系統獲取的實時性監測數據被大規模的存儲與處理。據測算,一個年售電量達300億kW·h 規模的地市供電公司,其電網調度系統按5 min 采樣模式,年度產生的電網主要設備運行數據量達到250 GB 左右。隨著快速采樣技術在智能電網中的不斷實踐運用[6],電網運行數據量還會呈現幾何級數的增長,若采樣精度提高至5 s,年度數據量則會突破15 TB。
(2)電力客戶數據主要包含電費、電價、業擴服務等相關營銷數據。智能電網的一個重要環節——智能用電終端采集系統的配置已經得到了范圍較廣的覆蓋。目前在地市電網公司層面,智能用電采集裝置覆蓋率超過99%,數百萬的電力客戶的用電信息已經基本實現用電行為、用電量等信息的實時記錄與存儲。以低壓智能采集系統為例,終端智能電表最小采集周期為15 min,每24 h 與采集終端通訊一次,傳輸日電量相關信息。部署15 萬采集終端的地市供電公司,年度用電信息采集存儲量會超過60 GB。若將系統儲存的用電信息存儲周期細化,相關數據報文信息進一步豐富,則年度數據量將會達到TB 以上級別。
(3)電網企業管理數據由各級業務支撐系統所產生,主要包括企業資源計劃管理(ERP)系統、財務管控、檔案管理等。各級業務流程的節點數據、過程數據等結構化數據是電網企業管理數據的最大組成部分。隨著ERP 系統的使用愈加廣泛,電網企業已經積累了大量的業務節點明細數據。
由于電網大數據具有海量、多類、低價值、處理要求高等特點[5],通過信息可視化與可視分析的技術方法,能快速地挖掘出高精度、時變及多變量數據的潛在價值信息。但針對不同的電網大數據,需采取不同的可視化分析方法。
(1)電網運行數據可視化分析。近年來,隨著智能配網技術的不斷突破,電網運行數據已經不僅僅包含傳統的系統主要設備參數數據,越來越多的高精度配電網終端數據不斷接入配電自動化系統,并改變了以往由于終端信息缺失導致的事故處理判斷不全面的問題。由電網系統主要設備參數與配網終端數據組成的電網運行數據具有時序、高維、快速的特點,應采取信息可視化與可視分析相結合的技術方法進行處理。
基于系統的主參數及配網終端數據,可以構建一個全景的電網絡信息拓撲圖,并在圖中將相關信息采取信息可視化及可視分析的技術手段實現豐富信息的集中展現。在此全景的電網拓撲圖中能夠實現如下幾類問題的在線分析:重要設備健康狀況的在線監測與分析;分布式微電源系統的運行評價;專線用戶的用電行為特征分析與預測;對電能質量進行在線評價與分析等。
(2)電力客戶數據可視化分析。電力客戶數據的來源主要來自于廣泛部署的智能用電終端信息采集系統,如上文提到的用戶集采系統存儲了大量的用戶電量信息。利用可視分析的技術方法,能實現如下幾類可視化應用:將用戶電量信息與用戶地理區域、行業劃分一一對應,可以實現用戶用電行為分析與負荷特性的可視分析;結合前期推廣部署的地理信息系統(GIS),能繪制全面的地區電力客戶地圖,并將該全景電力客戶地圖按照一定的權限向公眾開放,實現用戶的用電互動服務,實時反饋購、用電信息[7];將行業、地區用戶電量信息與氣象因素、經濟發展因素結合考慮,同時考慮用電檔案、用電量分析、負荷特性分析、電費分析、用電影響模型、產能利用率等多個影響因子,實現超短期負荷預測,并最終通過降維處理的方式實現負荷預測結果可視化呈現。
(3)電網企業管理數據可視化分析。電網企業管理數據復雜多樣,且大多具有結構化的特征,對其進行可視化分析可以根據源業務系統的特點開展。如對財務管控系統的業務數據,可以按照現金流量特點,繪制平面現金流圖,在此基礎上實現下鉆查詢與動態查詢分析。如要實現對電網企業管理情況進行全面的系統分析與展示,則需要構建一套全新的業務模型,并在此基礎上實現可視化的各項功能。類似于電網絡信息拓撲圖,可以構建企業經營管理在線監測網絡拓撲圖,對現有的流程網絡進行梳理,以企業經營目標和業務流程為脈絡,查找發現企業運營目標、端到端業務流程、業務節點活動中的邏輯層次關系,繪制基于流程網絡與流程指標的電網企業管理在線監測網絡拓撲圖,并在此圖上實現信息可視化與可視分析等交互功能。
大數據挖掘處理主要是對數據進行存儲,再結合分析的需要讀取數據進行計算處理,對基礎平臺的要求是存儲可擴展,計算能力可伸縮[8]。關于大數據挖掘處理系統的基礎平臺構建,已經有較為成熟的研究,目前主流的分布式數據管理系統有Hadoop,GFS,Cassandra 和Dynamo 等。文獻[5]中提出了為智能電網大數據構建多級存儲系統,通過任務管理、調度與監控,依托Hadoop 云計算系統與并行、實時數據庫技術,將各業務系統的數據進行接入存儲與分析處理。基于云計算平臺的解決方案已經被越來越多的大數據研究與運用機構所采用,但在部署基于云的大數據平臺時,仍然需要重點關注數據間的關聯關系,提高云傳輸效率。關于數據挖掘系統基礎平臺的構建在文獻[9-11]中已有詳細討論,且在多家省級電網公司中已有大量的實踐。
作為大數據挖掘處理結果與過程的終端反饋,可視化系統的實現可以有多種方式。對于電網大數據的分析處理而言,在基于云存儲與計算的平臺上,通過高級應用接口調用現有第三方可視化軟件平臺更易于實現,但其局限在于可視化系統功能可擴展性和交互性較差。因此將可視化系統與現有數據存儲、計算處理的平臺整合,自行開發針對不同業務模型的可視化展示應用顯得更為有效。面對大數據分析處理結果的不同用戶、不同的顯示終端等情況,可視化展示系統的構建需要充分予以考慮,并提出個性化的解決方案。在構建可視化系統的過程中同樣需要充分考慮可視分析的交互性功能,通過交互工具開發,允許人與海量復雜信息之間的快速交流,提供先進的分析手段、交互技術和可視表達,使可視化充分發揮其巨大的潛力,展現大數據挖掘分析的價值。
作為大數據挖掘分析工作的高級運用與結果的最終體現,可視化技術需要引起電網企業的高度重視,方能實現大數據挖掘分析技術的最大潛力,推進智能電網的建設。目前電網企業大數據挖掘分析工作雖然不斷取得新的突破,但是將相關數據繪制成高精度、高分辨率的圖片的業務模型、智能算法和交互式圖形處理工具開發的研究才剛起步,相關可視化系統的功能實現需要進一步予以研究開發。
[1]袁曉如,張 昕,肖 何,等.可視化研究前沿及展望[J].科研信息化技術與應用,2011,02(4):3-13.
[2]JOHNSON C.Tops Cientific Visualization Research Problem[J].IEEE Computer Graphics and Applications,2004,24(4):13-17.
[3]陳為,沈則潛,陶煜波,等.數據可視化[M].北京:電子工業出版社,2013:15-36.
[4]宋亞奇,周國亮,朱永利.智能電網大數據處理技術現狀與挑戰[J].電網技術,2013,37(4):927-934.
[5]杜 威,潘 苗.物聯網在智能電網中的應用[J].江蘇電機工程,2013,32(4):81-84.
[6]李寧峰.基于TMS28335的智能電網快速采樣系統設計[J].江蘇電機工程,2012,31(6):35-38.
[7]閆龍川,李雅西,李斌臣,等.電力大數據面臨的機遇與挑戰[J].電力信息化,2013,11(4):1-4.
[8]肖 飛,齊立磊.大數據處理技術與探索[J].計算機與現代化,2013(9):75-77.
[9]米可菲,張 勇,邢春曉,等.面向大數據的開源推薦系統分析[J].計算機與數字工程,2013,41(10):1563-1566.
[10]CCF 大數據專家委員會.2014年大數據發展趨勢預測[J].中國計算機學會通訊,2014,10(1):32-36.
[11]胡雄偉,張寶林,李抵飛.大數據研究與應用綜述(下)[J].標準科學,2013(11):29-33.