常永娟 賀月


摘? 要:隨著電力企業的信息化建設的發展,運行的事務管理系統保存了海量的運行數據,成為電力企業決策管理的最有價值的原始資源。然而,各地區及部門間信息化建設的不平衡性和獨立性致使無法構建有效的知識管理系統,難以提供企業級的決策分析支持。數據倉庫的建立可以解決為電力企業提供決策分析信息存在的困難。本文引入了數據倉庫的概念,詳細介紹了數據倉庫的構成、內容和技術特點。研究了數據倉庫建模的方法。結合電力系統的特點,提取出適合于數據倉庫建立的主題概念。通過數據處理技術對電力系統事務管理系統保存的海量數據進行整合,構造面向決策的電力系統數據倉庫。
關鍵詞:電力企業? 電力系統? 電力主題? 邏輯模型? 物理模型
中圖分類號:TP311.1 ? ? ? ? ?文獻標識碼:A? ? ? ? ? ? ? ? ? ?文章編號:1674-098X(2021)02(c)-0124-03
Construction and Application of Data Warehouse in Electric Power Enterprise
CHANG Yongjuan? HE Yue
(Information and communication branch of State Grid Hebei Electric Power Co., Ltd., Shijiazhuang, Hebei Province, 050013 China)
Abstract: With the development of information construction of power enterprises, the running transaction management system has saved a large amount of operation data, and has become the most valuable original resource for decision-making and management of power enterprises. However, due to the imbalance and independence of information construction among regions and departments, it is difficult to build an effective knowledge management system and provide enterprise level decision analysis support. The establishment of data warehouse can solve the difficulty of providing decision analysis information for power enterprises. This paper introduces the concept of data warehouse, introduces the structure, content and technical characteristics of data warehouse in detail. The method of data warehouse modeling is studied. Combined with the characteristics of power system, the topic concept suitable for data warehouse is extracted. Through the data processing technology, the massive data stored in the power system transaction management system are integrated, and the decision-making oriented power system data warehouse is constructed.
Key Words: Power enterprise; Power system; Power theme; Logical model; Physical model
電力系統數據倉庫的體系化結構環境與操作型數據庫的環境存在著很大程度的不同[1],集中體現在兩個方面。(1)應用層面上:基于操作型環境的應用主要體現在聯機事務處理(OLTP)的處理上,而體系化結構的數據倉庫環境則主要表現在獲取決策分析層面上;(2)數據源層面:電力系統中操作型數據庫的數據來源通常為手工錄入數據和自動錄入的遙測、遙信等信息量,而體系化的數據倉庫環境的數據來源來自操作型數據庫,其在電力系統中的應用體現在自動化的應用場所[2]。
為了簡化方案設計、組織管理和最終實現的措施和方法,本文提出數據倉庫體系結構,描述電力系統數據倉庫中組件之間的相互關系。電力系統數據倉庫的體系結構如圖1所示。由數據源,ETL(Extract-抽取、Transform-轉換、Load-加載)工具、數據倉庫主體以及分析主題數據庫等四個方面構成。
1? 電力系統的數據特點
近年來,電力公司逐年增加了建筑信息化建設的成本,這在電力企業信息化方面取得了長足的進步。電力公司已經積累了大量的電力系統運行數據。這些數據主要來自一些已經建立并運行的自動化應用系統,例如SCADA/EMS,DMS,MIS和GIS[3],對于電力公司而言,它成為重要的原始運營數據。在市場經濟環境中,當取消對電力公司的管制并將其整合到商業環境中時,準確的能源市場信息和知識將為電力公司提供基本的決策計劃。然而,由于公司之間的信息化結構的不平衡以及業務運營的獨立性,當今的電力公司無法基于散布在業務部門之間的信息來構建有效的知識管理系統。結果,累積的原始數據不能為公司提供良好的決策分析,這主要表現在以下幾個方面:(1)數據整合不良;(2)各種信息來源導致數據冗余;(3)缺乏用于企業級決策的支持系統[4]。
在已有的信息系統的基礎之上建立數據倉庫,形成“數據驅動”型的結構是解決當前電力企業應用系統各種弊端的有效手段[5]。數據倉庫建立的目的是為決策服務提供支持,由于數據倉庫的數據量龐大,其數據更新必須簡單易操作,否則對數據倉庫的維護存在的很大的困難。因此在數據倉庫建立伊始,必須進行合理的設計,使數據倉庫滿足在數據量不斷增加的情況下對數據的查詢保持高效的要求,實現為決策者提供強有力的信息支持[6]。
2? 電力系統數據倉庫的設計
電力系統數據倉庫的設計可以分為以下四個階段:
(1)主題概念的設計:必須從分的調研電力企業的實際業務和用戶需求,從而能夠根據用戶的需求劃分成主題元素;(2)邏輯模型的設計:建立與主題元素對應的并且適合當前數據倉庫的邏輯表示方法(星形模型或者雪花模型);(3)物理模型的設計:設計符合邏輯模型的數據倉庫存儲方式(即數據倉庫的表的結構、字段等屬性);(4)數據處理的設計:構建數據倉庫時,數據進入倉庫前的數據檢查工作、數據倉庫構建后對倉庫中數據的進行追加、抽取等工作。
2.1 電力主題概念的設計
數據倉庫的建設需要具備可行性和實用性,必須從“需求驅動”和“數據驅動”的角度出發考慮,并制定相應的建設方法。根據不同的業務范圍,對發電企業提出如下的數據倉庫主題設計方法。
(1)發電量/負荷量數據倉庫。
在進行數據倉庫的建設時,首選的主題應是發電量及負荷量。發電量/負荷量數據倉庫能夠對最小時間間隔內每臺機組的發電量、上網電價、所帶負荷等相關數據信息進行準確的記錄。這里所說的最小時間間隔應視其具體條件來取值,一般為1/4h或者1/2h。發電量或負荷量均可以通過數據倉庫調出供用戶分析使用,并統計、描繪時、日、月、年的發電量以及相應的負荷曲線。
(2)電力設備數據倉庫。
對各個發電設備的基礎數據、缺陷數據、檢修方式數據、可靠性統計數據等信息,參照設備的實時運行參數進行集成操作,形成統一的格式,按照時間先后順序錄入到數據倉庫中,形成決策分析的知識數據,從而為設備狀態的綜合評價提供良好的數據基礎。在統一格式的運行數據的基礎上,進一步采用智能算法等數據挖掘方法,設計研發電力設備狀態檢修的輔助決策支持系統。
(3)發電成本數據倉庫。
作為最為直接有效的信息資源,各項成本費用的發生情況是進行成本分析的原始資料。成本費用分為固定成本和動態成本兩方面。通過按時間(小時、日、月、年)的計算方式得到各自成本。采用統計計算方法計算供電企業每小時、每日及每月的成本。計算結果保存作為數據源數據存儲到發電成本數據倉庫,成為電廠“競價上網”依據的數據基礎。在數據倉庫的基礎上構筑電廠成本模型,開展深層成本分析,為進一步進行發電成本的預測和控制奠定基礎。
2.2 邏輯模型的設計
OLTP采用實體-關系模型解釋數據間關系,不僅消除冗余數據,并且確定了數據的正確性。維度建模采用直觀的標準數據結構表達數據,是符合這種實體--關系模型的邏輯設計方法。維度模型由事實表和維度表組成。事實表和維度表均為復合索引。同時,通過索引每個維度表與事實表的特定的部分精確對應。
設計出一個企業級的數據倉庫是數據倉庫構建的具體實施方案首條任務。當數據倉庫建成之后,再按照該數據倉庫中的數據模型來構建數據集市。深入透徹的研究企業的數據結構,并廣泛調研用戶的需求是進行數據倉庫的建模之前必須完成的任務。
2.3 物理模型的設計
不同的數據集市通過維度表的密切關聯,是通過對數據倉庫中的數據進行有效的物理建模實現的。集成不同主題之間的數據,解決了企業的信息“孤島”,并最終實現企業級的數據倉庫的建設。
以電力營銷的業務為例,對數據倉庫的物理建模技術進行詳細的說明。通過對電力營銷部門相關企業數據以及業務流程圖的分析,確定出相應的決策主題,列寫出與各主題相對應的事實表及維度表。
3? 客戶的應用
電力系統數據倉庫的使用流程圖可以表示成圖3的形式。最終建設電力系統數據倉庫的目的,是能夠讓電力系統企業的工作人員容易方便地使用數據倉庫技術,用以獲取最有價值的決策信息。從而能夠迅速、準確判斷實時變化的網絡運行狀態,并制定相應的應對策略。因此需要在數據倉庫的服務端設計出的服務接口,提供友好的操作界面。目前較為廣泛采用的是B/S模式,它通過Web為各用戶提供查詢、分析等服務。
電力設備的數據倉庫用Oracle Discover作為前端數據展現工具。用戶可以對查詢的字段以及顯示的形式等進行自定義,并提供了動態隨機的查詢方法。不僅可以實現報表生成、Web發布等功能外,還可以對那些規模比較大的報表以餅圖、曲線圖等各形式直觀地反映給用戶。
4? 結語
隨著電網建設的進步,電力公司的信息化建設取得了長足的進步。由于各個地區和部門之間信息化建設的不平衡,交易管理系統之間的信息交換存在障礙,并且從大量數據中獲取支持決策所需的信息存在技術困難。有關電力公司的運營信息以及部門之間聯合運營的困難,數據倉庫技術為電力公司提供了有關其決策信息的良好而有效的手段。
在實際應用中,由于整個企業范圍的數據倉庫的構建非常龐大,因此設計復雜,需要大量的業務和技術專家,這不可能一蹴而就。因此,在實際應用中,具有緊急決策分析需求和大量歷史數據的部門應首先建立部門級數據集市,然后積累經驗,擴大應用范圍,并逐步統一,公司中每個部門的數據集市根據數據倉庫總線的結構而定。同時,由于電力系統數據倉庫的建設仍處于初期階段,因此在業務需求和功能實現方面仍有許多方面需要改進。此外,電力系統數據倉庫的設計需要根據用戶使用的反饋信息進行進一步修改。
參考文獻
[1] 楊雷.基于數據挖掘的電力調度管理系統設計與實現[D].北京:電子科技大學,2019.
[2] 莊新闖.電力負荷數據管理系統的設計[D].上海:東華大學,2018.
[3] 邱菊,王巖,黃佩卓,等.大型電力企業基于GBase分布式數據倉庫建設初探[J].計算機應用與軟件,2018,35(5):184-189.
[4] 張瑜,潘紅芳.內蒙古電力數據倉庫的應用[J].電信科學,2016,32(4):175-180.
[5] 許楊子.電力交易運營數據倉庫主題模型建立的研究及應用[J].信息記錄材料,2018,19(7):194-195.
[6] 童光華,李寧,張銀昌,等.基于數據挖掘技術下電力計量數據倉庫模型研究[J].自動化與儀器儀表,2018(5):40-42.