陳 思,陸沈雄,俞 立
(浙江華云信息科技有限公司,浙江杭州 310000)
配電網智能化的發展趨勢使其進入了能源互聯 網與大數據階段,電力企業利用配電網中電能計量裝置與智能插座等設備采集不同用戶的用電信息,以滿足配電網管理需求[1]。同時,為滿足用戶用電的個性化需求,還需集成不同類型業務范圍中的相關運營數據。因此,對配電網運營數據實施管理是確保配電網有效運行與穩定發展的基礎[2]。
目前,電力系統中配電網運營數據雖已高達PB等級,但大部分電力運營企業依舊采用較為傳統的方式來管理配電網運營數據,導致當前配電網運營數據質量與管理方法存在較多缺陷,如數據質量的實時性、一致性與完整性無法保障、數據管理環節與崗位不夠完善、數據質量管理能力較弱等[3]。這些缺陷對于配電網數據分析與管理的精度與時效性產生直接影響。因此,運營數據質量管理的有效實施對于配電網大數據應用以及數據化運營轉型尤為重要。
運營數據管理方法是大數據技術的主要技術之一。在面對配電網數據質量較差這一困境時,優化數據質量管理成為配電網大數據階段中數據管理的有效手段之一。
目前,已有一些相對成熟的數據質量管理模型,如基于數據分析的大數據質量管理模型[4]、基于PDCA 理論的全面數據質量管理模型[5],此外,還有比較傳統的基于CWM 的數據質量管理模型。然而,因電網大數據量的激增和數據復雜度的增加,傳統模型已難以更好地適應現階段的配電網運營數據質量管理。
作為判斷企業數據管理成熟度的主要方式,數據管理能力成熟度模型(Data Management Maturity,DMM)保留了部分軟件成熟度集成模型的基本原則與方法[6],通過判斷企業數據管理成熟度,幫助企業增強數據管理能力、提升效益。
為進一步提高對配電網運營數據質量的管理能力,文中設計了基于DMM 的配電網運營數據質量管理模型,幫助電力企業了解自身數據質量管理水平及缺陷,提升其數據質量管理能力。
配電網運營數據中既包含配電網運行過程中自身的相關數據,同時還包含配電網與用戶之間產生的用電數據[7],如分布式電源、大用戶等產生的相關數據。因此,在進行配電網運營數據質量管理之前,需完善通用數據管理工作,為配電網運營數據質量管理做好準備。
利用采集與維護優質數據的方式完善配電網運營過程是通用數據管理的主要目的。通常,電力企業通過設定相關組織部門,保障配電網運營數據質量管理過程的有效實現[8],并且明確數據質量管理過程中的相關崗位與職能,以保障運營數據更新的實時性。通用數據管理主要從業務術語、元數據、數據生命周期以及數據需求定義4 種方法出發,具體描述如下:
業務術語管理是配電網通用數據管理的第一階段[9],元數據與數據生命周期管理可分別輔助業務術語完善與范圍辨識。電力企業配電網運營數據中的業務術語量較大,三集五大組織結構及其職能中的業務術語是其中的典型,除對這些業務術語實施整理之外還需填充新的術語,形成業務術語手冊,并逐步優化。
元數據管理具有起承轉合的作用,既承接業務術語管理,也開啟了運營數據管理[10]。配電網運營數據中的典型元數據為公共信息模型,除此之外還存在開放應用組等,通過參考具有國際標準的元數據與配電網運營數據中的業務術語進行結合,制定符合電力企業自身特性的元數據。
數據生命周期管理的主要作用是明確與元數據對應的配電網運營數據的形成、采集與消除過程,由此明確運營數據形成的源頭,從而更好地管理這些數據的質量。
配電網運營數據的消費管理通過數據需求定義管理來實現,通過數據需求定義,電力企業可以完善元數據與數據生命周期管理,提升平臺管理性能。
基于DMM 的配電網運行數據質量管理模型是在通用數據管理的基礎上,參考以往DMM 應用的相關內容,設計由8 個過程域與5 個成熟度等級共同組成的質量管理模型。
1.2.1 過程域設計
圖1 為過程域結構,其中包含數據戰略、數據治理、數據質量以及數據平臺等。

圖1 A配電網運行數據質量管理模型過程域結構
1)企業實施數據質量管理工作的目的與原則通過數據戰略來描述[11]。該過程域中包括3 個子域,分別是規劃、進行與評估。電力企業依照配電網自身數據需求設定配電網運營數據質量管理的目的與原則,并以此為基礎設計數據職責架構;分析配電網運營數據質量管理與應用的現狀,明確當前現狀與預期目的間存在的距離;根據設定的原則規劃數據質量管理過程中的階段性任務,并逐步實施。該過程域中,電力企業需及時了解并分析階段性任務實施的進度與質量,根據實際情況優化數據戰略。
2)格式化與規范化數據的過程就是數據治理[12]。該過程域中包括4 個子域:治理組織子域與制度建設子域的功能分別是設定配電網運營數據組織架構與崗位、設置數據質量管理的相關制度與架構;治理溝通子域負責監督數據質量管理的實施,對管理過程進行指導;認責機制子域具有溝通功能。將4 個子域相結合,為數據質量管理打下堅實基礎。
3)電力企業分別利用數據模型子域和元數據管理子域的承載數據需求,清晰認識配電網運營數據分布及產生源;設計集成子域和共享子域承擔數據架構過程域的相關職能。
4)由業務術語、參考數據、主數據和指標數據4個子域組成了數據標準過程域,其主要功能是在配電網運營范圍內統一數據標準[13]。
5)配電網運營數據應用過程域中的數據分析子域,構建統計報表與趨勢分析等數據分析體系,通過數據開放共享子域推動運營數據的綜合應用,基于數據服務子域提供配電網運營數據分析決策,實現配電網運營數據增值。
6)配電網運營數據的機密性、完整性以及可用性通過由安全標準、安全管理以及安全設計3 個子域組成的數據安全過程域來實現,由此提升配電網運營數據的安全管理能力。
7)由質量需求、檢測、分析及提高4 個子域組成的數據質量過程域可以滿足配電網運營數據質量需求,實施數據質量檢測,通過分析檢測效果提升配電網運營數據質量。
8)作為配電網運營數據質量管理與應用的基礎,數據平臺過程域利用規范、架構以及管理子域分別實現統一規范體系設定、平臺構建管理與應用的指導,推動配電網運營數據融合共享[14]。
1.2.2 成熟度等級設計
在了解各過程域的目的與能力后,將數據質量管理與DMM 模型相結合,實現配電網運營數據質量管理能力的持續增強。
DMM 中數據管理成熟度分為優化、度量、穩健、管理與初始5 個級別,成熟度級別越高說明過程域能力越強,全部級別的成熟度能力均以上一級別為基礎[15]。5 個成熟度級別的具體情況如圖2 所示。

圖2 A數據管理成熟度評估等級
綜上可知,通過對過程域和成熟度等級的設計,完成對配電網運營數據質量管理模型的構建。
為驗證基于DMM 的配電網運營數據質量管理模型的實際應用性能,設計如下測試實驗。
于2019 年3 月起,將基于DMM 的配電網運營數據質量管理模型應用于某電力企業負責區域中,管理企業內配電網運營數據。
根據文中模型的8 個過程域對實驗對象的配電網運營數據質量管理能力實施評估。A 公司實驗對象數據質量管理能力成熟度等級如圖3 所示。
分析圖3 可知,實驗對象對于配電網運營數據質量的管理在數據戰略、數據治理、數據應用和數據安全等過程域中具有較高的成熟度,均達到穩健級別。說明實驗對象為配電網運營數據制定了清晰正確的數據戰略,并利用相關制度架構對配電網運營數據進行格式化與規范化,構建統計報表、趨勢分析等數據分析體系,分析配電網運營數據,推動了運營數據的綜合應用,使得數據的完整性得到保障。
由圖3 還可以看出,實驗對象對于配電網運營數據質量管理在數據標準與數據質量方面存在一定問題,勉強達到管理級別,需要進一步對這兩個方面進行加強與完善。通過加強配電網運營范圍內業務術語、主數據以及指標數據等標準的統一和完善、提升數據質量檢測與分析等方式可以彌補數據標準與數據質量管理方面的缺陷。
以上結果說明通過該文模型可更準確地分析電力企業自身配電網運營數據質量管理中存在的不足,以及同相關企業數據質量管理方面存在的優勢及差異,明確后續過程中需完善提升的方向,為配電網運營數據質量管理的提升奠定基礎[16]。
在此基礎上,為進一步分析基于DMM 的配電網運營數據質量管理模型的應用性能,設計如下對比實驗加以驗證。對比實驗對象為該文模型、基于PDCA 理論的全面數據質量管理模型和基于CWM 的數據質量管理模型。實驗時間為6 個月,對比應用不同模型后配電網運營數據的一致性、完整性與實時性。配電網運營數據各性能以百分比來描述,結果如表1~3 所示。

表1 A公司模型數據質量管理效用

表2 A分司基于PDCA理論的數據質量管理模型效用

表3 A公司基于CWM的數據質量管理模型效用
分析表1~3 中的數據可知,采用3 個模型管理配電網運營數據質量時,一年內數據的一致性、完整性與實施性均呈現上升趨勢。其中,該文模型管理下配電網運營數據的一致性、完整性與實時性分別提升3.95%、4.14%和1.24%,數據質量逐步進入穩定狀態;在基于PDCA 理論的數據質量管理模型下,數據的一致性、完整性與實時性分別提升1.94%、2.10%和1.02%;基于CWM 的數據質量管理模型管理下,配電網運營數據的一致性、完整性與實時性分別提升2.87%、2.60%和0.19%。實驗結果顯示,該文模型對于配電網運營數據質量管理效果最為顯著,基于CWM 的數據質量管理模型對于數據一致性與完整性的管理效果優于基于PDCA 理論的數據質量管理模型,但對于數據實時性管理效果不顯著。這說明該文模型對于配電網運營數據質量管理效果顯著優于兩種對比模型。
為深度驗證該文模型的實用性,分別對比在3個模型管理下,實驗對象6 個月內經濟效益情況,對比過程中忽略外在影響因素,結果如表4 所示。
將表4 中的數據用折線圖的形式表示,得到的結果如圖4 所示。
由表4 和圖4 可知,利用該文模型管理配電網運營數據質量后,實驗對象經濟效益最高可提升29.4萬元;利用基于PDCA 理論的數據質量管理模型管理配電網運營數據后,實驗對象經濟提升上限與均值分別為25.2 萬元和23.6 萬元;基于CWM 的數據質量管理模型則可分別提升25.2 萬元和24.2 萬元。相較之下,應用該文模型管理配電網運營數據質量時,實驗對象經濟效益曲線波動更為平緩,說明該文模型更利于電力企業經濟效益的提升。

圖4 A不同模型對實驗對象經濟效益影響對比

表4 A公司不同模型對實驗對象經濟效益影響對比
研究配電網數據質量管理能力是電力企業管理數據資源、評估數據管理過程、改善數據管理質量的關鍵。文中設計基于DMM 的配電網運營數據質量管理模型,在配電網通用數據管理的基礎上,設計運營數據質量管理模型,通過對各過程域成熟度的判斷,明確了電力企業對于配電網運營數據質量管理過程中的薄弱點,針對該薄弱點有針對性的加強與完善配電網運營數據質量管理過程,提升電力企業運營數據質量管理能力。在未來階段的研究中,將主要參考國內外相關領域研究動態,并結合我國電力企業配電網運營數據質量管理的實際情況,進一步完善該文模型,確保模型的長期適用性。