吳才遠
(貴州電網有限責任公司計量中心,貴州貴陽,550000)
當前對電力數據質量評估研究主要以定性探討為主,缺乏定量評估的實例。本研究在前人定性研究的基礎上,采用定性與定量相結合的層次分析法進行電力數據質量評估,該方法主要運用在對電力數據質量指標評測時的權重打分環節中,實現評估結果的量化。
層次分析法AHP由美國匹茨堡大學教授T.L.Saaty提出,是一種定性與定量相結合的決策分析方法。層次分析法首先將復雜的問題分解成若干層次,建立階梯層次結構,然后構成判斷矩陣,進行層次單排序一致性檢驗,最后進行層次總排序和一致性檢驗,得出相關結論[3]。具體來講,層次分析法是將決策者的決策思維過程與經驗判斷模型化、數量化,用決策者的經驗判斷各衡量目標能否實現的標準之間的相對重要程度,并合理地給出每個決策方案的每個標準的權數,利用權數求出各方案的優劣次序[4],可有效地應用于難以用定量方法解決的電網計量數據質量評價相關研究領域。
電力數據質量評價體系是進行數據質量評價的基礎,在處理數據質量問題的各個過程中,數據質量評價是提高數據質量的基礎和關鍵,通過構建電力數據質量評估體系,可以科學、客觀地評價出數據的真實情況,使用戶清晰、明確地了解到當前數據的狀態,以便采取適當的手段提高數據的質量。電力數據質量評價體系由評價對象確認、選取評價指標、制定評價規則及評價模型制定、模型驗證優化、數據質量體檢、體檢功能實現等環節構成。
以電力計量數據的權重體系為基礎,結合具體的數據質量現狀,能夠搭建電力數據質量評估模型,以實現數據質量的全面評估。數據質量的評估模型一般由如下六元組構建而成:M=<D,I,R,W,E,S>,其中 D為需要進行評估的統計數據對象;I為統計數據D上需要進行評估的指標集合;R為與評估指標相對應的規則集合;W為賦予規則尺的權重;E為對規則R給出的期望值;S為數據對象基于評估規則進行數據質量評估的最終評價得分結果。
由電力數據評估模型可知,不同維度指標的評價規則不同,需要參考評價維度的標準釋義來定義每個規則的具體描述及判斷依據,再根據指標維度的釋義,對每個細分數據對象下不同維度規則進行描述,同時需要充分考慮到不同的對象業務來計算電力數據質量評價規則。
在數據質量評價模型的評價規則明確下,重點在于對評價維度指標權重的確定。一般而言,利用層次分析法來確定電網計量數據質量評價指標權重,具體有三個基本步驟[5][6]:
步驟一,將復雜的問題層次化,形成由目標層、準則層、指標層和方案層組成的遞階層次結構圖,其中指標層中的元素均隸屬于準則層中的一個或多個元素。
步驟二,采用“1-9 標度法”[7],形成判斷矩陣并賦值,具體方法如下。
(1)判斷矩陣填寫
根據遞階層次結構構造并填寫判斷矩陣,從項目中對計量數據質量實際感知程度和理論認為重要程度兩方面向專家進行問卷調查,其中層次結構中的相關元素以兩兩比較方式表現其重要性程度,并用標度1-9進行相應的賦值[8]。計量數據質量評價指標重要性標度含義如表1所示。

表1 計量數據質量評價指標重要性標度含義表
設填寫后的判斷矩陣為 A=(aij)n×n,(aij>0;aij=1/aij ;aij=1)。
①計算判斷矩陣每一行元素的乘積的n次方根:

②歸一化處理,獲得每個指標的權重[9]:

則Wi=(w 1,w2,…,wn)T即為所求的特征向量。③計算判斷矩陣A的最大特征值λmax:

其中,A為判斷矩陣,(AW)i表示向量AW的第i個元素。
步驟三,檢驗判斷矩陣的一致性。
一致性檢驗CR:

若CR<0.1,則A通過一致性檢驗;如果不通過,必須修正原判斷矩陣,直到一致性檢驗通過,此時特征向量近似解即為各個元素的權重系數[10]。
本研究以南方電網某省公司的電力計量數據為基礎,通過采用定性分析和定量方法相結合的方式,確定電力數據質量各評估指標的權重,使電力數據質量評估更加科學、合理。
綜合考慮南方電網某省公司計量中心的業務實際和未來發展,明確目標層為“合理評估數據質量,提高計量自動化系統實用化水平”。以臺區為評價對象,確定出表碼、電量、線損率、終端覆蓋率、終端在線率、完整率6個計量數據質量評價對象。選取完整性、唯一性、有效性、準確性、一致性、及時性6個關鍵維度作為評價指標,即準則層,構成計量數據質量評價的遞階層次結構。
在本研究中,對評價對象臺區的數據質量評估取決于表碼、電量、線損率、覆蓋率、在線率、完整率6個計量數據質量評價對象的情況。由于以上6個維度的評價對象的評估方式均一致,受篇幅影響,在此僅以臺區的表碼計量數據質量評價對象為例進行具體的指標權重確定方法及過程說明。
首先,計算評價指標得分。本研究以電力計量數據中心在某段研究時間范圍內監測到的數據為樣本,提取評估對象表碼的相關數據,以日凍結表碼數為主進行分析,其中選取完整性、有效性和準確性三項作為評價維度,確定評價指標與評價規則。確定以上三個評價指標得分可以通過異常記錄數據情況計算得知,即(1-異常記錄數/總記錄數)*100,對應的表碼案例數據分別為84.85、78.52和83.36分。
其次,確定評估指標權重。通過專家問卷調查打分情況構建判斷矩陣,判斷矩陣參照 T.L.Saaty提出1-9的標度法,本研究采用上述公式1-4計算各判斷矩陣特征值的最大值及對應的特征向量(指標特征向量即電力數據質量評估指標權重),依次類推得到“完整性”“有效性”“準確性”評估指標權重值:9、7和9,并計算一致性檢驗CR值得到0。
之后,計算數據對象得分。對于日凍結表碼的分數計算為:∑指標權重*評價指標得分/∑指標權重,例如(9*84.85+7*78.52+9*83.36)/(9+7+9),計算可得日凍結表碼分數為82.54分。由于表碼下屬分類僅有日凍結表碼此維度,所以日凍結表碼分數即為表碼分數,若其他數據對象有2種及以上的分類,則需對所有分類求和并計算其平均數得到最終分數。按照如上計算方法與步驟,可計算出臺區下其他數據對象的權重與分數。
最后,計算評價對象得分。臺區得分計算規則為:∑數據對象權重*數據對象得分/∑數據對象權重,其最終得分為79.61分。具體表碼數據質量評估模型及結果如表2所示。

表2 表碼數據質量評估模型及結果
計量數據質量評價的核心是對數據對象異常值的檢測,根據體檢和評測結果,結合異常原因分析評價模型,精準定位異常所在位置,實現數據異常的及時發現和定位處理。通過數據質量評估發現,在表碼、電量、四分線損、終端在線率、終端覆蓋率、和采集完整率6類數據對象方面均存在問題,仍以表碼為例進行具體原因分析,見表3表碼評估結果分析。

表3 表碼評估結果分析
根據該電力計量中心數據質量評估發現的問題,提出四點改進建議:(1)制定數據質量保障實施方案;(2)建立數據質量保障運營組織;(3)規范數據質量管理流程;(4)制定考核評估管理制度。通過建立符合該電力計量中心的配套落地保障機制,為計量數據高質合規保障體系落地應用提供制度保障,以確保數據質量管理能力有效提升,從而進一步促進計量自動化系統實用化水平提升。
本文從數據質量分析角度出發,提出一種電力數據質量評估的方法,通過建立基于層次分析法的電力數據質量評估模型和評估指標體系,實現對電力數據質量的評估。通過研究發現,南方電網某省公司的計量數據存在數據質量評價體系不完善、缺乏主動的數據異常監控預警機制以及信息化技術手段支撐有限等多方面問題。通過本研究,有利于及時發現電力數據質量下降的隱患,提高電網公司對電能數據質量的管理水平。
本研究的方法和模型已成功應用于電力計量數據的質量評估工作中,今后研究重點將針對數據質量評估模型物化、評估指標加權科學化等方面,開展進一步的細化研究。