侯昝宇,周良柱
(國網遼寧省電力有限公司, 遼寧, 沈陽 110006)
電價遠程下裝是智能電表實現實時費控的重要技術途徑,且在2010年開始在國內部分城市實現智能電表實時費控試點工作以來,至今國內絕大部分城市的城鄉家用電表均實現了電價下裝工作。但是,因為電價下裝增加了抄核收系統的復雜性,容易帶來諸多計費偏差,如故障計費產生零電費、疊加計費導致電費重復計算等。但絕大多數地市級供電公司均需要提供數十萬甚至上百萬家用電表計費服務,如果采用人工審計排查,很難在有效時間發現故障個案問題,所以在全面電價遠程下裝環境下,通過人工智能實現對電價遠程下裝后的計費問題進行時效性預警,成為當前電力大營銷中抄核收大數據審計技術提升的重要研究創新點。
因為電價下裝可采用費率下裝和階梯下裝等不同技術路徑,且多數供電公司在早期實驗性操作中在不同階段嘗試了不同的技術路徑,在并網運行過程中,如果存在個別區域未能做出及時技術調整的問題,則可能產生系統兼容性問題。系統兼容性問題容易造成電價下裝的大面積故障,但也合并個別電表重置或其他故障、遠程抄表數據干擾等個別故障問題。所以,該研究的核心創新點是采用同一套電費大數據審計系統實現對電價下裝問題的全面審計并作出預警。
基于“電費=費率×當期電量”的基本電費計算規則,如果費率一致,則當期電量與電費之間是嚴格的正比關系。電價下裝后,因為要計算尖時、峰時、平時、谷時的不同費率條件下的分時電價,且供電公司轄區內的城市用電、鄉村用電、重點區域用電、小規模工業用電、商業用電、特殊行業商戶用電等均有不同的分時電價費率,所以采用傳統差值離群分析算法時,需要將所有用戶根據其執行費率不同而進行嚴格劃分。這一審計方案反而進一步增加了電費管理的復雜度,帶來額外計費問題隱患。
此時對差值離群算法的工作流進行分析,見圖1。
圖1中,分別對不同用戶類型的所有用戶分別重新驗算其計費情況,將不同分時分段的電費量與用電量求取比值,得到費率,考察費率是否與該用戶所屬的費率相符。該算法在理論上只要計算機系統算力可以達到要求,即可在規定時間內精準選擇出問題用戶。但此算法有諸多問題無法解決:

圖1 差值離群審計算法工作流圖
1) 用電用戶的類型需要手動歸類,或從客戶信息管理系統中讀取用戶類型,該類型在客戶信息管理系統中也為手動輸入,其用戶類型的信度存疑;
2) 用戶的計費分時策略并非一成不變,部分城市的尖時計量區間僅在夏季和冬季用電高峰期有效,其他時間并入峰時管理。在用電策略變更過程中,是電費下裝問題出現的高峰期。
綜上,該電費審計方案的可靠性與電費下裝工作的可靠性存在同步性,問題是存在同源性,對電費下裝過程可能出現的問題發現能力受到工作流的先天不足影響,較難發揮電費大數據審計的效能。
在電費大數據審計過程中建立一種脫離電費下裝基礎數據的工作模式,此時引入卷積神經網絡的機器學習技術,實現無視下裝基礎數據的電費大數據審計工作模式,是該研究的創新點。
電費大數據審計的核心數據資源,為各電能表的各期電量數據和各期電費計量結果數據,通過此兩項數據,可以計算出特定用戶的分時電價計費標準,傳統模式下,直接使用k-means算法可以提取離群數據進行分析,但在機器學習視角下,可以直接跳過k-means分析階段,直接對此兩項數據進行卷積,將問題數據進行分類。
該輸入輸出模式如圖2。

圖2 機器學習模塊輸入輸出模式示意圖
圖2中對特定用戶(以電表號計)當月分時電量數據和分時電費數據作為輸入數據,最終輸出4個二值化數據。輸出數據包括電費下裝問題標志(接近0.000時認為正常,接近1.000時發出預警),計量兼容下裝問題標志、電表設備故障問題標志、其他問題標志(以上3種標志均為接近0.000時認為正常,接近1.000時發出預警),此時,后3個預警標志需要在第1個預警標志為真值時有效,且第1個預警標志出現時,后3個預警標志需要有且只有1個為真時有效。其輸出結構如表1。

表1 預警輸出結果含義表
表1中,4個二值化輸出變量共有4種有效表達,而其可能輸出結果包括16種,包括下裝問題標志為1時的1000、1110、1011、1101表達均為無效表達,下裝問題表達為0時,所有不為0000的表達均為無效表達。數據訓練過程中,可通過判斷無效表達出現概率對神經網絡的收斂程度進行判斷。
數據輸入過程中,因為電費數據和電量數據存在量綱異構特征,所以需要對其進行重投影去量綱計算,采用Z-score法進行數據整理,整理數據集為該月輸入的4個電量數據和4個電費數據分別進行Z-score計算,計算函數如式(1):
(1)

(2)
式中,N為該列輸入量最大下標,此處N=4。σ為4個輸入量的標準偏差率,如式(3):
(3)
經過Z-score初步處理的2組各4個輸入項,組成8個輸入項輸入到多列卷積神經網絡中,形成相對獨立的4個卷積+二值化模塊,最終通過輸出模塊將二值化數據治理成邏輯數據,該數據流詳見圖3。
圖3中,每個卷積模塊均等價讀入8個輸入變量,輸出1個雙精度浮點型變量進入二值化模塊,經過二值化輸出的1個雙精度浮點變量經過輸出模塊治理后形成預警標志,4個預警標志按照前文的解釋方式進行解釋形成最終預警結果。
4個卷積模塊結構相同,但在訓練中的收斂方向不同。其統計學意義在于將8個雙精度浮點變量卷積為1個雙精度浮點變量,其間的數據信息量損失較小,所以可以采用3層隱藏層(7節點、5節點、3節點)進行節點設計,節點函數采用細節放大率較高的對數回歸函數進行節點設計。其基函數可寫作式(4):

圖3 多列卷積神經網絡數據流圖
(4)
式中,Xi為第i個輸入項,Y為節點輸出項,e為自然常數,A、B為待回歸系數;
4個二值化模塊結構相同,但在訓練中的收斂方向不同。其統計學意義是將卷積模塊輸出的1個雙精度浮點變量進行二值化處理,使其投影位置更貼近1.000或0.000。所以用經典二值化函數作為節點函數,隱藏層3層,分別為3節點、7節點、3節點。其基函數可寫作式(5):

(5)
4個輸出模塊結構相同,且不含有神經網絡計算,其本質是根據二值化輸出模塊的輸出數據進行數據強制轉化,形成邏輯輸出變量。其邏輯轉化過程可寫作式(6):

(6)
輸出模塊僅在輸出結果大于0.950和小于0.050時輸出邏輯型結果,當其落點在0.050和0.950之間時,系統報錯。與上述輸出解釋模塊的報錯機制相同,該報錯也可以作為神經網絡充分訓練收斂的標志。
在電力CAE(computer aided engineering,CAE)系統中加載SimuWorks組件,構建2組隨機電費數據,每組數據共設計20萬組,其中A組設置1 000組問題數據,并將問題原因進行標注,作為神經網絡的訓練數據,B組設置200組問題數據,并將問題原因進行標注,作為神經網絡的驗證數據。在上述試驗平臺和試驗數據支持下,對該預警系統進行訓練,測試其數據訓練量與收斂程度的關系。收斂程度按照每萬次系統報錯次數進行標定,當萬次測試數據運行報錯次數為0時,認為神經網絡充分收斂。其實際訓練過程如圖4所示。

圖4 神經網絡訓練收斂效率
圖4中,當訓練量達到10萬次之前,系統迅速收斂,訓練至17萬次之后,萬次驗證報錯率穩定到0,標志著該系統針對電價下裝的評價任務,具有較強的收斂特性,可以進行后續評價效率驗證試驗。
在上述驗證用B組數據下,使用傳統的差值離群分析算法和該研究革新的神經網絡算法進行比較分析,驗證其敏感性和特異性,分析其綜合準確率,可以得到表2。

表2 算法效能比較結果表
表2中,真陽性指下裝問題電表中被判斷為問題電表的數量,假陽性為無問題電表被判斷為問題電表的數量,真陰性為無問題電表被認定為無問題電表的數量,假陰性為問題電表中被認定為無問題電表的數量,敏感性為判斷為問題電表的總量中確實為問題電表的比例,特異性為判斷為無問題電表中確實為無問題電表的比例,準確率為問題電表中被判斷為問題電表的比例。對上述7個判斷結果使用SPSS24.0進行雙樣本t校驗,當t<10.000時認為數據存在統計學差異,同時讀取其log值,作為信度標志P值,當P<0.05時認為結果在信度空間內,當P<0.01時認為結果存在顯著的統計學意義。
表2數據表明,受到樣本中陰性數據總量與陽性數據總量的比值影響,該結果數據的特異性并無統計學差異(t>10.000,P<0.05),但革新方法敏感性達到傳統方法的1.86倍,且具有顯著的統計學差異(t<10.000,P<0.01),革新方法準確率也顯著超過傳統方法(t<10.000,P<0.01)。所以可以認為,采用多列卷積神經網絡對電價下裝成功率進行評價,其算法效能顯著超過傳統大數據審計方法。
另外,革新技術還存在以下優勢:
第一,革新技術條件下,完全排除了傳統方法下因為數據同源性導致大數據審計過程和電費核算過程出現相同錯誤的可能性,這是其敏感性大幅度提升的重要原因;
第二,革新技術可以直接精確給出電價下裝的常見問題類型,該研究中已經給出最常見的電表故障問題和電價下裝設置問題,且將其他問題也給出標記,在傳統方案下僅可發現電價下裝問題,而無法在審計過程中給出下裝問題原因;
第三,本技術通過基于多列卷積神經網絡的電費審計方法,較傳統電費審計方法,復雜度顯著降低,算法更加精準。
綜上分析,電價下裝問題一般為系統兼容性問題,在進行電費大數據審計師,也可能因為審計工作的數據來源兼容性問題導致無法發現電價下裝的相應問題,該研究產生的革新成果,拋開原始配置數據,直接對電費計量結果數據進行大數據審計,從而實現更高的判斷敏感性和更高的判斷準確率,同時給出電價下裝問題的常見原因判斷結果。當然,該研究成果雖然準確率達到了99.9%,但其實際敏感度僅有95.7%,說明其在特異性方面仍有提升空間,即其存在一定比例的假陰性結果。所以,在后續研究中,應從增加神經網絡復雜度和卷積程度等方面進行持續革新研究,以提供更高敏感度的電費大數據審計算法。