謝 穎, 王 征, 趙永良
(1.國網浙江省電力有限公司紹興供電公司,浙江 紹興 312000;2.國家電網有限公司,北京 100031)
“量、價、費、損”是電力公司經營業績與同業對標核心指標,也是客戶服務與營銷風險控制的焦點環節[1]。受經濟形勢與產業轉型升級影響,2016年浙中某地區用電量增速放緩,1—9月,全社會用電量271.45億kWh,同比增長0.98%,全省排名第7;工業用電量214.87億kWh,同比減少0.68%,用電營銷形勢較為嚴峻[2]。
以下從提升主動服務能力入手,利用現有用電信息采集系統電量與負荷實時數據,構建基于用戶日電量波動率、變化率、負荷利用率指標的用電風險識別模型,完善現有市場分析預測方法,改進以往只關注月度結算電量,容易造成信息獲取滯后、過程預控手段缺乏的問題[3]。
考慮到用戶與用電信息采集系統數據規模較大,僅選取該地區報裝容量在1 000 kVA及以上用戶作為分析對象,其用電量約占地區售電量的70%,具有較強的樣本適應性[4]。分析模型結合營銷業務特點,運用大數據分析方法,對2016年用電數據進行分析與鉆取,總結當前用電形勢的行業、地域、季節變化特征,篩選和預警高危用戶,有效提升主動服務能力,降低電費回收等經營風險[5-6]。
由于用戶的電量及負荷數據來源于用電信息采集系統,而系統受信號干擾、設備故障等原因可能出現部分數據缺失、失真的情況,會影響分析結果,對此使用拉格朗日插值法對缺失、失真的數據進行補全[7]。

拉格朗日插值法的公式見式(1),其原理就是對實踐中的某個物理量進行觀測,在若干個不同的地方得到相應的觀測值(x0, x1, x2, …, xn), 找到一個多項式lk(x),其恰好在各個觀測的點取到觀測的值[8-9]。數學上來說,拉格朗日插值法可以給出一個恰好穿過二維平面上若干個已知點的多項式函數[10]。
線性回歸是利用數理統計中回歸分析,來確定兩種或兩種以上變量間相互依賴的定量關系的一種統計分析方法。回歸分析中,只包括一個自變量和一個因變量,且二者的關系可用一條直線近似表示,這種回歸分析稱為一元線性回歸分析[11-16]。
線性回歸算法主要用于計算用戶日電量的變化趨勢,下文中將會具體闡述。
根據用電業務特征以及大數據分析處理理論,歸納總結出了3項反映用戶電量情況的指標,并對這3項指標分別進行了深入的數據挖掘。
2.1.1 電量波動率指標σ
利用方差原理計算日電量的離散程度,用于分析統計期間用戶日用電量均衡程度,模型定義為:

i為累計時長。σ為標準差模型,其值越大,說明樣本偏離度越高,也即電量波動大,反之電量波動小。σ過大往往反映出企業經營狀況的波動與不穩定。
2.1.2 負荷利用率指標μ
用于分析統計期間用戶報裝容量的利用效率,模型定義為:

式中:cap為報裝容量;cosθ為功率因數(一般取0.9)。μ表示實際用電量與需求電量之比,其值越大表示負荷利用率越高,反之負荷利用率低。μ連續過高反映出可能存在超容用電情況,μ過低反映用戶可能存在生產狀況不佳或報裝方案不合理。
2.1.3 電量變化率指標λ
利用線性回歸算法計算出日電量變化的擬合值,用于分析統計期間用戶日用電量變化趨勢,模型定義為:

式中:ti為時間序列;N為累計時長。λ為線性回歸分析的線性擬合函數斜率,λ>0表明電量逐日增加,λ<0表明電量遞減。λ出現較大負值往往反映用戶經營狀況出現不良態勢。
在完成了電量波動率指標σ、負荷利用率指標μ、電量變化率指標λ這3個指標獨立分析的基礎上,進一步構建用戶電量分析模型。該模型將這3個指標做為評價用戶風險的重要依據,按照用戶所滿足的閥值條件的數量劃歸為3類,所建模型如圖1所示。

圖1 用電行為分析模型示意
(1)潛在風險用戶:只滿足3個指標閥值中1個閥值的用戶,此類用戶在生產過程中存在一定的不穩定因素,電費風險有加大的可能性,業務部門可根據行業及地域情況有側重地加以關注。
(2)一般風險用戶:只滿足3個指標閥值中2個閥值的用戶,此類用戶的生產不穩定性較大,電費風險也較大,業務部門需要加以關注。
(3)高風險用戶:指同時滿足3個指標閥值的用戶,此類用戶生產存在重大的不穩定性,業務部門需要加以重點關注和持續跟蹤。
本節根據某電力公司2016年用戶日電量及日負荷數據,利用用電行為分析模型進行分析,并給出示例。
3.1.1 電量波動指標閥值確定
數理統計表明,2016年1—9月,該地區1 000 kV以上大用戶日電量波動率σ呈指數分布,波動率σ在[0,0.07]區間用戶密度最大,占比超過70%;[0,0.15]區間用戶占比超過90%;σ>0.2的用戶占比約5%,確定日電量波動率95%置信區間為[0,0.2]。由此選定σ>0.2作為電量波動異動判斷閾值,并進行跟蹤分析。
3.1.2 電量波動典型用戶定位
在確定了指標閥值的基礎上,篩選出2016年電量波動指標大于0.2的用戶,則可對用戶行業分類、典型用戶進行下鉆分析。
從圖2可以看出,2016年紡織業、造紙業、非金屬礦產業行業占比最高,總計超過75%,反映出地區產業結構特征與經濟調整的影響。

圖2 波動率過大用戶行業分布
在此基礎上,還可以繼續對用戶進行下鉆,如將閥值調整到0.3,發生次數調整為2次,定位到共有13家用戶符合條件,其中某紙業公司具有典型特征,該用戶1—9月的波動率均在0.4以上,9月更是達到了0.73,從電量波動情況可以看出該用戶的生產較不穩定,經過業務部門核查,確定用戶產能的確出現下降,隨即采取措施,及時預防電費風險的產生。
負荷利用率監測分兩個層面進行。一方面監測負荷利用率較低(<15%)的情況,主要分析用戶可能存在的生產萎縮或報裝方案不合理;另一方面監測負荷利用率過高用戶(>100%),主要分析可能存在的安全運行與超容用電風險,本節示例只針對利用率較低的用戶。
從圖3看出,區域A占比最高,一定程度反映這些區域傳統加工出口企業面臨新形勢的風險較其他單位大。

圖3 長期低效大用戶占比地域分布情況
以某印染有限公司為例,該用戶原容量2 600 kVA,行業類別為紡織業,除2月外,7—9月的平均日電量為1 119 kWh,平均利用率為0.05。該用戶7—9月日電量與利用率統計數據見圖4。

圖4 用戶日電量與利用率統計
7—9月期間,除7月1日外,該用戶日電量均小于1 500 kWh,利用率低于0.07,從用戶的日電量及利用率數據可以看出,用戶生產情況較為嚴峻,通過營銷系統查詢得知用戶于9月16日完成永久減容1 600 kVA,減至1 000 kVA。
日電量變化率采用線性回歸算法,線性擬合系數λ<0為趨勢遞減用戶,考慮變化趨勢的顯著性,選擇λ<-1%作為電量遞減閾值開展分析。
從圖5可以看出,2016年紡織行業電量呈遞減趨勢的用戶數遠遠大于其他行業用戶,出現記錄數最多的五個行業分別為紡織、水泥、造紙、化學原料、制藥。

圖5 日電量遞減用戶行業分布
通過模型定位到的高風險用戶共14家,通過營銷系統業務變更情況追溯,發現其中5家2016年出現過暫停或強停情況。如浙江某家私有限公司,被定位為高風險用戶,且2016年已經關停。
從行業分布來看,這14家高風險用戶主要在紡織業和化工業,其余11家雖沒有業務變更,但通過對相關企業電量、負荷的連續追溯表明:在1個月內同時滿足三率異動閥值,其生產運營情況的確需要引起關注。
基于對電量波動率、負荷利用率、電量變化率指標的分析,構建了用戶用電風險識別模型,具有較強的業務適用性。模型固化后分析周期可由原有每月縮短到每日進行,能夠有效幫助營銷部門提升高風險用戶識別預控能力。主要創新點表現在以下幾個方面:
(1)利用用電信息采集系統日電量、日負荷數據對用戶用電行為進行分析,改進以往只關注月度結算電量的方式,大大縮短了用戶分析周期,基本實現了對用戶的實時分析,極大提高了用戶風險定位的及時性。
(2)通過建模的方式,利用科學的算法對用戶用電數據進行特征分析,能夠較為全面、準確地刻畫用戶用電行為特征,有助于提高業務部門的工作效率,具有很強的實用性。
(3)基于大量的用戶用電數據,還可以向著預測用戶電量走勢的方向進行拓展,對業務部門進行負荷預測提供科學有力的輔助,具有很好的拓展性和延伸性。