深圳供電局有限公司 龍 干 方力謙
電力行業是支撐我國經濟發展與群體生活需求息息相關的行業,隨著國家電網建設規模的提升,各個地區紛紛響應號召,投入了大量的資金用于建設與改造電網工程。在這種發展趨勢下,供電單位在市場內的競爭越發激烈,行業需要不斷在此過程中提高自身的社會發展能力,加強對用戶信息的挖掘與分析,掌握更多用戶的需求,才能為電力企業創造更高的效益與經濟價值[1]。
目前,電力行業已將現行工作重點轉移到了市場營銷發展層面,如何實現對電力行業客戶用電信息的深度挖掘,成為電力單位的工作重點,也成了電力行業市場經營的重心與核心。但在深入此項工作的研究時發現,大部分電力企業對于客戶的研究仍存在深度不足、技術使用偏差等問題。例如,現有的行業客戶用電信息分析技術包括卷積神經網絡技術、大數據技術等,提出的技術在實際應用中尚存在短板。
因此,本文將在現有研究成果的基礎上,引進數據挖掘技術,對行業客戶用電信息展開詳細的研究[2]。通過獲取大量行業客戶用電信息作為支撐,深度挖掘用戶需求與用戶用電行為規律,以此種方式,為企業電力設備的規范化管理與行業客戶用電負荷預測提供進一步的技術決策作為支撐,保證我國電力相關行業在經濟市場內的規范化發展。
為實現對行業客戶用電信息的深度分析,本文引進數據挖掘技術,進行用戶用電信息的挖掘與歸類研究。在此過程中,需要先進行業客戶用電信息的獲取,在電力企業終端管理數據庫中,提取行業客戶用電行為數據信息,將此部分數據作為支撐,建立用戶類別細分指標[3]。處理流程如下。
2.1.1 信息的采集
全面采集用電情況,可采集所有電力用戶用電信息,電壓、電流等交流模擬量運行信息,開關、機械設備工況使用信息,終端、電能表記錄,預付費采集時間信息。上述信息需要不同部門根據不同業務、不同需求對采集的用電數據進行綜合利用,通過計算機自動編制、計算、分析,實現對任務的管理和執行。在使用過程中,需要通過定期自動采集、隨機來電測試、主動上報等采集方式獲取所需的相關信息和數據。
2.1.2 分析處理功能
數據采集完成后,進入數據合理性檢查、計算分析、存儲、管理、查詢等步驟。在數據分析過程中,能夠快速及時地發現問題,合理補充不同的問題,確保數據完整、可用。通過設計的程序,自動對負荷、電量和電能質量進行科學的統計分析。線損計算完成后,提供給營銷管理部門作為運維和管理決策的參考。
將用戶用電行為數據作為挖掘數據,按照下述圖1所示的步驟,對客戶用電信息進行挖掘。

圖1 客戶用電信息挖掘
挖掘過程中,將電力企業中的營帳數據、計費系統統計數據、客服終端統計數據與結算數據,按照標準導入挖掘終端,通過對數據的抽取與加載,提取數據的自然屬性與行為屬性,劃分數據屬性維度,匹配用戶用電行為,以此種方式,進行客戶用電信息歸類[4]。對此過程進行描述,如下計算公式所示:

公式(1)中:E 表示為基于數據挖掘的客戶用電信息歸類過程;P 表示為電能表統計數據;m 表示為用戶類別;i 表示為數據簇;C 表示為簇族之間的相速度。按照上述方式,完成客戶用電信息挖掘與歸類。
為實現對用戶用電信息的深度分析,掌握不同類型用戶的用電習慣,在完成上述研究后,引進K-means 算法,進行行業客戶用電信息聚類[5]。本次研究的K-means 算法是一種基于樣本相似度的聚類算法,可以通過對數據的聚類實現對終端電力企業管理過程的優化。在此過程中,考慮到行業客戶用電信息收集過程中,可能存在多種因素導致用電信息出現損壞或缺失,此類數據會直接對電力設備管理與電力企業運營造成影響。因此,需要在聚類數據前,對行業客戶用電信息進行修復,此過程如下計算公式所示:

公式(2)中:X 表示為修復后的行業客戶用電信息;X(γ)表示為修復前的行業客戶用電信息,其中γ 表示為行業客戶用電信息缺失程度;Xd表示為數據橫向分布相似度;q 表示為電力企業運營產生的電力生產數據。完成對數據的填充與修復后,選擇一個指數KL 作為數據聚類中心,確定聚類K參照值后,按照下述計算公式,進行聚類次數的設定。

公式(3)中:k 表示為聚類次數;h 表示為數據聚類維度,其中KL(h)可用下述計算公式計算得到具體數值。

公式(4)中:DIEF 表示為空間數據內距的平方和。按照上述計算公式,完成信息聚類準備工作。在此基礎上,選擇負荷曲線上任意一個數據點作為中心點,根據空間點之間的距離,進行數據聚類。對行業客戶用電信息聚類過程進行描述,如下計算公式所示。

公式(5)中:density 表示為行業客戶用電信息聚類過程;u 表示為目標數據收斂系數;Dist 表示為數據列表與數據清單;d(X)表示為空間數據歐式距離。按照上述計算公式,進行行業客戶用電信息的聚類。為確保聚類后的數據可以達到預期效果,在完成上述研究后,對聚類結果進行檢驗,檢驗過程如下計算公式所示。

公式(6)中:I 表示為聚類結果檢驗系數;V表示為數據聚類與集成速度;K 表示為聚類參照值。按照上述方式,對聚類結果檢驗系數進行量化,I 的計算值越小,說明聚類后數據越緊湊,反之,I 的計算值越大,說明聚類后數據越分散,以此完成基于K-means 算法的行業客戶用電信息聚類。
完成上述研究后,根據行業客戶用電信息聚類結果,進行行業客戶用電負荷風險的預測。預測過程中,將聚類相關數據統計到SPSS 軟件中,構建一個針對行業客戶用電信息的Logistic 模型,以此種方式,掌握用戶繳納電費的履約率。對用戶繳納電費的履約率進行計算,計算公式如下:
公式(7)中:ψ 表示為用戶繳納電費的履約率;ψ1表示為用戶繳納電費的履約次數;ψ2表示為電費催繳次數;ψ3表示為用戶主動繳納電費的次數。ψ 計算結果越高,說明行業客戶用電信譽度越高,與此同時行業客戶用電負荷風險越低,反之,ψ 計算結果越低,說明行業客戶用電信譽度越低,與此同時行業客戶用電負荷風險越高。根據用戶歷史用電行為,實現對行業客戶用電負荷風險預測。以此方面數據為依據與參照,進行電力企業用電設備的管理,包括多次催繳但用戶并未及時或按時繳納電費,電力終端將采取措施進行此用戶終端電力設備的停用;當用戶未用電但出現終端電能表統計用戶用電量超額的現象時,可以結合實際情況,進行電力設備的安檢,檢查設備是否存在漏電、接線錯誤等方面的故障。通過此種方式,實現對電力企業中設備的規范化運營管理。
上文從三個方面完成了基于數據挖掘的行業客戶用電信息研究。但此項研究成果在科研單位內仍處于理論開發階段,仍沒有可靠的成果為此項研究提供支撐。因此,下述將以某地區電力企業為例,通過設計對比試驗的方式,對本文設計的方法進行檢驗研究。
本次試驗選擇某地區大型電力企業作為試驗單位,通過與此單位相關負責人的合作可知,此單位在近1年的市場運營與電力營銷過程中一直存在虧損問題。獲取此單利單位的電力運營數據,將其作為此次研究的樣本測試樣本。選擇該企業中8名用戶在2021年1月的主要用電數據作為試驗數據,每間隔15min 進行一次數據采樣。
在確保數據量充足的條件下,使用本文設計的方法,對行業客戶用電信息進行獲取,同時深度挖掘行業客戶用電信息,掌握不同信息的價值,對信息進行歸類處理。處理后,引進K-means 算法,對行業客戶用電信息進行聚類與歸一化處理。根據現有的數據,建立用戶用電行為模型,通過此種方式,實現對行業客戶用電量的預測。可將此過程表示為下述計算公式:

公式(8)中:D 表示為行業客戶用電量預測結果,計算單位為kWh;ε 表示為電能表統計數據補償系數。
試驗中,隨機選擇一名行業客戶作為研究對象,按照上述步驟,建立用戶用電信息模型,預測此名用戶在近10天內的用電量,將其作為試驗結果。在此基礎上,獲取電力企業記錄的該用戶用電量實測結果,對比預測結果與實測結果,如下圖2所示。

圖2 用戶用電量預測結果
圖2中,虛線代表本文方法預測行業客戶用電量;實線代表電力企業使用電能表統計得到的用戶用電量。從兩個曲線的變化趨勢可以看出,本文此次研究設計的方法在實際應用中,可以實現對行業客戶用電量的精準預測,保證預測結果與實測結果之間的偏差在一個相對較低的數值范圍內。
在上述研究內容的基礎上,引進基于多數據融合技術的行業客戶用電信息研究方法作為傳統方法,使用傳統方法與本文方法,對行業客戶用電負荷風險進行預測。在使用傳統方法進行客戶用電負荷風險預測時,應先按照上述方式進行客戶用電信息的獲取,根據所獲取的信息,構建用戶用電信息模型。同時,使用多數據融合技術,對具有相同用電特點的數據進行集成與融合,輔助大數據決策,對客戶用電負荷風險進行預測。風險預測值可用公式(7)計算得出。
根據電力企業現存的用戶用電數據,評估用戶用電行為,計算客戶用電實際負荷風險,將其作為對比實驗結果的參照值。將兩種方法計算得到的客戶用電負荷風險預測值與參照值進行計算,將得到的差值作為客戶用電負荷風險預測偏差。統計試驗結果見表1。
從表1所示的試驗結果可以看出,本文方法預測值與參照值的偏差,明顯小于傳統方法預測值與參照值的偏差。由此可以證明,本文此次設計的基于數據挖掘的行業客戶用電信息研究方法,可以在實際應用中,不僅可以實現對客戶用電量的精準推算,還可以實現對行業客戶用電負荷風險的精準預測,通過此種方式,為電力企業終端供電設備與電力服務綜合管理提供決策依據。

表1 客戶用電負荷風險預測值偏差統計結果
本文從客戶用電信息挖掘與歸類、基于K-means 算法的行業客戶用電信息聚類、行業客戶用電負荷風險預測與管理三個方面,完成了基于數據挖掘的行業客戶用電信息研究。完成設計后,以某地區大型電力企業作為實驗單位,設計對比試驗,試驗結果證明,本文此次研究設計的方法在應用中,可以實現對用戶用電量與用電負荷風險的精準預測。但通過本次研究后,也發現了現有研究成果存在的一些不足,如僅選擇了一個電力服務單位作為試驗研究對象,試驗范圍較小,可能會導致試驗結果存在一定的偶然性,也沒有明確提出后續電力企業在市場內的發展方向。因此,在后續的研究中,將持續進行本文此次研究成果的深化,為本文研究方法在市場內的推廣使用提供進一步的指導與幫助。