蔡艷婧 陸健 曹春梅 徐立




摘 要:電力系統所用的用戶畫像不能對用戶行為進行精準識別,導致無法滿足電力企業的需求。本研究提出基于綜合用電指數的用戶畫像,利用綜合用電指數構建指標體系,再根據用戶信息建立行為標簽庫,根據指標評分來計算綜合用電指數,最后用Canopy改進K-means算法生成用戶畫像。通過案例分析可以看出,該方法能夠精確地分析出用戶的用電習慣,并對用戶提出指導性意見,避免資源的浪費。
關鍵詞:電力;用電指數;用戶畫像;綜合
中圖分類號:TP181 ? ? 文獻標志碼:A ? ? 文章編號:1003-5168(2022)12-0021-04
DOI:10.19968/j.cnki.hnkj.1003-5168.2022.12.004
Research on User Portrait Based on Comprehensive Power
Consumption Index
CAI Yanjing? ? LU Jian? ? CAO Chunmei? ? XU Li
(School of Electronics and Information,Jiangsu Vocational College of Commerce and Trade,Nantong 226001,China)
Abstract:The user portrait used in power system can not accurately identify the user behavior and can not meet the needs of power enterprises.The research on user portrait based on comprehensive power consumption index is proposed.The index system is constructed by using the comprehensive power consumption index,and then the behavior label library is established according to the user information.The comprehensive power consumption index is calculated according to the index score.Finally,the user portrait is generated by using Canopy improved K-means algorithm.Through case analysis,it can be seen that the design method can accurately analyze the habits of users,put forward guiding opinions for users,avoid resource waste.
Keywords:electric power;electricity consumption index;user portrait;comprehensive
0 引言
隨著科學技術的發展,用電用戶的數量在不斷增加,對電量的需求也越來越大[1]。智能用電是當下最主要的用電方式,智能電網在運行時會產生大量的用戶數據,對這些信息進行分析,從而得出不同用戶的用電特征,根據這些特征能夠對用戶進行分類,并根據用戶需求隨時調整電力系統[2]。
在智能用電站的配電系統中,對用戶的用電情況進行監測,采集不同用戶的用電習慣、用電信息、用電負荷等數據,并構建用戶的用電畫像[3]。
對電力企業而言,用戶畫像能夠給企業帶來很好的商業價值。通過分析不同地區的用電畫像,找尋電力企業的潛在用戶[4]。與此同時,對老用戶的用戶畫像進行分析,構造用戶的虛擬形象,分析用戶的用電習慣和行為。
在利用用戶畫像對用電用戶進行分析時,不同的用戶會形成不同的畫像特點[5]。電力用電畫像是以用戶用電信息為基礎構建而成的,具有一定的代表性和特殊性。利用用戶畫像對用電用戶的個體差異性進行標記,挖掘用戶的用電行為特征,一方面能夠實現不同用戶的特殊供電調度,另一方面能夠對用戶進行系統化管理[6]。
現有的電力系統采用單一的方式來構建用戶畫像,不能精準地對用戶的用電需求、用電特征、信用體系等要素進行分析[7]。鑒于此,本研究從綜合用電指數的角度出發,研究用戶的用電特征,形成臉譜化的畫像,為客戶管理提供個性化描述,并采集用戶畫像,在此基礎上提出合理的用電方案,促進用戶合理用電。
1 基于綜合用電指數的用戶畫像研究
1.1 構建綜合用電指數指標體系
參考用戶的實際用電情況等信息,從電力企業的角度出發,結合當下的整體經濟狀況和電力行業的運行情況,對綜合用電指數的指標進行規范化定義[8]。
在考慮電力企業和用戶自身因素的同時,還要充分對外界因素進行考量。一方面專業人員運用宏觀經濟景氣指數對具體走勢進行分析[9],從行業整體趨勢來分析用戶的各個指標信息。另一方面,對行業景氣指數進行綜合分析,對比不同時間段的各個用戶用電情況,對不同情況進行具體分析。
通過前文所闡述的兩方面,結合內外部因素,對管區內的用戶用電情況進行調研,了解實際情況,形成初步調研數據。按照電力系統輻射區域、輸電纜的導電性能、傳輸過程中的能源損耗等指標,對調研數據進行分類整理,建立綜合用電指數的指標體系[10]。
本研究所建立的指標體系分為3個等級(見表1)。
本研究所建立的指標體系內的數據是通過前期調研、電力單位直接提供、電力采集系統綜合數據等途徑進行整合的結果,具有普遍性。
1.2 獲取用戶信息,建立行為標簽庫
用戶行為標簽的建立是以用戶的特征信息為基礎,是對用戶行為特征和用電習慣進行綜合分析后的結果。
用戶行為標簽是用戶畫像的重要組成部分。行為標簽所標記的用戶,其用電習慣、繳費習慣和途徑、每日耗電量都被用戶畫像顯示出來。與此同時,用戶的用電傾向和生活中的用電要求可通過聚類算法進行計算分析,使用戶畫像能夠更精確地對用戶行為進行描繪。
通過大數據梳理用戶信息數據的標簽,深度挖掘用戶用電日志管理記錄系統,通過編程連接數據庫,提取數據并更新數據進行存儲;也可將用戶的信息數據以文件的形式存儲在本地系統中,等到聯網時再接入標簽庫。將用戶標簽數據進行分類,并以源表數據的形式進行存儲,在后續用戶畫像繪制時,可以利用不同的數據規則獲取標簽寬表。
1.3 指標評分法計算綜合用電指數
對用戶的用電數據進行定性和定量分析,其目的是將用戶的用電數據進行綜合化、信息化處理,為后續定量分析提供數據。影響用電指數的主要因素有不同用戶的用電指標以及同時間段的能源消耗量,對用戶進行等級的排序和分類,再通過行為標簽庫對用戶進行系統性評價。通過指標體系將用戶分散的數據信息進行整合分類處理,形成標準化的行為標簽。
使用用戶用電指數指標體系進行綜合分析,在對用戶指標建立完整的、標準化的計算方法后,利用隸屬度函數對用戶的綜合用電指數進行整體計算(見圖1)。設置函數的基礎標準值為60,數據最高極限值為100。根據所設定的數值,計算兩者之間的數據差值,橫軸上的d是預期指標,縱軸上的S是預期指標在函數數據差值之間的位置,同時該數值也顯示出第三個等級指標的具體數值。
圖1中的指標函數是基于定量數據的指標。對定性指標的評定準則進行設定,分為優秀、良好、中等、合格、較差這五個等級。評價標準設置為百分滿分制,因此,定性指標的五個等級分別為90~100分為“優秀”、80~90分為“良好”、70~80分為“中等”、60~70分為“合格”、60分以下為“較差”。然后通過定量評價和定性評價進行綜合計算,得到每個用戶的評價眾數,再對不同地區的用戶評價眾數求平均值,最終的平均值為用戶綜合用電指數的評價結果。
1.4 生成用電用戶畫像
根據計算出的不同用戶的綜合用電指數,再用聚類分析法對用戶的用電指數進行行為計算。結合行為標簽庫中用戶的用電消耗量、電力系統的用電準則、綠色用電習慣等,對用戶進行種類劃分。結合以上兩方面,輸出用戶畫像,其能夠準確地分析出用戶的行為習慣、消耗電量、繳費習慣等,對用戶的特征進行提取,為電力單位和用電用戶提供方便。
對用戶用電日負荷曲線和燃氣日消耗曲線進行聚類分析。由于這兩類曲線中的數據都具有高維度的特點,因此,在聚類分析中會產生大量的復雜計算。為了提高分析效率,引入Canopy+改進K-means算法,首先對用戶的用電數據進行預處理,并歸類分析,降低總數據量,在此基礎上進行K-means聚類,可大幅度降低運算量,降低對計算機的運算載荷需求,提高處理效率。通過Canopy算法對數據進行預處理,輸出數據的Canopy子集,設置該Canopy子集為K-means算法的原始計算核心,同時確定K值[11]。算法流程設計為:運行Canopy算法進行預聚類;得到K個Canopy子集及其Canopy質心;在此基礎上運用K-means算法,以K個Canopy質心為初始聚類中心進行算法迭代,直至收斂。
采用Canopy聚類算法進行預分類如下。
①生成樣本列表[List=[x1,x2,x3,...,xn]],根據一定策略確定初始距離閾值[T1]、[T2],且[T1]>[T2]。
②從列表[List=[x1,x2,x3,...,xn]]中無規則地抽選出一個試驗數據,將該數據設置為原始Canopy質心,記為O,并為其生成一個子集So,即Canopy子集,作為當前基準;
③再次從列表[List=[x1,x2,x3,...,xn]]剩余的樣本點中隨機選取一個數據,記為Q,設其到O的距離為D。根據強弱規則處理Q點:若[D]>[T1],則Q生成新Canopy子集,并將Q從列表List中刪除;若[D]≤[T1],則將Q弱標記,且Q放入So子集;若[D]≤[T2],則將Q強標記,且Q放入So子集。
不斷對數據進行迭代,循環執行第三步,直到輸出的數據List中元素數目清零,完成Canopy聚類運算。
2 案例分析
為了檢驗本研究設計的指標體系的應用效果,選取管區內A、B、C、D 4家典型企業用戶作為試驗對象。監測時間為2020年10月到2021年9月,分析其用電情況。通過對用電情況進行調研和考察,同時參考企業的基本信息和信用體系評分等信息,依據綜合用電指數指標體系的評價方法,繪制客戶的外部特征。綜合用電指數結果如表2所示。
在不同的二級指標考核下,4家企業的得分綜合體現為一個外在的表現特征,對這4家企業進行用電畫像的繪制,結果如圖2所示。
通過對用戶用電畫像進行分析,可以看出,A企業的用電行為習慣良好,企業在用電時能夠遵循經濟用電的原則,避免能源的浪費,與另外3家企業相比,其有著十分明顯的優勢,對該企業的建議是繼續保持企業的用電習慣,合理分類用電,關注企業過剩能源的回收,同時可以將企業的用電策略向外推廣,起到區域用電協作環保的作用,促進該地區的綠色環保用電習慣的形成。與另外幾家企業相比,A企業在互動用電方面存在著許多不足,在今后的用電優化方面應該著重注意提升互動用電。B企業和C企業的用戶畫像表明這兩家企業的用電習慣較差,資源浪費的較多,無法做到經濟綠色用電,沒有形成對資源的再循環利用,尤其是在用電穩定性和用電合理分配上存在著嚴重的不足,但這兩家企業在互動用電方面表現良好,建議B企業和C企業在今后的用電優化方面將重點放到提升經濟綠色用電上,注重資源的回收再利用。從D企業的用戶畫像中可以看出,該企業的綜合用電指數很高,只有在綠色用電方面存在著不足,在今后的用電優化中應該多關注綠色用電,調整電力資源的配置方案,提高電力資源的利用率。
綜上所述,基于綜合用電指數的用戶畫像能夠將用戶的用電習慣特征精準形象地表現出來,對用戶自身和電力系統的用電優化都起著指導性作用。
3 結語
本研究利用綜合用電指數建立了全面系統的用戶畫像。通過對用戶畫像的分析,能夠得出不同用戶的用電信息和行為特征,方便電力系統對用戶的用電進行調度。通過實例分析可以看出,本研究所設計的用戶畫像能夠對用戶的行為特征進行精準分析,供電企業可根據用戶畫像規劃供電方案等。但由于時間的限制,本研究沒有對大量的用戶進行分析,在今后的研究中還要進一步完善用戶畫像,為用電分析提供更多的幫助。
參考文獻:
[1] 陸曉,徐春雷,冷釗瑩,等.基于數據驅動方法的疫情階段電力用戶負荷特性畫像模型[J].電力建設,2021(2):93-106.
[2] 王立斌,馬浩,楊鵬,等.基于用電信息的電力能效服務潛在客戶挖掘[J].電力大數據,2020(9):34-41.
[3] 周玲,鐘璐,黃淵軍,等.用戶畫像和標簽在電力服務系統中的應用研究[J].自動化儀表,2021(5):10-13.
[4] 趙晉泉,夏雪,劉子文,等.電力用戶用電特征選擇與行為畫像[J].電網技術,2020(9):3488-3496.
[5] 時珊珊,田英杰,金瑞楊,等.基于聚類的電網低壓臺區用電畫像方法研究[J].電工電能新技術,2020(8):66-74.
[6] 陳佳,陳輝,成飛.浙江居民用電需求的影響因素研究及定量預測[J].大眾標準化,2020(15):124-125.
[7] 羅金滿,溫兆聰,董文杰,等.基于居民用戶畫像的綜合能源需求響應潛力量化模型[J].可再生能源,2020(10):1407-1414.
[8] 張琳娟,許長清,王利利,等.基于多維度能耗分析的園區用戶畫像模型[J].可再生能源,2021(8):1078-1086.
[9] 張壯,馮小年,錢鐵云.基于多模態融合技術的用戶畫像方法[J].北京大學學報(自然科學版),2020(1):105-111.
[10] 王利利,張琳娟,許長清,等.能源互聯網背景下園區用戶畫像及成熟度評價模型研究[J].中國電力,2020(8):19-28.
[11] 杜佳穎,段隆振,段文影,等.基于Spark的改進K-means算法的并行實現[J].計算機應用研究,2020(2):434-436,497.