王永才, 林浩
(1.佛山供電局有限公司, 佛山 528000;2. )
隨著社會的進步和人們生活水平的提高,家庭用電占社會用電的比重日趨增大,增強居民節約用電的意識,進而引導其合理的用電成為節能減排的重要舉措[1]。據心理學研究表明,特征相似的群體之間進行某一維度的對比,將更能激發群體成員的潛在心理意識。為了引出人們潛在的“節能意識”,依據家庭特征搜索出每個家庭的相似鄰里群體,并將他們的用電情況進行對比分析,引起家庭用電大戶們的重視,通過這種長期潛移默化的意識影響方式,進而達到節約用電的效果。但每個家庭的特征都有所差異,如:住房面積、家用電器、常住人口等。本文將重點闡述如何搜索識別出具有相似特征的鄰里用戶,并提供相似鄰里用電對比的應用思路。
如何識別用戶的用電特征?近年來,國內眾多學者圍繞相關的課題開展了一些有益的研究,如劉政[2]等提出的基于特征相似度的家庭用電負荷識別方法,該方法提取家庭用電正常穩定運行時的功率、電流指標作為特征參數,利用提取的特征參數作為識別模板,通過比較待識別負荷特征參數與特征識別模板的相似度,并通過最大相似度原則確定家庭用電負荷的類別;陸俊[3]等提出的一種基于特征信息量的特征優選策略,實現了一種特征自適應的用戶用電行為分析方法,完成優化的用戶用電行為分析;趙騰[4]等提出的一種采用互信息與隨機森林算法的用戶用電關聯因素辨識及用電量預測方法,根據不同用電模式對用戶進行群體劃分,并利用互信息矩陣從區域及行業經濟數據、氣候條件,以及電力價格等方面辨識與用戶群體用電量相關聯的因素,進而構建基于隨機森林算法的用電量大數據預測模型;張素香[5]等提出的一種基于云計算的居民用電行為分析模型,對智能小區的居民用電行為展開研究,基于云計算平臺和并行k-means聚類算法,建立了峰時耗電率、負荷率、谷電系數等時間序列特征,并采用熵權法計算各類特征權重。
結合佛山供電局的實際情況以及對國內學者論著的研究總結發現,在實際生活中,家庭用電主要受收入水平、常住人口、空調、電熱爐灶、電熱水器等指標的影響。這其中,有些指標數據雖然很難直接獲取,但我們可以從其他維度找到反映該指標的影響因素,從而輔助進行判斷。例如,每個家庭的收入水平無法直接獲取,但其所在的區域(即地理位置)在某種程度上卻是經濟收入高低的一種反映。類似地,每個家庭的人口數量也較難獲取,但可以通過其住房面積或用電量來間接衡量。因此,我們選取地理位置、住房面積和空調用電量等作為尋找用電相似鄰里的特征指標。此外,由于現階段家庭用電抄表時間和周期不統一,所以,需要考慮電量對比口徑的一致性問題,故而將抄表截止時間作為一個時間標尺。
(1) 城市:根據用電地址可獲取用戶所在城市。
(2) 抄表截止月:將最新一期賬單中最近一個月電量(完整的)的月份稱為抄表截止月,確保相似鄰里間在對比月都有相應的電量數據。
(3) 地理位置:通過技術手段獲取該用戶的用電地理位置,無法獲取坐標的情況下,用市區作為地理位置的初始值。
(4) 住宅面積:根據用戶的用電情況,利用支持向量回歸模型對其住房面積進行預測。
用戶是否安裝空調對其用電結果有著直接的影響,也間接著反映出用戶的收入支出水平。因而,我們需要對用戶是否安裝空調進行判斷,其方式如下:
(1) 正常用戶。如果該用戶有最近12個月的電量數據且總空調電量大于200 kW·h,則該用戶過去有空調,并打上空調標簽。否則,打上無空調標簽。進一步,對于無空調標簽用戶,在過去12個月的夏季(5~10月)時,若連續某幾個月空調電量大于67,則說明已經安裝空調,并打上空調標簽。
(2) 異常用戶。如果該用戶沒有12個月的電量數據,月基準電量以(11、12、3、4)中的任意兩個月及以上電量的平均值代替。
電熱爐灶:炊事使用的是燃氣還是電;
熱水裝置:電熱水器、燃氣熱水器、太陽能熱水器、無;
家庭人口數:家庭常住人口個數。
需要注意的是,S3特征集數據可通過營銷活動來收集。
假設相似鄰里的用戶個數為P(默認為P=100,可調整),相似鄰里搜索是一個較復雜的過程,其具體步驟如下:
第1步:特征提取。提取A用戶的初始特征集S,必須有城市、地理位置,抄表截止月(完整電量月),還可能有空調、電熱水器等特征。
第2步:U型數據池。根據城市、抄表截止月和月電量范圍條件,鎖定有效搜索群體(記為:U型數據池),換句話說,同一城市、相同抄表截止月、抄表截止月的月電量在【10,max(2000,2Mi)】范圍內的所有用戶,其中Mi為抄表截止月的電量。
為了便于理解,現舉例說明:佛山市A用戶最近一期賬單時間為8.12—10.11,且有8、9月份電量分別為460,402,則佛山市、抄表截止月為9、9月的電量在【10,max(2000,2×402)】范圍內的所有用戶作為U型數據池。
第3步:U型數據池用戶數NT判斷。計算出U型數據池的用戶數為NT,并判斷NT是否大于P?
(1) 在NT<=P的情況下,將A用戶的“相似鄰里度”字段置為NULL。
如果NT>=60%×P,則為NT個用戶打上相似鄰里標簽,并按月進行節能鄰居和一般鄰居的電量計算,并轉入第10步;
如果NT<60%×P,則剔除抄表截止月這一特征,計算出全市范圍內的用戶數Nmax。若Nmax>P,則按照面積差的絕對值大小選取前P名用戶(注意:若排名相同,則隨機選取);若60<=Nmax
(2) 在NT>P的情況下,轉入第4步。
第4步:用戶選取。根據A用戶的地理位置由近及遠選取一定數量用戶N0(默認為1 000,可調整),且有N0<=NT。
第5步:特征差異值計算。計算N0用戶與A用戶地理位置的距離絕對值DN0、面積絕對差值的相對誤差MN0(其中 ,As為用戶A的面積,ai為NT中某一用戶的面積)、空調匹配值、電熱爐灶匹配值、電熱水器匹配值和其它電器匹配值。
為了明確電器匹配值的計算方法,以空調匹配值計算為例:如果A用戶無空調,則N0個用戶中無空調的匹配值為1,有空調的匹配值為0,即同有同無都為1,否則為0。注意:若沒有獲取到A用戶某些電器特征,則不考慮N0用戶該部分電器的特征情況,換句話說,這部分電器特征不納入評分計算范圍。
第6步:計算每個用戶的總分。按照一定的計分準則,為N0用戶各特征差異值進行打分(見表1)。同時,計算出每個用戶的總分,并按照由高到低的順序進行排名。
第7步:總分大于0的用戶量判斷。統計出N0用戶中總分高于0的個數S0,并判斷S0是否小于P?若S0>=P,則轉入第8步;否則,轉入第9步。
第8步:提取相似鄰里(S0>=P)。根據總分排名情況,取前P名用戶(注意:將與最后一名總分相同的用戶按照面積絕對差值的相對誤差進行排序,選擇誤差較小的用戶),給它們打上相似鄰里標簽,并為A用戶在”相似鄰里度“字段記錄上第P名用戶的分數。
第9步:提取相似鄰里(S0
第10步:按月進行電量對比計算。以9月為例,將相似鄰里9月份的月電量由小到大進行排序,得到有序的月電量E1、E2,…E25…EP(記為:Ei,其中i=1,2,…,P),進一步,判斷Ei是否<=10?如果Ei<=10,且Ei<=10的用戶個數L>50%×P,則剔除10 kW·h及以下用戶后再計算節能鄰居(前25%用戶)和一般鄰居(剩余75%用戶)電量;否則,不剔除,將P個用戶的月電量都用于節能鄰居和一般鄰居電量計算。
在上述相應步驟中,如果節能鄰居月電量<=10 kW·h或一般鄰居月電量<=10 kW·h,則表明該用戶周圍的鄰里大多為空房用戶。
為了便于理解,將相似鄰里的整個搜索過程,其具體細節部分請參見上述的相應內容,如圖1所示。

圖1 相似鄰里搜索流程圖
用戶家庭用電特征的評分準則:特征的重要性越大得分越高,連續特征差異值越小得分越高,離散特征差異值越大得分越高。評分方式具體如下:
第一,連續特征差異值的離散化。將距離及面積絕對差值的相對誤差離散化,同一離散區間用戶得分相同。在某種程度上,距離在20 km以上或者面積絕對差值的相對誤差在20%以上用戶已經不再是我們非常關注的鄰里群體。鑒于此,二者的初步劃分方式為:
距離區間:在(0,20】范圍內距離以1 km為單位劃分20個等間隔區間,記為D1,D2…D20,而距離為0 km和20 km以上的區間可分別記為D0、D21。
面積絕對差值的相對誤差區間:在(0,20%】范圍內面積絕對差值的相對誤差以2%為單位劃分成10個等間隔區間,記為B1、B2…B10,而面積絕對差值的相對誤差為0和20%以上的區間可分別記為B0、B11。
第二,電器匹配值得分。電器匹配值為0,則得分為0;電器匹配值為1,則空調匹配值得分K0>電熱爐灶匹配值得分Z0>電熱水器匹配值得分R0>其它電器匹配值得分Q0>0,且K0>Z0+R0+Q0,Z0 第三,距離和面積得分。距離得分隨面積得分變化而部分變化,而面積的得分也受著電器匹配值得分的制約,它們之間相互制約相互影響,要想給予一個合理的得分較為困難。現階段,我們采取的約束措施如下: 面積得分約束不等式: (1) 距離得分約束不等式: (2) 根據上述不等式(1)、(2)的約束條件,給出了各特征差異值的得分,如表1所示。 目前,該方法已在佛山供電局掌上營業廳APP等多個移動應用上使用。 斯坦福說服力科技實驗室主任BJ Fogg曾經主導研究了關于用戶行為心理學的一個課題,并定義了一個 “福格行為模型”。他這樣闡述用戶行為發生的條件:一個行為得以發生,行為者首先需要有進行此行為的動機和操作此行為的能力,接著,如果他們有充分的動機和能力來施行既定行為,他們就會在被誘導/觸發時進行。BJ Fogg的行為模型重點在動機、能力、觸發三個因素上[9]。 因此,本文的相似鄰里對比應用基于用戶行為心理學進行了設計,利用用戶的比較、窺探心理,用戶可以看到自己當期的用電量與相似鄰居的比較結果,從而引起用電大戶的重視,起到引導合理用電、節能減排的效果。 以領獎臺的方式直觀展示最近一期的相似鄰里用電量排名。分三種角色進行排名對比,包括節能鄰居(相似鄰里月電量排名前25%的所有用戶電量的平均值)、一般鄰居(在相似鄰里中,非節能鄰居月電量的平均值)以及我家用電量。此外,應用還提供相似鄰里的特征解釋,為用戶提供涵蓋住宅面積、周邊距離和空調使用率的相似鄰里特征信息展示。具體的應用效果如圖2所示: 本方法通過為每個用電家庭構建一個特征庫,包括地理位置、住房面積、有無空調等,利用專家評分法對各家庭間的特征匹配程度進行打分,綜合得分越高的家庭表示相似度越高,進而搜索出任何一個家庭的相似鄰里群體。此外,應用在佛山供電局掌上營業廳APP上,計算出該群體的節能用戶和一般用戶的用電量,以便群體中的家庭用戶作為參考對比,進而增強用戶的節能意識,也為供(售)電企業提供了新的客戶服務理念,在未來的配售電市場競爭中處于更有利的位置[6-8]。 表1 “相似鄰里”特征差異值得分表 注:(1)在遵循評分準則的情況下,具體的分數值可以進行相應調整;(2)總分為負數的用戶不參與排名計算。 圖2 相似鄰里用電對比效果圖5 相似鄰里對比應用
5.1 基于用戶行為心理學設計
5.2 應用功能效果展示
6 總結


