方正云,楊 捷,楊 泓,廖潔萍,段明明
(中國南方電網 云南電網有限責任公司,昆明 650011)
電力服務單位通過電力營銷實現創收增利.為了滿足社會公眾的需求,電力商品與其附加服務的生產、輸送、分配、銷售貫穿整個營銷過程.隨著市場變化以及服務模式的轉變,我國電力服務單位的營銷模式也需在新的形勢下做出變革.改革主要體現兩方面:一方面要進行電力體制改革和智能電網建設;另一方面要兼顧電力市場需求和客戶滿意度.新模式下的電力營銷需要增供擴銷,擴大客戶服務的功能,確定不同客戶群體對電力電能的消費和使用能力,從而起到引導電力服務單位生產、運營的作用.因此,通過分析不同客戶的用電消費行為模式,制定針對性的運營策略,判斷和分析營銷狀態,提出客觀、即時、準確地決策意見對于提高電力單位在能源市場中的配額,創造更多的經濟以及社會效益意義重大[1-5].
針對電力營銷中客戶行為的風險評估和建模,由于同時涉及客戶行為影響力以及克服心理反應的建模,需要使得營銷分析更符合人類認知模式,即實際接觸客戶行為的隨機性和模糊性,從而實現對電力營銷狀態的精準評估.本文基于模糊集理論和概率論云模型[6-7]來定量描述電力營銷客戶對象的行為,并對價格敏感度、投訴率、欠費率、銷售變現天數以及忠誠度這5個參數的變化波動情況進行離散余弦變換,再利用云建模并結合云測度定量化描述每個客戶在營銷過程中的特征.同時結合聚類或者分類算法實現客戶分級與銷售狀況評估,為電力營銷管理決策提供支持.
利用適當的營銷服務調整來創造價值,近年來受到電力服務單位越來越多的關注.研究著眼點包括對電力營銷目標市場和供電企業營銷狀態的動態分析評價,對售電量及其影響事件的因素分析挖掘,對電力客戶實時履約能力判斷以及對供電企業營銷業績效果考核等.其引用的評估手段從類別上可以大致劃分為3種,分別為基于模糊集理論、基于概率論與數理統計以及人工智能技術.采用的分析模型涉及模糊評判法、物元模型、聚類技術、因素關聯模型、排序算法、主成分分析法、神經網絡算法以及熵權法等.然而,目前市場電力服務單位營銷數據在表征方式、類別等特性上均存在明顯的差異.營銷分析評估在具體實施時存在難以量化、采用數據定性分析困難的情況,這主要是由于大多營銷策略均是采用自然語言描述的,具有天然模糊性和不確定性.然而,基于模糊集理論的評價方法容易忽略隸屬函數本身的不確定性,且隸屬度函數的構造和生成因為使用者的偏好而存在不同,從而容易降低對評價對象認知的客觀性.單純使用概率統計理論方法,雖然在建模和分析難度上最低,卻難以有效量化自然語言描述的各種概念.通過人工智能方式得到的分析結果雖然對樣本組成的魯棒性更強,但中間生成的參數和模型的實際物理意義難以明確,且參數調整和建模本身難度更高,在實際使用中,計算代價以及硬件成本也較為昂貴[8-11].
云模型是通過統計分布去定量化描述一個定性概念,其中,定性概念C的任意一次隨機出現可以表示為x,也稱為一個云滴.x對C的確定度為u(x),u(x)屬于0~1自然分布中的隨機數,x在論域上的分布即生成一個云模型,進一步通過計算云期望J及熵I來描述其基本特性.超熵L是云模型特有的數字特征,是熵I的不確定性度量.云期望、熵以及超熵也是云模型中最常用的云測度.

離散余弦變換是將待分析數據投影到一組余弦正交基上的變化方法.采用其對隨時間變化的用戶數據進行處理主要是因為余弦變換能夠有效地將反映波動變化的數據成分分量與偶然的數據有效分離,且通過變換后,數據整體的能量變得更加集中,反應出的數值特點也更加容易通過統計等分析進行處理[12-13].X表示一個客戶行為采樣信號,對應的離散余弦變換矩陣為B,B為一個M×M的變換矩陣,則對應的離散余弦變換為
Y=BX
(1)


云測度需要進一步通過適當的聚類/分類模型進行無督導或者督導學習,從而達到識別不同客戶類型的目的.神經網絡算法作為一種模擬自然信息處理流程的機器學習模型,能夠更好地適應多特征融合分類的使用場景,特別是將其模擬為神經元工作方式,每一個神經元對多輸入信息加權處理,并疊加整合向下一層進行傳遞.而層與層之間通過一個開關函數實現非線性傳遞,利用樣本標簽信息和實際分類結果之間的誤差,構造誤差能量與權重之間的損失函數,再通過誤差能量對權重系數求導,以一階梯度為零點,在局部凹函數的假設下,優化得到最佳權重[14-15].
反向傳播神經網絡算法在實際使用時,一般優先構造生成目標函數,得到實際輸出與期望輸出的誤差均方.在均方誤差最小原則下,構造出目標函數的凹解集合,使用梯度下降或者其他尋優算法得到最優權重,獲得極小值點.反向傳播神經網絡一般包括至少一個隱層結構,每個隱含層中具有若干隱單元Vj(j=1,2,…,J0)連接其前向輸入單元ξk(k=1,2,…,K)以及后向輸出單元Oi(i=1,2,…,I0).定義wjk為從輸入單元ξk到隱單元Vj的配置權重系數,從隱單元Vj到輸出單元Oi的配置權重系數為Wij,ω={W,w}用于表示權重系數矩陣;上標μ用于區分輸入類型,μ=1,2,…,P;g1和g2為激活函數,實現不同隱含層之間的光滑連續過渡.
對確定輸入模式為μ,隱單元j的輸入可以表示為
(2)
其后向輸出為
(3)
單元i的前向傳遞輸入表示為
(4)
整合傳遞激活函數得到
(5)
其中,單個單元目標誤差函數為
(6)

單元i總誤差均方函數表示為
(7)
其中,優化迭代權重的調整方向為梯度的負方向.ω增加變化為ω+Δω,使誤差迭代減小,最后收斂得到全局極值點.從隱含單元到輸出單元梯度變化表達式為
(8)
從輸入單元到隱含單元梯度變化表達式為
(9)

ωnew=ωold+Δω
(10)
梯度下降算法的長調節因子一般是人為確定的,也可以通過共軛梯度或者隨機梯度等方式自動生成.例如在模擬退火、蟻群、鳥群等智能優化算法中,其下降步長可以是集群或者多個方向計算得到的平均值,從而提高整體算法的性能和魯棒性[16].本文所采用的神經網絡算法輸入變量是客戶云模型計算得到的云測度,考慮到實際建模的復雜度和計算代價,采用兩層隱含層的結構進行實際配置,生成最后用于分類識別的計算模型.神經元上、下兩層之間采用全連接的方式建立其映射路徑,激活函數選取軟閾值的S形函數.
電力營銷客戶狀態等級可以具體劃分為“優、良、中、劣”4個檔,對應1~4級.通過云模型分析采集得到的客戶數據,并轉化生成相應的云測度指標,其中,用戶等級劃分主要依據專家經驗得出.計算評估的數據集合包括了實際采集得到的473例樣本,每個樣本的時間觀測周期為每月一次,連續采集了近5年的數據.因為實際數據中存在部分數據點缺失或者明確記錄錯誤等情況,剔除了其中21例樣本,并對剩余的452例樣本中的數據點進行了缺失值補充,補充值為該數據點前后數值的加權平均值.
“優、良、中、劣”4檔在進行神經網絡訓練計算過程中,被具體標記為1、2、3、4進行相應的類別劃分.在訓練計算過程中,訓練數據集中采用督導訓練的方式,每個類別和它對應的特征分別作為輸出和輸入.
在進行神經網絡計算過程中,每個特征參數的傳遞連接權重被計算歸一化,即權重取值范圍為0~1.梯度下降的步長取值范圍為10-3~10-5量級.以客戶的銷售變現天數為示例,圖1給出了客戶銷售變現時間波動趨勢圖.根據圖1可以看出,客戶數據在不同時間內存在時變特點,對其進行離散變換,同時分析其數據分布的云模型,得到對應的結果分別如圖2、3所示.

圖1 客戶銷售變現時間Fig.1 Customer sales cash-in time

圖2 離散余弦變換結果Fig.2 Results of discrete cosine transformation

圖3 云模型分布Fig.3 Cloud model distribution
通過圖2余弦變換得到的數據結果可知,除了存在一個零頻率分量外,在其他周期頻率上也存在波動變化,如圖2圓形框圖中所示.該波動從一定程度上反映出客戶行為特點,可以提取作為客戶行為分析指標.
圖3中每個數據實現即表示一個云滴,可以直觀地觀測出其行為應屬于一個二元混合正態云模型.數據分布在53 d以及54 d上存在雙峰,說明了觀察數據銷售變現天數的統計特性,對應圖1具體體現為前一段時間和后一段時間銷售變現天數的區別.圖3僅僅作為一個示例給出,其它的監測參數也同樣存在隨時變化的曲線,可以建模生成相應的云滴統計模型.
結合前文提及的計算期望、熵以及超熵計算公式,提取452例樣本的云測度以及余弦變換后的波動特征進行對應的分類識別判斷.進行50次隨機二折交叉驗證,每次抽取的訓練樣本量為所有樣本量的一半,采用另外一半樣本進行模型結果驗證,得到的對比分類測試結果如表1所示.

表1 訓練集與測試集對比Tab.1 Comparison between trainingand testing data sets %
從表1可以看出,數據通過云測度提取再經過后向反饋神經網絡進行訓練后,可以有效區分不同類別的客服數據,其平均檢測精確度可達95%以上.
本文提出了采用云模型結合后向反饋神經網絡進行電力運營客戶交易行為研究的方法.通過云測度連續提取價格敏感度、投訴率、欠費率、銷售變現天數以及忠誠度這5個參數的變化波動情況,并將其作為特征向量,輸入神經網絡中進行訓練,最后得到能夠進行自動識別的分類模型.通過對電力營銷客戶狀態等級的分類識別,可以有效鑒別出當前服務質量水平以及是否具有改進空間.在得到的分類等級為“中”及以下時,可以及時調整服務方式,加強監督管理,該方法具有良好的推廣性.