武蒙 馬云華
【摘? 要】供電企業作為國家和政府服務部門,應結合供電企業的特點建立自己的信譽管理體系。定風險預警登記,加強電費風險規避機制,建立以客戶需求為導向以支撐營銷業務快速發展為主線,以深化營銷業務系統應用為基礎,以拓展電費回收風險防控分析為重點應用的新型客戶互動服務體系。
【關鍵詞】大數據分析;電費風險
1電費風險類型
1.1電費計費差錯
電量測量的設備在進行安裝的時候雖然都會提前進行比較周密的檢查,確定設備的合理性,但是由于設備在使用的時候會因為使用年限久遠產生超出可接受范圍的誤差,這就使得電費的記錄也會存在誤差。有些素質低下的用電人員會利用電量計量上產生的誤差以及設備的漏洞,利用一些裝置進行電量的盜取。這就使得電量測量的安全效果遭到破壞,電費的實際價格就無法得到公正的顯示以及收取。
1.2用電報裝的差錯
客戶在需要用電的時候會利用書面申請的方式向電力公司申請用電以及供電裝置的安裝。專業工作人員會進行現場勘查,按照雙方都合理接收的意愿進行供電合同的簽訂,在之后安裝電能計量表,通電運行。用電供電的過程中主要會出現一些潛在的電力風險,用電設備的使用周期、供電項目的合法程度、電費誤差風險、用電客戶的誠信度等。這些都是影響、貫穿于用電報裝風險的非常重要的部分。
1.3人工抄表收費的差錯
電力公司的工作人員定期前往客戶所在地記錄客戶電能計算裝置的數據。用電量收費會按照合約中所約定的電費計量政策進行電費的計量,然后通知客戶進行電費的繳納。供電企業在抄表到收費的過程中,都需要工作人員進行人工抄記錄工作和錄入計算機系統。所以,供電企業的記錄人員存在一定的責任風險以及操作風險,供電企業抄表收費一定要注意電費風險的問題。
2基于大數據分析的電費風險防控系統建設
2.1數據采集
目前電力營銷管理系統使用傳統的關系型數據庫存儲用電客戶、電費、業擴、用檢、稽查等數據。企業基本信息、企業法人個人征信、納稅證明信息、銀行貸款信息等數據需從工商管理局、銀行、征信等專業系統獲取,需考慮各系統的數據存儲方式及獲取方式的多樣性。企業經營狀況、國家宏觀經濟環境、區域社會環境等半結構化或非結構化數據主要是借助網絡爬蟲或網站公開API等方式獲取數據。
2.2數據處理與分析
2.1數據預處理
當今數據庫極易受噪聲、丟失數據和不一致數據的侵擾,數量太大,并且多半來自多個異構數據源,導致數據質量較低,低質量的數據將導致數據分析的結果不準確,因此在模型訓練之前,需要進行數據預處理。數據預處理主要從特征因素量化、缺失值處理、無效值處理等方面展開。
2.2特征變換
為更好地進行模型訓練,需要進行特征因子化轉換:(采用0/1/2/3…數字編碼來表達。)例如以下特征:①行業、行業分類、行業大類、高耗能行業、用電類別、電壓等級、是否預購電用戶;②回款時長是否超過5天、回款時長是否超過10天、回款時長是否超過15天、是否存在逾期;③是否存在投訴記錄、歷史投訴次數、是否存在在途電費退補流程、是否存在在途電表申校流程、是否代扣異常、是否存在故障換表流程;④是否納入人民銀行信用平臺。
2.3大數據分析構建模型
2.3.1大數據分析構建模型
將問題定義為二元分類/三元分類問題,采用隨機森林、邏輯回歸、決策樹、支持向量機進行模型訓練。
2.3.2電費風險模型算法研究
采用邏輯回歸、隨機森林、決策樹、支持向量機(SVM)等方法來訓練與建模,分別分析客戶下月是否有風險。(1)邏輯回歸(logisticregression)是廣義線性模型的一種,可根據一組數值變量預測二元輸出。(2)隨機森林(randomforest)是一種組成式的有監督學習方法。在隨機森林中,同時生成多個預測模型,并將模型的結果匯總以提升分類準確率。(3)決策樹(DT)是一種基本的分類和回歸方法。在分類問題中它可以認為是if-then規則的集合,也可以認為是定義在特征空間與類空間上的條件概率分布。(4)SVM旨在在多維空間中找到一個能將全部樣本單元分成兩類的最優平面,這一平面應使兩類中距離最近的點的間距(margin)盡可能大,在間距邊界上的點被稱為支持向量(supportvector,它們決定間距),分割的超平面位于間距的中間。
3基于大數據分析的電費風險防控策略
3.1建立科學的電費風險管理信息系統
首先電力企業要建立適應自身發展的電費風險管理系統,要緊跟時代潮流,派遣專業的人士對信息系統進行完善和補充,對于電費風險管理信息系統要成立專門的管理部門,其次,要對相關的信息系統進行不定期或定期的整修與維護,要及時的解決和完善發現的問題,要對相關的系統進行不定性,不定量的測試,將信息系統的作用最大程度的發揮出來,對于電費風險管理信息系統的安全建設要特別的重視,除了學習其他企業優秀的管理經驗外,還要設置必要的密碼訪問,操作權限規定,防火墻等。要不定時的更新與補足信息系統的管理方式與手段,從而確保信息系統能夠持續的為電力企業及電力風險管理的長久發展提供更好的服務。
3.2強化電費回收
依據電費回收風險客戶風險等級劃分的結果,可在實際業務場景中進行應用,建議可針對抄表員、管理層等不同崗位設計標簽及其應用場景。抄表員在電費回收工作各階段,利用客戶風險等級標簽篩選客戶群體,指導電費回收工作。一是在抄表階段,針對高風險、中風險客戶,盡量做到優先抄表、當面抄表。并根據移動終端的提示,核實用戶的聯系信息,包括戶號、戶名、聯系電話、通信地址等。二是在派送電量電費通知單工作階段,針對高風險、中風險客戶,應粘貼紙質通知單,并盡可能當面通知客戶;針對低風險客戶,可以采用發送電子賬單的形式通知,包括短信賬單、微信賬單、郵件賬單等。三是在派送催費通知單工作階段,及時跟進高風險、中風險客戶的電費繳納情況,增加催繳頻率和力度。并根據資源情況,采取電話的方式進行催費。對于管理層,可采取按電費風險等級排序,優先開展重點催費措施;或針對高風險用戶提高催費短信發送頻率,差異化催費內容,對低風險等級用戶降低催費短信發送頻率等。
3.3完善電費核算
通過繪制電量波動率直方圖、電量差直方圖來觀察客戶用電分布規律,觀察發現客戶用電波動情況符合典型正態分布。對于這種分布,從統計學的角度分析合理波動率及差值區間。運用“超出中位數2倍四分位差”的異常數據診斷算法,該算法將同類的一組數據進行排序然后測度順序數據的離散程度,可以衡量中位數的代表性高低。具體在本項目中的做法,即將同一類用戶(如居民用戶)的同比上期、環比上期抄表數據按電量差值及波動率分別排序,在每個排序數列中用3個點將全部數據分為4等份,與這3個點位置上相對應的電量差值(波動率)稱為四分位數,其中下四分位數等于該樣本數據從小到大排列后第25%的數值,中位數為該樣本數據從小到大排列后第50%的數值,上四分位數等于該樣本數據從小到大排列后第75%的數值,四分位差=(上四分位數-下四分位數),則該類用戶的電量差值(波動率)的異常閾值=中位數+2×四分位差。運用四分位數算法計算得到各類用電客戶用電量突增率、突減率、突增值、突減值的閾值,根據此閾值在系統中設置可調變量的驗證規則并校核出的電量異常客戶,自動生成《電費異常復核清單》下發復核。
4結束語
通過本項目的設計開發,建立科學、完善的用戶電費風險預測模型,預測下一個周期可能發生電費回收風險的客戶。建立覆蓋客戶全業務全環節的預付費/后付費方式選擇、預收策略、發行時間、結算頻度、交費方式、催費策略、停限電策略、電費保全策略、欠費處置策略等風險防控策略庫。
參考文獻:
[1]王鑫,杜穎,張金桂,劉宏國,張春秋,劉東丹.大數據技術在潛在電費風險挖掘中的應用[J].自動化與儀器儀表,2018,01:123-125.
(作者單位:國網衡水供電分公司)