陳俐冰,何 容,邱 林,王 穎,孫天昊
(1.國網(wǎng)重慶市電力公司 客戶服務(wù)中心,重慶 400017;2.重慶大學(xué) 計算機學(xué)院,重慶 400044)
電力客服中心用戶行為分析研究與實現(xiàn)
陳俐冰1,何 容1,邱 林1,王 穎1,孫天昊2
(1.國網(wǎng)重慶市電力公司 客戶服務(wù)中心,重慶 400017;2.重慶大學(xué) 計算機學(xué)院,重慶 400044)
目前電力客服中心已經(jīng)開展了多元化服務(wù)渠道為客戶提供全方位的服務(wù),但缺少對各渠道的深度挖掘和分析。針對這種情況,提出基于大數(shù)據(jù)進行電力客服中心用戶行為分析,將為多個電力客戶服務(wù)渠道建立智能在線監(jiān)測分析系統(tǒng)。首先進行分布式多線程的數(shù)據(jù)采集,然后基于大數(shù)據(jù)從多維度進行用戶在線行為分析,包括統(tǒng)計分析和聚類分析等。其中統(tǒng)計分析包括服務(wù)渠道指標(biāo)、服務(wù)功能總指標(biāo)、單個服務(wù)功能指標(biāo)、客戶訪問時間指標(biāo)、客戶區(qū)域分布等,聚類分析采用K-means聚類根據(jù)忠誠度、使用頻度、貢獻(xiàn)度三個指標(biāo)進行用戶細(xì)分挖掘分析。實現(xiàn)的系統(tǒng)能夠獲得各渠道的客戶行為特性,為企業(yè)全面掌握各服務(wù)渠道提供了支撐,有助于提供更為智能便捷的個性化服務(wù)。
大數(shù)據(jù);電力大數(shù)據(jù);數(shù)據(jù)挖掘;用戶行為分析
隨著數(shù)字信息化時代的迅猛發(fā)展,信息量也呈爆炸性增長態(tài)勢。近年來,電力行業(yè)信息化發(fā)展迅速,特別是伴隨著下一代智能化電網(wǎng)的全面建設(shè),以物聯(lián)網(wǎng)和云計算為代表的新一代IT技術(shù)在電力行業(yè)得到廣泛應(yīng)用,電力數(shù)據(jù)資源開始急劇增長并形成了一定的規(guī)模。
電力大數(shù)據(jù)是以業(yè)務(wù)趨勢預(yù)測、數(shù)據(jù)價值挖掘為目標(biāo),利用數(shù)據(jù)集成管理、數(shù)據(jù)存儲、數(shù)據(jù)計算、分析挖掘等方面的核心關(guān)鍵技術(shù),實現(xiàn)面向典型業(yè)務(wù)場景的模式創(chuàng)新及應(yīng)用提升[1]。電力大數(shù)據(jù)的應(yīng)用將推動公司業(yè)務(wù)發(fā)展和管理水平。其中客戶服務(wù)中心是公司優(yōu)化整合服務(wù)資源,打造“全業(yè)務(wù)、全天候,服務(wù)專業(yè)化、管理精益化、發(fā)展多元化”的供電服務(wù)平臺。
目前重慶電力客服中心已經(jīng)開展了多元化服務(wù)渠道為客戶提供全方位的服務(wù),包括短信、網(wǎng)站、手機APP、微信、有線電視等。
文中將基于電力大數(shù)據(jù)對電力客服中心的用戶行為進行分析研究。用戶行為的研究與心理學(xué)、社會學(xué)、社會心理學(xué)、人類學(xué)以及一切與網(wǎng)絡(luò)行為的學(xué)科密切相關(guān),它研究網(wǎng)絡(luò)用戶行為的規(guī)律性,借以控制并預(yù)測網(wǎng)絡(luò)用戶行為,并實現(xiàn)特定的目標(biāo)。具體來說,網(wǎng)絡(luò)用戶行為研究就是分析網(wǎng)絡(luò)用戶的構(gòu)成、特點及其行為表現(xiàn)出來的規(guī)律[2]。
對短信、網(wǎng)站、手機APP、微信、有線電視等多個電力客戶服務(wù)渠道建立智能在線監(jiān)測分析應(yīng)用,進行分布式多線程的數(shù)據(jù)采集,從多維度進行用戶在線行為分析,研究用戶行為,各渠道的客戶群體特性,為提供更為智能便捷的服務(wù)奠定基礎(chǔ)。進行全面系統(tǒng)的用戶行為分析,有助于掌握各渠道客戶實際使用情況,為有針對性地進行各服務(wù)渠道的優(yōu)化提升,進一步提供個性化服務(wù)定制奠定基礎(chǔ)。
目前基于大數(shù)據(jù)的用戶行為分析最常用的技術(shù)是數(shù)據(jù)挖掘技術(shù),包括大數(shù)據(jù)平臺的構(gòu)建、數(shù)據(jù)整合、數(shù)據(jù)挖掘、分析展示等方法。
文獻(xiàn)[2-3]研究了基于大數(shù)據(jù)的網(wǎng)絡(luò)用戶行為分析。文獻(xiàn)[4]實現(xiàn)了一個基于數(shù)據(jù)挖掘技術(shù)的電網(wǎng)用戶行為分析系統(tǒng)進行用電客戶細(xì)分、客戶信用等級評估和欠費高風(fēng)險客戶預(yù)測。文獻(xiàn)[5]提出了一個基于大數(shù)據(jù),云計算和智能網(wǎng)格的關(guān)系分析的電力大數(shù)據(jù)平臺的通用框架。電力大數(shù)據(jù)的關(guān)鍵技術(shù)包括大數(shù)據(jù)管理技術(shù)、大數(shù)據(jù)分析技術(shù)、大數(shù)據(jù)處理技術(shù)和大數(shù)據(jù)可視化技術(shù)。
文獻(xiàn)[1,6-7]研究了大數(shù)據(jù)技術(shù)在電力行業(yè)的具體應(yīng)用。其中,文獻(xiàn)[1]利用大數(shù)據(jù)技術(shù)應(yīng)用于客戶服務(wù)中心,可實現(xiàn)面向典型業(yè)務(wù)場景的模式創(chuàng)新及應(yīng)用提升,包括服務(wù)質(zhì)量實時監(jiān)控,熱點問題集中處理等。文獻(xiàn)[6]根據(jù)電力行業(yè)特征,分析了電力大數(shù)據(jù)的生成階段、大數(shù)據(jù)的應(yīng)用方式等。文獻(xiàn)[7]討論了大數(shù)據(jù)時代下電力企業(yè)數(shù)據(jù)挖掘的過程。
文獻(xiàn)[8-11]研究了數(shù)據(jù)挖掘技術(shù)在客戶服務(wù)中的應(yīng)用。其中,文獻(xiàn)[8]具體研究了數(shù)據(jù)挖掘技術(shù)在電信客戶服務(wù)的應(yīng)用。文獻(xiàn)[9]提出了一個大數(shù)據(jù)應(yīng)用框架來分析客戶行為。首先客戶相關(guān)數(shù)據(jù)被轉(zhuǎn)化為拓?fù)鋽?shù)據(jù)結(jié)構(gòu),然后使用拓?fù)潢P(guān)系生成共生矩陣,并用來為客戶行為分析推導(dǎo)馬爾可夫鏈模型。文獻(xiàn)[10]提出并實現(xiàn)了一個網(wǎng)絡(luò)用戶行為分析系統(tǒng),該系統(tǒng)基于Hadoop分布式平臺獲取流量,分析用戶行為。文獻(xiàn)[11]通過個案研究,大數(shù)據(jù)分析支持創(chuàng)建,提高和增強各種商業(yè)服務(wù),既能顯著提高客戶體驗,又能為企業(yè)創(chuàng)造價值。
基于目前大數(shù)據(jù)技術(shù)和數(shù)據(jù)挖掘技術(shù),研究和實現(xiàn)了電力客戶服務(wù)中心的用戶行為分析系統(tǒng)。
2.1 系統(tǒng)流程
系統(tǒng)按照圖1所示流程進行。先從多個數(shù)據(jù)源中基于大數(shù)據(jù)平臺進行數(shù)據(jù)采集,具體數(shù)據(jù)源包括為客戶提供全方位服務(wù)的短信、網(wǎng)站、手機APP、微信、有線電視等多元化服務(wù)渠道所產(chǎn)生的客戶服務(wù)數(shù)據(jù),具體包括用電查詢、電費繳納、業(yè)務(wù)辦理、信息訂閱、服務(wù)開通等。接著對采集到的數(shù)據(jù)進行建模,包括數(shù)據(jù)約簡和轉(zhuǎn)換等環(huán)節(jié),形成標(biāo)準(zhǔn)化的可以使用的數(shù)據(jù),如統(tǒng)一標(biāo)準(zhǔn)的服務(wù)功能訪問記錄等。建模好的數(shù)據(jù)通過Sqoop工具進行抽取,整合到Hadoop大數(shù)據(jù)平臺的分布式數(shù)據(jù)庫HBase中。然后使用數(shù)據(jù)挖掘技術(shù)進行具體的用戶行為分析,從多維度(如服務(wù)渠道指標(biāo)、服務(wù)功能總指標(biāo)、單個服務(wù)功能指標(biāo)、客戶訪問時間指標(biāo)、客戶區(qū)域分布等)進行包括用戶行為特征、客戶群體特性、服務(wù)渠道特征等行為分析。最后進行可視化的結(jié)果展示,包括柱狀圖、曲線圖、餅圖和條形圖等,為進一步?jīng)Q策提供支撐。

圖1 用戶行為分析流程
2.2 系統(tǒng)設(shè)計
用戶行為分析系統(tǒng)的功能包括數(shù)據(jù)采集與建模、數(shù)據(jù)挖掘與分析、結(jié)果可視化展示等關(guān)鍵內(nèi)容,如圖2所示。
(1)數(shù)據(jù)采集具體包括數(shù)據(jù)源選擇與數(shù)據(jù)源維護等功能。數(shù)據(jù)源選擇,就是選擇需要進行處理的數(shù)據(jù)源,通過數(shù)據(jù)接口的方式進行數(shù)據(jù)采集。數(shù)據(jù)源維護,就是數(shù)據(jù)源相關(guān)信息(如名稱、鏈接地址、用戶名和密碼等信息)的修改。
(2)數(shù)據(jù)建模主要加工在數(shù)據(jù)采集中所選擇的數(shù)據(jù)源,包括數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)歸約和數(shù)據(jù)轉(zhuǎn)換四個功能。數(shù)據(jù)清洗是在確定清洗的數(shù)據(jù)屬性后對所選擇的數(shù)據(jù)源進行清洗加工。數(shù)據(jù)簡化主要是對數(shù)據(jù)源中某些數(shù)據(jù)按月份或年份做匯總處理。數(shù)據(jù)歸約是對所選擇的數(shù)據(jù)源中某些不相關(guān)屬性利用直接刪減法、信息增益法等進行處理。數(shù)據(jù)轉(zhuǎn)換包括數(shù)據(jù)標(biāo)準(zhǔn)化和數(shù)據(jù)泛化,主要是對數(shù)據(jù)源中的連續(xù)值和離散值做不同的處理。針對數(shù)據(jù)源中的連續(xù)值,采用標(biāo)準(zhǔn)化作為數(shù)據(jù)轉(zhuǎn)換的方法,而針對數(shù)據(jù)源中的離散值,采用數(shù)據(jù)泛化的方法。

圖2 用戶行為分析系統(tǒng)的功能
(3)數(shù)據(jù)挖掘模塊,可選擇使用統(tǒng)計分析方法、層次分析法、KNN分類算法和K-means聚類算法等對用戶行為進行具體的分析和預(yù)測。
統(tǒng)計分析方法是指對目標(biāo)數(shù)據(jù)集中的關(guān)系屬性進行整理歸類并進行解釋的數(shù)據(jù)挖掘方法[12]。比較常用的有:因子分析、相關(guān)分析、判別分析、回歸分析等。
K-means是一種基于樣本間相似度度量的非監(jiān)督學(xué)習(xí)的聚類算法[13]。可以用來對用戶進行分類等。首先隨機選取k個點作為k個初始聚類中心,然后對剩下的點依據(jù)對k個聚類中心的相似度劃歸到對應(yīng)的聚類中,再更新每個聚類的中心,不斷迭代,直到收斂。
(4)結(jié)果可視化展示對挖掘出的結(jié)果進行數(shù)據(jù)分布、數(shù)據(jù)對比、報表生成。數(shù)據(jù)分布可以分別按照客戶類別、渠道、功能等不同的分類條件輸出相應(yīng)的統(tǒng)計信息,并以餅圖或柱狀圖的直觀化形式呈現(xiàn)。數(shù)據(jù)對比可以分別按照渠道不同的對比屬性輸出相應(yīng)的對比信息,并以柱狀圖形式輸出對比結(jié)果。報表生成分為年報表和月報表,按照渠道的不同屬性生成相應(yīng)的報表。
2.3 系統(tǒng)實現(xiàn)
最終實現(xiàn)的系統(tǒng)主要完成了各類指標(biāo)的統(tǒng)計分析和用戶細(xì)分。
(1)統(tǒng)計分析。
系統(tǒng)分別從服務(wù)渠道指標(biāo)、服務(wù)功能總指標(biāo)、單個服務(wù)功能指標(biāo)、客戶訪問時間指標(biāo)、客戶區(qū)域分布等幾個方面進行統(tǒng)計分析。其中,對電力客服中心的用戶行為的統(tǒng)計分析包括以下幾個指標(biāo):
①服務(wù)渠道指標(biāo):對每個服務(wù)渠道統(tǒng)計出渠道的總用戶數(shù)、訪問次數(shù)和訪問總時長。
②單功能指標(biāo):對每個服務(wù)功能統(tǒng)計出其用戶數(shù)、訪問時間和訪問時長。
③功能總指標(biāo):對每個服務(wù)功能統(tǒng)計出各服務(wù)功能的總用戶數(shù)、訪問次數(shù)和訪問總時長。
④用戶喜好指標(biāo):從訪問渠道、訪問時長、所訪問服務(wù)功能三個方面統(tǒng)計用戶的喜好。
⑤用戶區(qū)域分布指標(biāo):統(tǒng)計用戶所屬區(qū)域的分布情況,給出分布圖及其各占比例。
數(shù)據(jù)分布和對比包括:
①指標(biāo)在時間上的分布:包括指標(biāo)在不同時間粒度(日、周、月、年)上的分布;分布對比(同一指標(biāo)在不同時間粒度上的對比,不同指標(biāo)在同一時間粒度上的對比)。
②指標(biāo)在空間上的分布,包括不同指標(biāo)在一個地區(qū)上的分布;同一指標(biāo)在不同地區(qū)分布的對比。
③時間和空間的結(jié)合:指標(biāo)在同一時間粒度不同地區(qū)的分布,指標(biāo)在不同時間粒度同一地區(qū)的分布,分布對比。
用戶喜好分析包括渠道、時間、業(yè)務(wù)等幾方面,具體為:
①渠道愛好:以用戶在一段時間內(nèi)對各個渠道的訪問次數(shù)作為衡量用戶對渠道的喜好標(biāo)準(zhǔn)。
②時間愛好:以用戶在各個時段訪問時長作為衡量用戶時段喜好的標(biāo)準(zhǔn)。
③功能愛好:以用戶在一段時間內(nèi)對各個服務(wù)功能訪問次數(shù)作為衡量用戶對功能的喜好標(biāo)準(zhǔn)。
系統(tǒng)實現(xiàn)的數(shù)據(jù)分析界面如圖3所示。
其中,渠道分析分別向系統(tǒng)用戶展示每個渠道的用戶數(shù)、訪問次數(shù)、訪問頻度等,用統(tǒng)計圖和表格兩種方式顯示。服務(wù)功能總指標(biāo)分析以統(tǒng)計圖和表格的方式顯示不同渠道下各服務(wù)的用戶數(shù)、訪問次數(shù)、訪問總時長。服務(wù)歷年走勢分析中系統(tǒng)用戶選擇待分析服務(wù)和起止年份,選擇待分析指標(biāo)(用戶數(shù)、訪問次數(shù)、訪問總時長)后生成趨勢圖。客戶訪問時間分析中系統(tǒng)用戶選擇待分析服務(wù),設(shè)置起止時間后點擊生成分析圖。客戶區(qū)域分布分析統(tǒng)計出客戶所屬區(qū)域的分布情況并以餅狀圖和表格兩種形式展示結(jié)果。

圖3 用戶行為分析系統(tǒng)界面
(2)用戶細(xì)分。
客戶細(xì)分是把客戶按照一定的標(biāo)準(zhǔn)劃分為多個不同的客戶群,以便有針對性地實行不同的營銷策略[14]。具體的客戶細(xì)分指標(biāo)可以是用戶行為的不同、行為習(xí)慣的不同或者客戶需要的不同等等。對客戶進行正確的細(xì)分,是電力企業(yè)制定營銷策略的起點。
目前,電網(wǎng)企業(yè)的一些靜態(tài)分類方式,例如根據(jù)行業(yè)類別、用電類別、用電方式、電壓等級等等,并不能很好地反映出客戶的行為習(xí)慣和動態(tài)需求,而在實際情況中,客戶的忠誠度、客戶對各渠道服務(wù)的使用情況以及客戶對企業(yè)利潤的貢獻(xiàn)等指標(biāo)得到了極大的關(guān)注。文中使用K-means聚類技術(shù)根據(jù)這三個指標(biāo)進行用戶細(xì)分挖掘分析。
①忠誠度:主要表現(xiàn)在客戶從開戶至今所經(jīng)歷的時間(以月為單位)。
客戶保持時長=當(dāng)前年月-開戶年月
②使用頻度:是以客戶對各渠道服務(wù)的使用頻度情況。使用情況可由用戶對服務(wù)的月平均點擊次數(shù)來衡量。
使用情況=客戶對各服務(wù)總的點擊次數(shù)/客戶保持時長
③貢獻(xiàn)度:主要以客戶的月平均用電量來衡量。該指標(biāo)是電網(wǎng)公司關(guān)注的重點指標(biāo),因而也是用電客戶細(xì)分的關(guān)鍵指標(biāo)之一。
月平均用電量=累計用電量/客戶保持時長
系統(tǒng)實現(xiàn)的客戶細(xì)分界面如圖4所示。

圖4 客戶細(xì)分界面
在用戶設(shè)置好聚類的K值以及時間段之后,系統(tǒng)使用K-means聚類算法訓(xùn)練學(xué)習(xí)得出用戶細(xì)分結(jié)果。
基于大數(shù)據(jù)技術(shù)和數(shù)據(jù)挖掘技術(shù),研究和實現(xiàn)了電力客戶服務(wù)中心的用戶行為分析系統(tǒng)。該系統(tǒng)已投入實際運行,能夠根據(jù)短信、網(wǎng)站、手機APP、微信、有線電視等多元化服務(wù)渠道所產(chǎn)生的客戶服務(wù)數(shù)據(jù)進行用戶行為分析,包括用戶行為特征、客戶群體特性、服務(wù)渠道特征等。通過用戶行為分析,發(fā)現(xiàn)用戶行為規(guī)律,對企業(yè)和用戶都有重要意義。對企業(yè)來說,用戶行為分析可以發(fā)現(xiàn)用戶對服務(wù)渠道、業(yè)務(wù)的使用特征,幫助企業(yè)進行合理資源規(guī)劃,使得資源在最大限度滿足用戶需求的同時,降低運營成本;幫助企業(yè)了解用戶對服務(wù)渠道、業(yè)務(wù)的興趣所在,從而為企業(yè)制定個性化服務(wù)提供依據(jù)。對用戶來說,企業(yè)根據(jù)用戶行為進行了服務(wù)優(yōu)化,能夠更快更方便地使用網(wǎng)絡(luò)服務(wù)。
[1] 陳 超,張順仕,尚守衛(wèi),等.大數(shù)據(jù)背景下電力行業(yè)數(shù)據(jù)應(yīng)用研究[J].現(xiàn)代電子技術(shù),2013,36(24):8-11.
[2] 任思穎.基于大數(shù)據(jù)的網(wǎng)絡(luò)用戶行為分析[D].北京:北京郵電大學(xué),2015.
[3] 劉淑鑫.面向大數(shù)據(jù)的網(wǎng)絡(luò)用戶行為分析研究[D].上海:東華大學(xué),2015.
[4] 林嘉暉.基于數(shù)據(jù)挖掘的電網(wǎng)用戶行為分析系統(tǒng)的設(shè)計與實現(xiàn)[D].廣州:中山大學(xué),2013.
[5]ZhanJie,HuangJinxin,NiuLin,etal.Studyofthekeytechnologiesofelectricpowerbigdataanditsapplicationprospectsinsmartgrid[C]//Proceedingsof6thIEEEPESAsia-Pacificpowerandenergyengineeringconference.[s.l.]:IEEE,2014.
[6] 趙云山,劉煥煥.大數(shù)據(jù)技術(shù)在電力行業(yè)的應(yīng)用研究[J].電信科學(xué),2014,30(1):57-62.
[7] 盧建昌,樊圍國.大數(shù)據(jù)時代下數(shù)據(jù)挖掘技術(shù)在電力企業(yè)中的應(yīng)用[J].廣東電力,2014,27(9):88-94.
[8] 陶曉英.大數(shù)據(jù)支撐下的客戶服務(wù)應(yīng)用探索[J].信息通信技術(shù),2014,8(6):14-20.
[9]ZinTT,TinP,ToriuT,etal.Abigdataapplicationframeworkforconsumerbehavioranalysis[C]//2013IEEE2ndglobalconferenceonconsumerelectronics.[s.l.]:IEEE,2013:245-246.
[10]GuanJianfeng,YaoSu,XuChangqiao,etal.DesignandimplementationofnetworkuserbehaviorsanalysisbasedonHadoopforbigdata[J].CommunicationsinComputerandInformationScience,2014,490:44-55.
[11]AnkurB,NikitaM,SwadeshP,etal.Forecastingconsumerbehaviorwithinnovativevaluepropositionfororganizationsusingbigdataanalytics[C]//Proceedingsof4thIEEEinternationalconferenceoncomputationalintelligenceandcomputingresearch.[s.l.]:IEEE,2013:1-4.
[12]LiuHong.Discussiononthestatisticalanalysismethod[C]//7thinternationaljointconferenceoncomputationalsciencesandoptimization.[s.l.]:[s.n.],2014:383-385.
[13]KhandareA,AlviAS.Surveyofimprovedk-meansclusteringalgorithms:improvements,shortcomingsandscopeforfurtherenhancementandscalability[M]//Informationsystemsandintelligentapplication.[s.l.]:[s.n.],2016:495-503.
[14] 耿筱媛,張燕平,閆 屹.改進的K-means算法在電信客戶細(xì)分中的應(yīng)用[J].計算機技術(shù)與發(fā)展,2008,18(5):163-167.
Research and Implementation of User Behaviors Analysis of Electric Power Customer Service Center
CHEN Li-bing1,HE Rong1,QIU Lin1,WANG Ying1,SUN Tian-hao2
(1.Customer Service Center,State Grid Chongqing Electric Power Corporation,Chongqing 400017,China; 2.College of Computer,Chongqing University,Chongqing 400044,China)
At present,the electric power customer service center has already carried out the diversified service channels to provide customers with a full range of services,but the lack of depth mining and analysis for each channel.In view of this,the user behaviors analysis of electric power customer service center is conducted based on big data.An intelligent online monitoring and analysis system is set up for multiple power customer service channels.First it collects data using distributed multi thread,then makes online analysis of user behavior with multiple dimensions based on big data,including statistical analysis and cluster analysis.Statistical analysis contains service channel index,service function total indexes,service function single index,customer access time index,customer area distribution,etc..Cluster analysis usesK-meansclusteringtoanalyzeusersegmentationaccordingtoloyalty,frequencyandcontribution.Thesystemimplementedcangetthecustomerbehaviorcharacteristicsofeachchannel,providesupportforenterprisestofullygraspthevariousservicechannelsandhelptogivemoreintelligentandconvenientpersonalizedservice.
big data;power big data;data mining;user behavior analysis
2016-03-29
2016-08-03
時間:2017-01-10
國家自然科學(xué)基金資助項目(61472051);重慶市科技計劃項目(cstc2013kjrc-qnrc40003)
陳俐冰(1979-),女,經(jīng)濟師,研究方向為信息數(shù)據(jù)分析。
http://www.cnki.net/kcms/detail/61.1450.TP.20170110.0941.020.html
TP
A
1673-629X(2017)02-0116-04
10.3969/j.issn.1673-629X.2017.02.026