999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于熵權法與改進的PCA聚類算法的電力客戶價值分類與應用

2017-04-14 12:52:32皇甫漢聰肖招娣余永忠
現代電子技術 2017年7期
關鍵詞:數據挖掘

皇甫漢聰 肖招娣 余永忠

摘 要: 對電力客戶進行價值分析,有利于全面了解客戶,為電力客戶提供差異化服務。同時也可以提高客戶滿意度,實現供電企業、客戶雙贏的局面。運用數據挖掘方法對電力客戶價值分類,構建電力客戶價值評價指標體系,這些指標涵蓋客戶的用電行為、繳費行為、輿情和行業發展狀況等,運用熵權法計算指標的權重,提出一種改進的PCA聚類算法對電力客戶價值進行分類,為供電企業制定差異化服務策略提供輔助支撐。

關鍵詞: 電力客戶價值; 熵權法; 改進的PCA聚類算法; 數據挖掘

中圖分類號: TN911.1?34 文獻標識碼: A 文章編號: 1004?373X(2017)07?0183?04

Power consumer value classification and application based on entropy weight method

and improved PCA clustering algorithm

HUANGFU Hancong, XIAO Zhaodi, YU Yongzhong

(Foshan Power Supply Bureau, Guangdong Power Grid Co., Ltd., Foshan 528000, China)

Abstract: The analysis of the power consumer value helps the power enterprises to understand their consumers comprehensively, provides the differentiated services for power consumers, and can improve the consumer satisfaction to benefit both of the power supply enterprises and consumers. The data mining method is used to classify the power customer value, and construct the evaluation index system of the power consumer value. The indexes involve the consumer′s power consumption behavior, paying behavior, public feelings and industrial development status. The weights of the indexes are calculated with the entropy weight method. A new improved PCA clustering algorithm is proposed to classify the power consumer value, which provides the ancillary support for the power enterprises to formulate the differentiated services strategy.

Keywords: power consumer value; entropy weight method; improved PCA clustering algorithm; data mining

0 引 言

經濟的發展推動著我國電力事業的快速發展,隨著電力市場化步伐的加快,供電企業面臨著越來越激烈的競爭,電力客戶不再完全是被動接受者,客戶的作用越來越大,客戶價值的影響也越來越大。然而,電力客戶群體廣泛,不同客戶對于服務內容、方式、深度的需求存在巨大的差異。因此,供電企業迫切需要對客戶進行科學的分析,根據客戶的綜合價值對其進行分類,針對不同的客戶群體制定不同的營銷策略,為客戶提供精益化的服務。

迄今為止,客戶價值評價分析的主要方法有模糊層次分析法[1]、結合利益細分法和K?均值的混合方法[2]、結合熵權法與區間數概率分布的混合方法[3]、支持向量機法[4]等。在有些情況下這些算法能取得不錯的效果,然而依然存在一些不足之處,如模糊層次分析法包含較強的主觀因素,支持向量機法不能確定數據中哪些知識是冗余的,K?均值因隨機選取初始中心點會導致結果不穩定。

鑒于上述算法的不足,本文構建了電力客戶價值評價的指標體系。提出一種對電力客戶價值分類的新方法,即基于熵權法和改進的PCA聚類算法的混合方法,熵權法用于計算各個指標的權重,改進的PCA聚類算法用于電力客戶價值分類。

1 電力客戶價值評價指標體系

在遵循完整性、可比性、易獲取性、非重疊性等原則的基礎上,結合電力行業的現狀和客戶價值理論[5?6],從電力客戶的收入貢獻、風險性、成長性等三個方面選取了11個指標,這11個指標從不同角度反映電力客戶的價值,并初步構成了電力客戶價值評價指標體系,如表1所示,各指標計算說明見表2。

2 權重和聚類方法

2.1 權重的計算方法

權重的計算方法有專家評分法、層次分析法[7]、主成分分析法、熵權法等。專家評分法主觀性強;層次分析法具有多層次、多指標、定量定性相結合的特點,但它要求同層次指標間相互獨立以及跨層次指標間不具備支配關系[5]。主成分分析法是一種客觀性較強的方法,主要是依據指標數據的方差計算權重,不能真實反應指標對綜合評價的貢獻。鑒于以上方法的一些不足,本文采用熵權法計算指標權重,熵權法精度較高且客觀性較強,適用于任何需要確定權重的地方。

熵權法的計算方法如下:

步驟1:將各個指標的數據進行標準化處理。

假設給定了[k]個指標[X1,X2,…,Xk,]其中[Xi=x1,x2,…,xn]。假設對各指標數據標準化后的值為[Y1,Y2,…,Yk。]

步驟2:求各指標的信息熵。

計算各個指標的信息熵[Ej=-1lnni=1npijlnpij]。其中[pij=Yiji=1nYij,]如果[pij=0,]則定義[limpij→0pijlnpij=0]。

步驟3:確定各指標權重。

根據各指標的信息熵計算各指標的權重[Wi=1-Eik-Ei,i=1,2,…,k]。

2.2 聚類算法

聚類分析指的是根據不同數據對象之間的差異,將數據集合分組成為由類似的對象組成的多個類或簇的分析過程。聚類算法主要有層次聚類算法和劃分類的聚類算法等。層次聚類算法是將所有樣本點自底向上合并成一棵樹或者自頂向下分裂成一棵樹的過程,但是層次聚類算法有一個缺點就是一旦一個凝聚或是分割形成,這個操作永遠不會被改變了,且層次聚類算法計算復雜。劃分的聚類算法中最經典的是K?means聚類算法,計算簡單高效,但是,它對初始聚類中心敏感。此外,隨機選取初始聚類中心會導致聚類結果不穩定。因此,學者們提出了許多改進的聚類算法。

初始聚類中心算法[8]的實現過程如下:

步驟1:數據集[X]有[n]個數據對象,聚類的類數為[k],計算其中最小的數據對象[min(X)];

步驟2:計算[X]中所有數據對象到[min(X)]的距離[Dis1,Dis2,…,Dis n,]根據此距離升序排列所有數據對象;

步驟3:將第[1+(i-1)(n-2)(k-1),i=1,2,…,k]項數據對象設為對應類的初始成員;

步驟4:對尚未分配的數據對象,計算其與每個類中初始成員的距離,同時將數據對象歸入到距離最小的類中;

步驟5:計算每個類中所有數據對象的平均值,即為初始中心點。

上述初始聚類中心算法避免了隨機的步驟,使得聚類結果更加可靠,同時計算得出的初始聚類中心點分布均勻,更能代表原始數據的整體分布,可適當的減少迭代次數。結合改進的初始聚類中心算法和K?means的思想,得出了改進的K?means聚類算法,記為算法1,該算法的實現步驟如下:

步驟1:應用初始聚類中心算法選取[K]個初始聚類中心。

步驟2:計算所有數據對象與聚類中心的距離,同時將數據對象分配到最近的類中。

步驟3:重新計算每個聚類中所有數據對象的平均值,作為新的聚類中心。

步驟4:循環步驟2,步驟3,直到前后兩次迭代得到的每個聚類中心點相同為止。

雖然改進的K?means聚類算法具有計算簡單、高效,聚類結果穩定等優點,但是處理大規模高維度數據時相似度(距離)的計算需要耗費大量的時間,結合主成分分析[9]即PCA的思想與算法1,本文提出了改進的PCA聚類算法,算法步驟如下:

步驟1:設原始數據矩陣為[X∈Rn×d;]

步驟2:令[B∈Rd×d,]且[B=XX;]

步驟3:計算矩陣[B]的特征值和特征向量,并取出最大特征值對應的特征向量[V;]

步驟4:令[C=X?V,]則[C∈Rn×1;]

步驟5:應用算法1對1維列向量[C]進行聚類,然后再對應到原始數據,得出原始數據的聚類結果,即原始數據對象[Xi]被劃分到第[j]類中,當且僅當向量[C]的第[i]行被劃分到第[j]類。

該算法既具有PCA主成分分析降維的特點, 又避免了K?means算法聚類結果不穩定的缺點, 同時又具有K?means算法的高效性與簡潔性等優點, 因此該算法適合處理大規模高維度數據。

3 模型應用

為了說明本文所提出的改進PCA聚類算法的可行性,抽取了一些電力客戶的樣本數據,應用Matlab R2012b軟件對其編程。

為確保樣本選取的公平性,首先需保證指標體系中的各個指標都要對應選取一定量的樣本,其次,隨機抽取樣本。根據此樣本數據選取方法抽取8個樣本客戶,分別記為客戶1、客戶2、…、客戶8,客戶指標數據如表3所示。

指標數據標準化處理說明:

(1) 指標[X1,X2,X3,X7]屬于高優指標,即指標的值越大越好,這兩個指標標準化處理的方法為:

[(原值-最小值)(最大值-最小值)×100] (1)

(2) 除去上述4個指標之外,其他指標均屬于低優指標,即指標的值越小越好,這些指標標準化處理的方法為:

[(最大值-原值)(最大值-最小值)×100] (2)

根據2.1節中權重的計算方法,得出各指標的權重如表4所示。對客戶指標數據標準化處理,結合表4中的各個指標的權重,加權求和得出每個客戶的綜合得分,應用改進的PCA聚類算法對客戶進行分類,如表5所示。根據綜合得分和改進的PCA聚類算法的分類結果可知本文所提算法的可行性。

為了說明改進的PCA聚類算法的有效性,在相同數據集的情況下,把它同算法1進行比較。其中改進的PCA聚類算法的運行時間是0.010 158 s,算法1的運行時間是0.022 612 s,改進的PCA聚類算法在運行效率上要優于算法1,運行結果相同。

4 結 論

電力客戶綜合價值評價體系的建立為供電企業制定營銷策略提供依據,是客戶關系管理的基礎。首先,結合客戶價值理論和電力行業的特殊性建立電力客戶價值評價指標體系,指標體系涵蓋客戶用電行為、繳費行為、輿情和行業發展動態;其次,提出了一種行之有效的對電力客戶價值評價的混合方法,即結合熵權法和改進的PCA聚類算法,該算法能夠根據數據自身的特征計算各指標的權重并科學的確定分類標準。熵權法是一種精度較高,客觀性較強的計算權重的方法。改進的PCA聚類算法既具有主成分分析降維的優點,同時避免了因隨機選取初始中心點導致的聚類結果不穩定這一缺陷,也具有K?means聚類算法簡潔高效等優點,因此該算法適合處理大規模高維度數據;最后,通過實例驗證了該方法的有效性,且該技術在某供電企業得到了深入應用,并取得了良好效果。

參考文獻

[1] 王松濤.市場條件下的電力客戶價值分析體系[J].電網技術,2010,34(2):155?158.

[2] 曾鳴,楊素萍,楊鵬舉,等.社會節能環境下電力客戶價值評估研究[J].華東電力,2008,36(6):15?19.

[3] 李金超,李金穎,牛東曉,等.考慮區間數概率分布的電力客戶價值綜合評價[J].華北電力大學學報,2005,32(4):56?58.

[4] 李俊飛.集成粗糙集和支持向量機的電力客戶價值評價[D].保定:華北電力大學,2007.

[5] 趙曉波.供電企業大客戶管理的研究[D].南京:南京理工大學,2005.

[6] 靳方明.基于客戶價值分析的電力客戶服務管理研究[D].北京:華北電力大學,2007.

[7] 沈利香,曹國.基于網絡層次分析法的商業銀行網絡安全評估模型[J].計算機應用,2012,32(2):480?484.

[8] 董騏瑞. K?均值聚類算法的改進與實現[D].吉林:吉林大學,2015.

[9] 劉倩.基于主成分聚類分析的中小企業成長性研究[J].企業管理,2011,16(4):186?188.

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 91免费观看视频| 国产00高中生在线播放| 国产精品自在在线午夜| 欧美天堂久久| 成人av专区精品无码国产| 久久一日本道色综合久久| 久久中文电影| 欧美高清日韩| 国产亚洲高清视频| 亚洲视屏在线观看| 亚洲三级色| 麻豆a级片| 激情国产精品一区| 亚洲成A人V欧美综合天堂| 国产精品欧美在线观看| 国产极品美女在线| 在线精品欧美日韩| 男女性色大片免费网站| 成人福利在线观看| 成人午夜天| 国产女人爽到高潮的免费视频 | 一区二区三区国产| 色噜噜综合网| 亚洲全网成人资源在线观看| 四虎成人精品在永久免费| 免费 国产 无码久久久| 四虎国产在线观看| 欧美特黄一级大黄录像| 亚洲成人www| 国产午夜一级毛片| 国产你懂得| 亚洲无码高清一区| 99久久精品无码专区免费| 91视频首页| 97青草最新免费精品视频| 91无码人妻精品一区二区蜜桃| 成人欧美在线观看| 好吊妞欧美视频免费| 国产精品永久久久久| 456亚洲人成高清在线| 亚洲欧美综合精品久久成人网| 国产精品一区在线观看你懂的| 92午夜福利影院一区二区三区| 亚洲成在人线av品善网好看| 孕妇高潮太爽了在线观看免费| 国产免费自拍视频| 国产精品免费久久久久影院无码| 九色免费视频| 国产精品对白刺激| 精品人妻AV区| 在线国产91| 波多野结衣无码视频在线观看| 婷婷综合在线观看丁香| a毛片在线| 久久精品国产精品青草app| 波多野结衣在线se| 国产另类视频| 亚洲欧美日韩中文字幕在线| 亚洲天堂免费在线视频| 国产真实乱子伦精品视手机观看 | 国产亚卅精品无码| 精品欧美一区二区三区在线| 色精品视频| 人妻中文久热无码丝袜| 国产精品女在线观看| 特级做a爰片毛片免费69| 91丝袜在线观看| 91精品国产福利| 国产无码网站在线观看| 毛片在线播放网址| 欧美成人免费一区在线播放| 日韩 欧美 国产 精品 综合| 九九香蕉视频| 免费观看无遮挡www的小视频| 色综合成人| 免费看的一级毛片| 国产精品亚洲αv天堂无码| 久久久国产精品无码专区| 亚洲综合18p| 超碰免费91| 国产AV无码专区亚洲精品网站| 久久精品无码国产一区二区三区|