999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

聯(lián)合RF-BP-LR的電力客戶電費(fèi)拖欠混合風(fēng)險(xiǎn)預(yù)警算法

2022-06-18 02:14:34謝祿江皮羽茜
關(guān)鍵詞:特征提取用戶模型

謝祿江,蔣 榮,皮羽茜,何 軼,廖 勇

(1.國(guó)網(wǎng)重慶市電力公司信息通信分公司, 重慶 401120;2.重慶大學(xué) 微電子與通信工程學(xué)院, 重慶 400044)

0 引言

我國(guó)對(duì)于電力能源的需求隨著經(jīng)濟(jì)的發(fā)展在不斷提高,電力行業(yè)已經(jīng)成為我國(guó)經(jīng)濟(jì)發(fā)展的重要組成部分。據(jù)統(tǒng)計(jì),2020年我國(guó)的總用電量達(dá)到75 110億千瓦時(shí),同比增長(zhǎng)了3.1%,用電水平已經(jīng)接近中等發(fā)達(dá)國(guó)家水平。全社會(huì)用電群體不斷壯大,促進(jìn)了全國(guó)總用電量的提高,同時(shí)加速了電力企業(yè)的發(fā)展,但也給供電企業(yè)帶來(lái)了許多問(wèn)題和隱患。目前,我國(guó)絕大多數(shù)電力公司采用的是“客戶先用電,再向電力公司繳費(fèi)”的經(jīng)營(yíng)模式[1],由于不能準(zhǔn)確獲取用電客戶的信用水平,造成了部分誠(chéng)信水平低的客戶長(zhǎng)期拖欠電費(fèi),嚴(yán)重影響了電費(fèi)的順利回收。若拖欠電費(fèi)用戶的總用電量占比較高,會(huì)破壞電力市場(chǎng)的正常交易秩序并給電力公司帶來(lái)巨大損失[2-3]。故而對(duì)用戶進(jìn)行電費(fèi)欠繳或拖繳風(fēng)險(xiǎn)分析和預(yù)警對(duì)于供電企業(yè)來(lái)說(shuō)是一個(gè)亟需解決的問(wèn)題。

針對(duì)上述問(wèn)題,相關(guān)研究人員在對(duì)影響用戶信用等級(jí)的特征提取、電費(fèi)回收預(yù)警以及信用評(píng)估上已經(jīng)展開了大量研究。De等[4]利用直覺模糊集理論的特點(diǎn),在不確定的環(huán)境下,提出了基于直覺模糊層次分析法的信用風(fēng)險(xiǎn)評(píng)估模型。Wu等[5]提出了一種基于梯度學(xué)習(xí)決策樹-隨機(jī)森林-自適應(yīng)邏輯回歸的集成學(xué)習(xí)方法,構(gòu)建了電費(fèi)回收風(fēng)險(xiǎn)預(yù)測(cè)模型。為了有效評(píng)估信用,Chen等[6]構(gòu)建了個(gè)人信用評(píng)估模型,使用反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)進(jìn)行權(quán)重調(diào)整,準(zhǔn)確性和收斂速度上具有明顯的優(yōu)勢(shì)。為了評(píng)估異常用電和逾期收費(fèi)的風(fēng)險(xiǎn),Hu等[7]提出了一種基于多屬性群決策的考慮付費(fèi)和異常用電的用戶欠費(fèi)風(fēng)險(xiǎn)評(píng)估方法,首先確定包括用戶付費(fèi)和異常用電的評(píng)估指標(biāo)體系,采用熵權(quán)法確定指標(biāo)權(quán)重,然后根據(jù)最差指標(biāo)對(duì)評(píng)價(jià)結(jié)果進(jìn)行排序,并提供用戶的風(fēng)險(xiǎn)等級(jí)。

為進(jìn)一步提高電力行業(yè)欠費(fèi)風(fēng)險(xiǎn)管理能力,有效輔助電力企業(yè)制定用電和電費(fèi)預(yù)警策略,提出了RBL混合風(fēng)險(xiǎn)預(yù)警算法,提高了預(yù)測(cè)精度,對(duì)欠費(fèi)風(fēng)險(xiǎn)用電客戶達(dá)到預(yù)警目的,主要貢獻(xiàn)如下:

1) 針對(duì)大量的電力客戶數(shù)據(jù)集,有價(jià)值的信息很少的問(wèn)題,首先利用隨機(jī)森林(random forest,RF)算法對(duì)電力客戶多維用戶信息進(jìn)行特征提取;其次,利用BP神經(jīng)網(wǎng)絡(luò)對(duì)客戶信用進(jìn)行初次風(fēng)險(xiǎn)預(yù)測(cè)并得出相關(guān)的信用得分值;最后,利用邏輯回歸(logistic regression,LR)模型進(jìn)行第二次預(yù)測(cè),以此來(lái)提高整個(gè)預(yù)警模型的預(yù)測(cè)精度。

2) 根據(jù)欠費(fèi)用戶風(fēng)險(xiǎn)預(yù)測(cè)結(jié)果,本文特別地為電力企業(yè)建立了用電客戶信用等級(jí)評(píng)價(jià)制度,對(duì)不同信用等級(jí)的用電客戶制定了不同的預(yù)警策略、提供了針對(duì)不同信用等級(jí)用電客戶可采取的相應(yīng)措施,可用于電費(fèi)回收管理人員進(jìn)行提前催繳,確保電費(fèi)回收的及時(shí)性。

1 特征提取以及數(shù)據(jù)預(yù)處理

1.1 問(wèn)題描述及說(shuō)明

對(duì)電力客戶電費(fèi)拖欠風(fēng)險(xiǎn)進(jìn)行預(yù)警分析是一個(gè)多層次、全方位的問(wèn)題。首先需要根據(jù)用電客戶已有的數(shù)據(jù)提取出電費(fèi)拖欠的主要影響因素,并對(duì)其進(jìn)行標(biāo)準(zhǔn)化處理。用電客戶的數(shù)據(jù)集中包含大量數(shù)據(jù),如客戶身份地址信息、歷史用電情況及信用情況等,為了降低模型的識(shí)別難度,首先使用RF算法篩選出用戶電費(fèi)拖繳的主要影響指標(biāo)。同時(shí),針對(duì)多源數(shù)據(jù)結(jié)構(gòu)不同且可能存在缺失或錯(cuò)漏的現(xiàn)象,還需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,得到可供模型輸入的正常數(shù)據(jù)。

1.2 特征提取

RF是一種基于Bagging的集成分類器[8],在數(shù)據(jù)挖掘、分類篩選和預(yù)測(cè)等領(lǐng)域取得了突破性成果。RF分類器由多個(gè)樹分類器組成,其中每個(gè)分類器使用由輸入向量中獨(dú)立取樣的隨機(jī)向量生成,每棵樹對(duì)分類預(yù)測(cè)結(jié)果進(jìn)行投票,以對(duì)輸入向量進(jìn)行分類。其中,RF分類器由N棵樹組成,其中N是待生長(zhǎng)的樹的數(shù)量,可以是用戶定義的任何值。為了對(duì)新數(shù)據(jù)集進(jìn)行分類,數(shù)據(jù)集的每一種情況都被傳遞到N棵樹中,在這種情況下,森林選擇N個(gè)擁有投票數(shù)最多的類。在訓(xùn)練過(guò)程中,大約三分之二的樣本(稱為袋內(nèi)樣本)被用于訓(xùn)練決策樹,剩下的三分之一(稱為袋外樣本)用于內(nèi)部交叉驗(yàn)證,以估計(jì)最終得到的RF模型的整體性能[9],這個(gè)誤差估計(jì)被稱為袋外誤差。RF分類器使用Gini指數(shù)作為屬性選擇度量,該值常用于度量數(shù)據(jù)在該類的純度。對(duì)于給定的訓(xùn)練集T,隨機(jī)選取一個(gè)屬性,稱其屬于某類Ci,其Gini指數(shù)可表示為式(1)。

(1)

其中,f(Ci,T)/|T|表示選擇的屬性屬于該類Ci的概率值。每次在新的訓(xùn)練數(shù)據(jù)上使用特征組合將樹生長(zhǎng)到最大深度,這些成熟的樹沒(méi)有修剪。這是RF分類器相對(duì)于其他決策樹方法的主要優(yōu)勢(shì)之一。隨著樹的數(shù)量增加,即使不修剪樹,泛化誤差也總是收斂的,每個(gè)節(jié)點(diǎn)用來(lái)生成RF分類器所需的2個(gè)參數(shù),即樹的特征數(shù)和要生長(zhǎng)的樹的數(shù)量,它們由用戶自定義。在每個(gè)節(jié)點(diǎn)上,只有選定的特征才會(huì)被搜索到最佳分割。為了對(duì)新數(shù)據(jù)集進(jìn)行分類,數(shù)據(jù)集的每一種情況都被傳遞到N棵樹中,在這種情況下,森林選擇N個(gè)投票中擁有投票最多的類。給定樣本的數(shù)據(jù)集合D,產(chǎn)生nTree棵決策樹組合形成RF,RF形成過(guò)程[10]如圖l所示。

圖1 RF形成過(guò)程示意圖

綜合以上優(yōu)點(diǎn),利用RF算法對(duì)原始用戶數(shù)據(jù)信息開展影響電費(fèi)拖欠風(fēng)險(xiǎn)行為特征提取,從眾多用電客戶電費(fèi)拖欠的影響指標(biāo)中篩選出主要影響指標(biāo),提取過(guò)程如圖2所示。

圖2 特征提取過(guò)程框圖

1.3 數(shù)據(jù)預(yù)處理

前期數(shù)據(jù)的處理與否會(huì)直接影響到模型訓(xùn)練的準(zhǔn)確性。在用戶數(shù)據(jù)記錄過(guò)程中,由于人為因素、設(shè)備因素等影響,可能會(huì)造成供電企業(yè)對(duì)用戶記錄的數(shù)據(jù)不完整、錯(cuò)誤的情況,因此在對(duì)數(shù)據(jù)進(jìn)行提取之前需要對(duì)數(shù)據(jù)進(jìn)行篩選并進(jìn)行相應(yīng)的處理,常見處理過(guò)程主要包括去掉冗余數(shù)據(jù)、對(duì)異常值的處理、合并數(shù)據(jù)等。

數(shù)據(jù)處理主要針對(duì)的是對(duì)原始數(shù)據(jù)中的缺失值進(jìn)行填寫、去除噪聲數(shù)據(jù)等問(wèn)題,例如:某些用戶若干特征值缺失,如為空值時(shí),對(duì)于缺失值采用全部填充0的方法;出現(xiàn)明顯異常,如用電量為負(fù)數(shù)時(shí),直接刪除包含異常值的記錄。對(duì)初始數(shù)據(jù)進(jìn)行異常或噪聲去除處理后,才能得到可供算法輸入的有意義的干凈的數(shù)據(jù),保證整個(gè)算法的準(zhǔn)確性。

由于各個(gè)指標(biāo)的取值范圍不一、區(qū)別太大,同時(shí)指標(biāo)之間又存在不同的數(shù)量級(jí),如果不加處理,那么在BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練的時(shí)候,會(huì)導(dǎo)致網(wǎng)絡(luò)訓(xùn)練時(shí)間過(guò)長(zhǎng),而且大量級(jí)數(shù)據(jù)會(huì)覆蓋小量級(jí)數(shù)據(jù)提供的信息,從而會(huì)導(dǎo)致網(wǎng)絡(luò)訓(xùn)練失敗。因此應(yīng)對(duì)用戶的樣本數(shù)據(jù)進(jìn)行預(yù)處理,本文采用的數(shù)據(jù)處理方法為歸一化數(shù)據(jù)處理。數(shù)據(jù)歸一化方法為:

(2)

其中,s表示原始數(shù)據(jù)值;s*表示處理后的數(shù)據(jù);μ表示訓(xùn)練數(shù)據(jù)的均值;σ表示訓(xùn)練數(shù)據(jù)的標(biāo)準(zhǔn)差。使得歸一化處理后的用戶數(shù)據(jù)服從均值為0、標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)正態(tài)分布。

2 RBL電費(fèi)拖欠混合風(fēng)險(xiǎn)預(yù)測(cè)模型

為準(zhǔn)確預(yù)測(cè)用戶電費(fèi)拖欠風(fēng)險(xiǎn),提出一種聯(lián)合RF-BP-LR的混合預(yù)測(cè)算法,簡(jiǎn)稱RBL。BP神經(jīng)網(wǎng)絡(luò)首先將RF篩選出的主要特征作為輸入,通過(guò)網(wǎng)絡(luò)訓(xùn)練得出該用戶的電費(fèi)繳納信用得分值,然后將信用得分值和主要影響因素作為L(zhǎng)R的解釋變量建立一個(gè)LR的線性模型,以此對(duì)該用戶的電費(fèi)拖欠風(fēng)險(xiǎn)進(jìn)行全方面預(yù)測(cè)。

2.1 用電客戶信用評(píng)分網(wǎng)絡(luò)模型

用戶電費(fèi)繳納信用評(píng)分模型采用輸入層、隱含層和輸出層三層結(jié)構(gòu)的BP神經(jīng)網(wǎng)絡(luò)。由RF篩選出的影響因素的數(shù)量可以確定神經(jīng)網(wǎng)絡(luò)的輸入神經(jīng)元個(gè)數(shù)。模型輸出結(jié)果是用戶的用電行為信用等級(jí)得分,因此可以確定輸出神經(jīng)元的個(gè)數(shù)為1。在模型訓(xùn)練過(guò)程中根據(jù)預(yù)測(cè)結(jié)果的好壞來(lái)對(duì)隱含層個(gè)數(shù)進(jìn)行調(diào)整,經(jīng)過(guò)驗(yàn)證,最終得到整個(gè)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)示意圖如圖3所示。

圖3 用戶電費(fèi)繳納信用評(píng)分的神經(jīng)網(wǎng)絡(luò)模型

BP神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)流程如下:

步驟3BP神經(jīng)網(wǎng)絡(luò)使用反向傳播法來(lái)更新網(wǎng)絡(luò)的權(quán)重,而反向傳播法主要依賴于梯度下降法。其一般計(jì)算流程如下:

1) 輸出層的更新

權(quán)重梯度可以表示為

(3)

(4)

更新:

wjk←wjk-η*hj(1-hj)ek

bk←bk-η*ek

(5)

2) 隱含層的梯度

隱含層梯度計(jì)算需要根據(jù)鏈?zhǔn)椒▌t,由于激活函數(shù)為sigmoid函數(shù),有

(6)

于是更新權(quán)值:

(7)

重復(fù)步驟3,直到損失值小于閾值t為止。

對(duì)用電客戶進(jìn)行風(fēng)險(xiǎn)預(yù)測(cè)是一個(gè)全方位的復(fù)雜的問(wèn)題,通過(guò)以上推導(dǎo)可知,BP神經(jīng)網(wǎng)絡(luò)對(duì)輸入無(wú)嚴(yán)格限制,并且能處理輸入輸出之間的非線性關(guān)系,同時(shí)誤差經(jīng)過(guò)不斷的反向傳播,參數(shù)會(huì)不斷更新,使BP神經(jīng)網(wǎng)絡(luò)能推斷數(shù)據(jù)之間的隱藏關(guān)系,從而使模型能準(zhǔn)確預(yù)測(cè)未知數(shù)據(jù),因此本文利用BP神經(jīng)網(wǎng)絡(luò)對(duì)用戶電費(fèi)繳納行為進(jìn)行第一階段的信用得分預(yù)測(cè)。

8) 電力客戶風(fēng)險(xiǎn)評(píng)價(jià)LR模型

LR是一種非線性的多元統(tǒng)計(jì)分析概率模型,該模型能解決多變量控制的結(jié)果為二分類的問(wèn)題,被廣泛地運(yùn)用于風(fēng)險(xiǎn)預(yù)測(cè)建模分析[11]。從用電客戶特征屬性分析可知,影響電力客戶欠費(fèi)行為有多種因素,并同時(shí)影響了電力客戶的信用等級(jí)。在此問(wèn)題中,本文將各種影響因素作為自變量,將用戶的信用等級(jí)作為因變量,從而使用LR模型對(duì)其信用等級(jí)進(jìn)行預(yù)測(cè)。LR模型的表達(dá)式如下:

(8)

其中,P(Y=1|X=x)表示用戶電費(fèi)欠繳的概率;X∈Rn代表輸入向量,其中特征數(shù)為n;w∈Rn為權(quán)重向量參數(shù);b為偏置參數(shù)。

一般采用最大似然法計(jì)算LR的參數(shù),計(jì)算過(guò)程中記P(Y=1|X=x)=π(x)為用戶電費(fèi)拖欠概率,由此計(jì)算出電費(fèi)不拖欠概率為P(Y=0|X=x)=1-π(x),則相應(yīng)的似然函數(shù)和對(duì)數(shù)似然函數(shù)分別為:

(9)

(10)

2.3 混合風(fēng)險(xiǎn)預(yù)警模型

根據(jù)上文對(duì)用戶電費(fèi)繳納信用評(píng)分BP神經(jīng)網(wǎng)絡(luò)模型和LR模型的描述,二者均可用于數(shù)據(jù)預(yù)測(cè)領(lǐng)域,但僅僅使用其中一種模型進(jìn)行預(yù)測(cè),其得到的預(yù)測(cè)結(jié)果達(dá)不到預(yù)期效果[13]。因此為了更好的對(duì)用戶電費(fèi)繳納信用進(jìn)行評(píng)價(jià),提高風(fēng)險(xiǎn)預(yù)測(cè)的精確度,本文使用RF進(jìn)行初次特征提取后,建立基于RF的BP-LR混合預(yù)測(cè)模型,以此來(lái)對(duì)用戶的電費(fèi)拖欠風(fēng)險(xiǎn)進(jìn)行預(yù)測(cè),整個(gè)模型的結(jié)構(gòu)如圖4所示。

圖4 基于RBL的電力用戶欠費(fèi)風(fēng)險(xiǎn)混合預(yù)測(cè)模型示意圖

圖4所示的混合預(yù)測(cè)模型,由RF特征提取模塊、BP神經(jīng)網(wǎng)絡(luò)模塊和LR模塊組成,該網(wǎng)絡(luò)模型包含特征提取、初次預(yù)測(cè)和二次預(yù)測(cè)三部分。使用RF對(duì)用戶電費(fèi)拖欠的眾多影響指標(biāo)中進(jìn)行特征提取,篩選出主要影響指標(biāo)后,將數(shù)據(jù)輸入BP神經(jīng)網(wǎng)絡(luò)中訓(xùn)練,得到用戶信用評(píng)分,最終通過(guò)LR模型預(yù)測(cè)出用戶電費(fèi)拖欠風(fēng)險(xiǎn)等級(jí)。

(11)

P(y|x;θ)=(hθ(x))y(1-hθ(x))1-y

(12)

似然函數(shù)表示為:

其中,y(i)表示第i個(gè)樣本的類別;x(j)表示第j個(gè)樣本;c為每個(gè)用戶的數(shù)據(jù)樣本總數(shù)。通常對(duì)式(13)進(jìn)行對(duì)數(shù)變換可以得到:

(1-y(i))log(1-h(x(i)))

(14)

對(duì)l(θ)求偏導(dǎo)可以得到:

(15)

因此,LR模型的參數(shù)迭代公式為:

(16)

在取定了學(xué)習(xí)率α,并用迭代算法迭代收斂之后,可以得到LR模型的參數(shù)值θT,由此可以得到用電客戶欠費(fèi)風(fēng)險(xiǎn)的LR預(yù)測(cè)模型。

3 實(shí)驗(yàn)分析

用戶電費(fèi)欠繳風(fēng)險(xiǎn)預(yù)警主要是利用用戶用電的基本情況以及歷史繳費(fèi)欠費(fèi)行為充當(dāng)數(shù)據(jù)集,基于此類信息來(lái)構(gòu)建電力用戶的欠費(fèi)風(fēng)險(xiǎn)預(yù)警模型并進(jìn)行訓(xùn)練,最終對(duì)各用戶的欠費(fèi)行為進(jìn)行評(píng)估分類,得到高風(fēng)險(xiǎn)欠費(fèi)用戶信息,并針對(duì)此類用戶采取響應(yīng)措施以降低其電費(fèi)欠繳或拖繳的風(fēng)險(xiǎn)。

3.1 數(shù)據(jù)集及模型訓(xùn)練

以某地區(qū)電力公司全部用戶為樣本集,基于2020年1月至2020年12月數(shù)據(jù)作為基礎(chǔ)數(shù)據(jù),2021年1月至3月是否拖欠電費(fèi)為目標(biāo)數(shù)據(jù),進(jìn)行模型訓(xùn)練。用戶行為主要數(shù)據(jù)特征包括以下:

1) 基本信息:用戶序號(hào)、行業(yè)分類、供電單位、電費(fèi)計(jì)算方式、定價(jià)策略、開戶時(shí)間、供電狀態(tài)、合同信息、抄表周期、用戶所在地址等;

2) 用電行為:用戶違約次數(shù)、用戶用電趨勢(shì)、電費(fèi)欠繳或拖繳次數(shù)和具體金額、欠費(fèi)間隔、用電的類別、電費(fèi)所處分類、催繳電費(fèi)通知方式等;

3) 繳費(fèi)行為:近1年繳費(fèi)時(shí)間、繳費(fèi)方式、繳費(fèi)方式變更次數(shù)、繳費(fèi)金額等。

對(duì)原始用戶樣本屬性數(shù)據(jù)進(jìn)行預(yù)處理后,使用RF法進(jìn)行初次特征提取,計(jì)算特征提取后的用戶屬性特征與目標(biāo)類別(是否欠繳或拖繳電費(fèi))的信息值,并進(jìn)行降序排序,信息值(IV)用來(lái)衡量屬性I和目標(biāo)類別屬性J(J為二元屬性)之間相關(guān)性的指標(biāo),如表1所示,信息值的計(jì)算方式如下:

(17)

表1 特征選擇中每個(gè)屬性變量的信息值

一般當(dāng)IV≥0.3時(shí),說(shuō)明該特征屬性具有良好的預(yù)測(cè)能力,故將用戶違約次數(shù)、用戶用電趨勢(shì)等屬性選入模型中,將供電單位、定價(jià)策略等相關(guān)性不明顯的屬性剔除。

將經(jīng)過(guò)特征提取后的數(shù)據(jù)集按照隨機(jī)方式分成訓(xùn)練集和驗(yàn)證集,訓(xùn)練集和驗(yàn)證集比例為7∶3,BP神經(jīng)網(wǎng)絡(luò)參數(shù)設(shè)置[14]見表2。

表2 BP神經(jīng)網(wǎng)絡(luò)參數(shù)設(shè)置

LR模型的參數(shù)設(shè)置如表3所示。

對(duì)模型進(jìn)行初始化后,開始訓(xùn)練模型。此次實(shí)驗(yàn)所使用的硬件設(shè)備為圖靈(turing)架構(gòu)的GeForce RTX 2080TI GPU;Intel Xeon E5-2630 V4 CPU;64GB RAM;使用Windows 10操作系統(tǒng),在Python平臺(tái)上的Pytorch深度學(xué)習(xí)框架完成整個(gè)訓(xùn)練過(guò)程。

表3 LR模型的參數(shù)設(shè)置

3.2 實(shí)驗(yàn)結(jié)果與分析

本文將預(yù)測(cè)精度作為各對(duì)比算法的評(píng)估指標(biāo)[15],預(yù)測(cè)精度是指預(yù)測(cè)為風(fēng)險(xiǎn)用戶中真正的風(fēng)險(xiǎn)用戶的比例。訓(xùn)練過(guò)程中,本文所建立模型的預(yù)測(cè)精度以及損失值的變化曲線如圖5、6所示。

圖5 不同模型迭代次數(shù)與預(yù)測(cè)精確度變化曲線

圖6 不同模型迭代次數(shù)與損失值變化曲線

從圖5、6中可以看出,當(dāng)模型的迭代次數(shù)增加的同時(shí),模型的預(yù)測(cè)精度在不斷提高,并且損失值在不斷降低。在迭代次數(shù)達(dá)到2 000次左右時(shí),本文所建立的混合模型的預(yù)測(cè)精度和損失值在逐漸趨于平穩(wěn),而BP神經(jīng)網(wǎng)絡(luò)和LR模型在迭代次數(shù)為2 500次后才開始達(dá)到平穩(wěn),這是因?yàn)楸疚乃岬幕旌项A(yù)測(cè)模型,在數(shù)據(jù)輸入BP神經(jīng)網(wǎng)絡(luò)模型前使用了RF進(jìn)行了初次特征提取,使得模型更快收斂。在預(yù)測(cè)精度上與單個(gè)模型的結(jié)果進(jìn)行了對(duì)比,從圖5和圖6可以看出相比于單一的BP神經(jīng)網(wǎng)絡(luò)和LR模型,本文所提的混合預(yù)測(cè)模型的預(yù)測(cè)精度更高,損失值更低。同時(shí)對(duì)比了使用決策樹模型和深度信念網(wǎng)絡(luò)的預(yù)測(cè)精度,不同模型的預(yù)測(cè)精度如表4所示。

從表4中可以看出,本文所提混合模型的預(yù)測(cè)精度可以達(dá)到92.83%,由于混合模型首先使用RF進(jìn)行了一次特征提取,使用BP神經(jīng)網(wǎng)絡(luò)和LR模型進(jìn)行初次和二次預(yù)測(cè),預(yù)測(cè)精度相比單獨(dú)使用BP神經(jīng)網(wǎng)絡(luò)或LR模型分別提高了2.73%和7.7%,相比決策樹模型提高了6.56%,同時(shí)還對(duì)比了深度信念網(wǎng)絡(luò)的預(yù)測(cè)精度,相比下本文混合模型具有2.34%的精度提升。總體上來(lái)看,使用本文所提的混合模型對(duì)用電客戶電費(fèi)拖欠風(fēng)險(xiǎn)的預(yù)測(cè)精度更高,收斂速度更快。

表4 不同模型的預(yù)測(cè)精度

基于所提的電力客戶欠費(fèi)混合風(fēng)險(xiǎn)預(yù)警算法風(fēng)險(xiǎn)預(yù)測(cè)混淆矩陣元素如表5所示。混淆矩陣的橫坐標(biāo)為原用電欠費(fèi)風(fēng)險(xiǎn)客戶,縱坐標(biāo)為預(yù)測(cè)出來(lái)的用電欠費(fèi)風(fēng)險(xiǎn)客戶,可以看出大部分電費(fèi)欠繳或拖繳風(fēng)險(xiǎn)客戶被預(yù)測(cè)出來(lái)了。同時(shí)在矩陣的上三角位置上不為0的數(shù)值為被偏小預(yù)測(cè)的電費(fèi)欠繳或拖繳風(fēng)險(xiǎn)客戶,需要對(duì)這部分客戶加大審查力度,確定是否有電費(fèi)欠繳或拖繳行為,用以電費(fèi)欠繳或拖繳風(fēng)險(xiǎn)預(yù)警。

表5 混合模型性能評(píng)價(jià)混淆矩陣元素

根據(jù)預(yù)測(cè)結(jié)果,可以建立用電客戶信用等級(jí)評(píng)價(jià)制度,對(duì)不同信用等級(jí)的用電客戶及時(shí)預(yù)警,同時(shí)采取不同的措施:

1) 對(duì)于高風(fēng)險(xiǎn)用戶,應(yīng)當(dāng)優(yōu)化電卡表系統(tǒng)以及多應(yīng)用一些遠(yuǎn)程集抄控制設(shè)備,爭(zhēng)取做到優(yōu)先抄表,同時(shí)必須嚴(yán)格核實(shí)用戶的基本信息,最好做到將先用電后繳費(fèi)模式轉(zhuǎn)變成先繳費(fèi)后用電的模式,嚴(yán)格實(shí)現(xiàn)交多少費(fèi)用多少度電。

2) 對(duì)于中風(fēng)險(xiǎn)用戶,豐富電費(fèi)欠費(fèi)的通知途徑,比如除了派送電量電費(fèi)通知單,還盡量做到直接當(dāng)面通知用戶,多和此類用戶交流,一旦發(fā)現(xiàn)有欠費(fèi)行為能做到及時(shí)提醒。

3) 對(duì)于低風(fēng)險(xiǎn)用戶,此類用戶信譽(yù)較高,因此平時(shí)只要維護(hù)好電費(fèi)管控系統(tǒng),建立科學(xué)完善的內(nèi)部信息系統(tǒng),必要時(shí)候可以通過(guò)電話等方式通知用戶繳費(fèi),并豐富用電客戶的繳費(fèi)方式,方便客戶繳費(fèi),大幅度減少這類客戶的欠費(fèi)行為。

4 結(jié)論

在對(duì)用電客戶電費(fèi)拖欠風(fēng)險(xiǎn)的預(yù)測(cè)研究中,對(duì)電力企業(yè)對(duì)用戶電費(fèi)管理模式進(jìn)行了分析,闡述了建立電費(fèi)拖欠風(fēng)險(xiǎn)預(yù)警模型的重要性,同時(shí)分析了現(xiàn)有研究成果存在的問(wèn)題和不足。為了更好地建立風(fēng)險(xiǎn)預(yù)警模型,首先使用RF算法提取關(guān)鍵影響因素,建立基于BP神經(jīng)網(wǎng)絡(luò)的用戶電費(fèi)欠繳或拖繳信用得分模型進(jìn)行初次預(yù)測(cè),為了提高用戶電費(fèi)欠繳或拖繳風(fēng)險(xiǎn)的預(yù)測(cè)精度,采用LR模型進(jìn)行二次預(yù)測(cè),從而對(duì)電力用戶電費(fèi)拖欠行為進(jìn)行有效預(yù)警。實(shí)驗(yàn)結(jié)果表明,本文所提的基于RBL電力客戶電費(fèi)拖欠風(fēng)險(xiǎn)混合預(yù)測(cè)模型預(yù)測(cè)精度可以達(dá)到92.83%,損失值在0.1左右,相比單獨(dú)使用BP神經(jīng)網(wǎng)絡(luò)或LR模型分別提高了2.73%和7.7%,同時(shí)對(duì)比決策樹模型和深度信念網(wǎng)絡(luò),預(yù)測(cè)精度分別有6.56%和2.34%的提升。本文所提算法可對(duì)用戶電費(fèi)拖欠風(fēng)險(xiǎn)進(jìn)行有效預(yù)警,幫助供電企業(yè)快速關(guān)注高風(fēng)險(xiǎn)用戶,減少經(jīng)濟(jì)損失,從而提高面向企業(yè)用電客戶繳費(fèi)風(fēng)險(xiǎn)管理能力。

猜你喜歡
特征提取用戶模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
基于Gazebo仿真環(huán)境的ORB特征提取與比對(duì)的研究
電子制作(2019年15期)2019-08-27 01:12:00
一種基于LBP 特征提取和稀疏表示的肝病識(shí)別算法
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
3D打印中的模型分割與打包
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
如何獲取一億海外用戶
主站蜘蛛池模板: 日韩在线视频网| 欧美三级视频网站| 欧美中文字幕一区二区三区| 青青网在线国产| 无套av在线| 99久久精品免费看国产免费软件| 久久无码av三级| 91在线中文| 欧美日韩国产精品va| 欧美成人在线免费| 国产精品吹潮在线观看中文| 亚洲男人在线| 欧美va亚洲va香蕉在线| 久久精品66| 素人激情视频福利| 久久免费视频播放| 日韩成人在线网站| 国产婬乱a一级毛片多女| 欧美午夜在线视频| 国产无遮挡猛进猛出免费软件| 国产喷水视频| 成人亚洲国产| 日本高清有码人妻| AV无码国产在线看岛国岛| 99精品在线看| 91国内视频在线观看| 日本国产精品一区久久久| 91人妻日韩人妻无码专区精品| 久久精品视频一| 日本日韩欧美| 欧美午夜小视频| 日韩AV无码免费一二三区| 五月天在线网站| 久久久黄色片| 成人免费视频一区| 五月激情婷婷综合| 日韩色图区| 国产第一页免费浮力影院| 日韩国产综合精选| 国产欧美成人不卡视频| 97超碰精品成人国产| 欧美日韩亚洲国产主播第一区| 国产原创第一页在线观看| 国产欧美在线| 亚洲视频免费在线| 青青草91视频| 99视频在线免费看| 亚洲欧美日本国产专区一区| 美女一区二区在线观看| 在线播放91| 成年人国产视频| 国产91视频免费观看| 国产在线拍偷自揄拍精品| 国产区人妖精品人妖精品视频| 夜夜拍夜夜爽| 国产精品精品视频| AV不卡在线永久免费观看| 欧美日韩在线第一页| 99九九成人免费视频精品| 久久综合五月婷婷| 国产区免费精品视频| 区国产精品搜索视频| 精品国产美女福到在线不卡f| 亚洲AV电影不卡在线观看| 国产网友愉拍精品| 久久国产亚洲欧美日韩精品| jizz国产视频| 91网址在线播放| 亚洲成人一区在线| 亚洲成a人片在线观看88| 国产美女在线观看| 欧美亚洲一区二区三区导航| 亚洲无码精彩视频在线观看| 欧美曰批视频免费播放免费| 色婷婷在线播放| 婷婷综合亚洲| 亚洲一区二区三区国产精品| 国产一级α片| 波多野结衣在线一区二区| 欧美一道本| 国产精品分类视频分类一区| 91九色视频网|