慕 曉,高建宏
(1.華北電力大學經濟與管理學院,北京 102206;2.煙臺供電公司,山東 煙臺 264001 )
我國各地電力客戶拖欠電費、違章用電、竊電現象時有發生。加強用電客戶信用管理,才能確保應收賬款的回收和資產保全,有效控制不良應收賬款,降低企業壞賬比例,縮短業務流程,跟蹤分析單個客戶或行業客戶的付款歷史和習慣,為未來的交易提供風險防范,有效降低電力公司的經營風險,保護供電企業的合法利益。
首先研究人工免疫系統聚類分析原理,提出實數編碼的人工免疫系統聚類分析過程。然后確定用電客戶信用分析指標,最后根據電力公司客戶數據,采用人工免疫系統聚類分析方法對用電客戶進行聚類,探討人工免疫系統應用于電力客戶信用分析的可行性。
人工免疫系統是一種全局隨機概率搜索方法,具有多樣性、耐受性、免疫記憶、分布式并行處理、自組織、自學習、自適應和魯棒性等特點[1]。通過用抗體代表問題的可行解,抗原代表問題的約束條件和目標函數,采用能體現抗體促進和抑制的期望繁殖率來選擇父個體,從而達到快速收斂到全局最優解的目的。人工免疫系統一般由以下幾個部分構成:編碼、產生初始抗體群體、計算親和力和期望繁殖率、遺傳進化操作和終止條件。
實數編碼的人工免疫系統聚類分析計算步驟描述如下:
第1步,輸入n個抗原。在算法中假定把n個數據對象 Xj(j=1,2,…,n)作為 n 個被捕獲的抗原輸入。
第2步,形成父代群體。抗體的產生可以根據問題的具體特點和性質,用經驗的辦法確定類別數,從數據中找出從直觀上看來是比較合適的代表點作為初始抗體;也可以將全部數據隨機地分成c類,計算每個類的質心,將這些質心作為初始抗體;最簡單的辦法是隨機地抽取c個數據作為初始抗體。
第3步,對初始抗體進行評價,評價標準采用期望繁殖率ev。其計算方法如下[1]:
1)計算抗體v的濃度。

其中 ayvw≥Tac時,acvw=1;否則,acvw=0,Tac是已確定的濃度閾值。抗體v和抗體w間的相似度為

實數編碼的人工免疫系統在計算兩個抗體相似度時采用歐式空間二次泛數Hv,w;

式中,m為數據對象中決策變量的個數,wiv和wiw代表抗體v和w中第i個決策變量值。axv為抗原與抗體的親和力,用于表明抗體對抗原的識別程度。抗體v和抗原w的親和力為

其中,J(u,c)表示抗原和抗體之間的結合度[1-2],一般情況下采用目標函數值來表示[3]。

這里 uij是向量 Xj屬于組 ci(i=1,2,3…,c)的程度,它的值介于0和1之間。每一次分組時,n個對象按親和力的大小,分屬與不同 ci(i=1,2,3…,c),其中:
對每個 k≠i,如果 Xj-ci2≤Xj-ck2,uij=1,否則,uij=0。
2)計算抗體v的期望繁殖率。

抗體的期望繁殖率同時體現出了免疫系統對高親合度抗體的促進和對高濃度抗體的抑制,這樣可以維持抗體的多樣性,避免過早陷入局部最優[1]。
第4步,形成父代群體。將初始群體按ev的降序排列,并取前c個個體構成父代群體;再按照axv降序排序同時取前n個個體存入記憶庫中。
第6步,新群體的產生。基于第4步的計算結果對抗體群體按照其評價結果進行交叉和變異處理,得到新群體。再從記憶庫中取出記憶的個體,共同構成新一代群體。之后,轉去執行第3步。
國際上對企業信用傳統的評估要素主要有品格、能力、資本、擔保、經營狀況5個要素[4],基于我國用電客戶的基本情況,并依據相關文獻資料[4-8],認為對用電客戶的信用分析主要應立足于客戶的綜合素質上,具體應包括:1)上門遞交停電通知單。2)上門遞交催收通知單。3)商業信用。用電客戶的商業信用是客戶履行各種經濟承諾的能力及可信度。由企業形象、法人代表的品德、經營業務市場前景、資產負債率、盈利額、付電費比率、凈資產收益率、總資產凈利率等指標構成。4)安全信用。5)法律追討。6)違規用電或竊電。
以某電力公司分析用電客戶信用為例進行用電客戶信用分析,有關數據見表1。
在分析時,把 A、B、C、D、E、F 企業的數據作為被捕獲的抗原輸入,將全部數據隨機地分成3類。
設定濃度閾值Tac為0.8,聚類種類c為3,即以c1類表示用電客戶信用高、c2類表示用電客戶信用中等、c3類表示用電客戶信用低。得到如下結果:

表1 用電客戶信用指標值

人工免疫系統聚類分析并行完成計算,算法實現相對簡單,只要確定了濃度閾值和聚類個數就可得到結果,該方法能夠適用于大數據量,使對專業知識的要求降到最低,對于數據不同的順序不敏感。在獲得最優解方面具有優越性,人工免疫系統用于電力客戶信用分析是非常可行的,但濃度閾值的大小將影響聚類的結果。