馮曙明, 胡天牧, 楊永成, 潘晨溦, 高正平, 沈鍵
(1.江蘇電力信息技術(shù)有限公司,江蘇,南京 210024; 2.國網(wǎng)江蘇省電力有限公司,江蘇,南京 210024;3.國網(wǎng)江蘇省電力有限公司物資分公司,江蘇,南京 210024)
隨著社會日新月異的發(fā)展,供電系統(tǒng)穩(wěn)定運行不僅影響著各行各業(yè)的發(fā)展,也影響著人們生活的秩序和穩(wěn)定。若出現(xiàn)突發(fā)的供電中斷和大面積停電,將會造成社會經(jīng)濟的巨大損失和人民生活秩序的混亂,所以供電系統(tǒng)的穩(wěn)定運行不僅關(guān)系著國家經(jīng)濟建設(shè)和社會的和諧,還關(guān)系著人民群眾的切身利益[1]。
為保證供電系統(tǒng)的穩(wěn)定運行,電力供應(yīng)鏈的穩(wěn)定與安全尤為重要,對電力供應(yīng)鏈風險進行有效評估不僅能有效防范影響電力正常運行的風險因素,同時也能夠為電力故障的診斷提供科學的指導(dǎo)[2]。因此,構(gòu)建有效的電力供應(yīng)鏈風險評估模型至關(guān)重要。
文獻[3]提出了將模型聚類算法應(yīng)用到電力供應(yīng)鏈風險中,對電力數(shù)據(jù)中存在的不良數(shù)據(jù)進行識別,根據(jù)識別出的不良數(shù)據(jù)以及電力供應(yīng)鏈自身的特點,建立電力供應(yīng)鏈安全識別模型。文獻[4]探究了Benders算法下集群式供應(yīng)鏈多級訂單柔性決策模型,實現(xiàn)訂單的在線實時決策。文獻[5]提出了傳統(tǒng)失效模式與影響分析(failure mode and effects analysis, FMEA)模型中失效模式的最終排序受制于不同風險因子權(quán)重值的影響,且采用層次分析法(analytic hierarchy process, AHP)對風險因子進行權(quán)重賦值,具有較強的主觀性,而數(shù)據(jù)包絡(luò)分析(data envelopment analysis, DEA)的客觀性比較強,為改進這一問題,提出了組合賦權(quán)法。文獻[6]面向產(chǎn)出單一的多級農(nóng)產(chǎn)品供應(yīng)鏈網(wǎng)絡(luò)魯棒優(yōu)化設(shè)計問題,以降低不確定性風險和總成本為目標,建立了集成生產(chǎn)選址、產(chǎn)能決策和物流網(wǎng)絡(luò)運輸模式選擇的混合整數(shù)規(guī)劃數(shù)學模型。
上述的方法大多數(shù)基于機器學習中的方法,伴隨著深度學習的發(fā)展,深度學習在計算機視覺與自然語言處理等領(lǐng)域取得的巨大突破證明了深度學習的有效性。本文引入膠囊網(wǎng)絡(luò)算法,并將其應(yīng)用到電力供應(yīng)鏈風險識別中,它不僅能夠反應(yīng)出局部膠囊與整體膠囊之間的關(guān)系,還能夠反應(yīng)膠囊內(nèi)部各因素之間的關(guān)系。為評價所提出模型的有效性,不僅與機器學習中的方法比較,還同深度學習中的常用算法進行比較,實驗證明了所提出的模型在準確率和魯棒性上都取得了比較好的效果。
根據(jù)供電公司所具有的數(shù)據(jù)特點,同時為了滿足構(gòu)建電力供應(yīng)鏈風險診斷模型的需要,對電力供應(yīng)系統(tǒng)數(shù)據(jù)劃分為計劃、采購、生產(chǎn)、配送與送電等4個部分。
(1)計劃:電力供應(yīng)鏈中計劃是指依據(jù)當下的國家戰(zhàn)略因素、政策因素、市場因素等來制定合理的規(guī)劃。供電公司應(yīng)進行整體系統(tǒng)的分析,使得產(chǎn)能既不過剩,也滿足于社會的需求,這也是供應(yīng)鏈風險中重要的基礎(chǔ)。其中,國家戰(zhàn)略因素、政策因素、市場因素影響著計劃的制定,而計劃的制定是否合理應(yīng)由專家進行評估打分。
(2)采購:順利的采購是保證電力正常運行的前提。電力企業(yè)的采購不僅會受市場價格波動的影響,還會受供應(yīng)商供貨質(zhì)量的影響,以及供應(yīng)商選擇是否恰當?shù)挠绊?,故對采購需考慮市場價格的影響、供應(yīng)商的選擇、供應(yīng)商供貨質(zhì)量三個特征,并通過專家對其進行評估打分。
(3)生產(chǎn):電力的生產(chǎn)是電力企業(yè)的核心。電力生成工藝技術(shù)強,流程復(fù)雜,操作復(fù)雜,設(shè)備化程度高,若出現(xiàn)電力生產(chǎn)過程控制不當、設(shè)備運轉(zhuǎn)存在安全隱患等風險,將會對供應(yīng)鏈產(chǎn)生極大影響。
(4)配送與送電:在電力企業(yè)的供應(yīng)鏈活動中,配送主要包括燃煤的輸送、物資配送等工作內(nèi)容。當下大多數(shù)的電廠信息管理水平不一,且信息系統(tǒng)存在問題,例如存在配送體系信息化程度低、輸送設(shè)備質(zhì)量問題較嚴重、配送設(shè)備故障、送電設(shè)備在野外會面對著各種復(fù)雜的自然環(huán)境影響等問題,容易產(chǎn)生送電線路故障等問題,會對整個供應(yīng)鏈的運行產(chǎn)生不良后果。所以需要考慮以下幾個特征因素:配送體系信息化程度、配送設(shè)施故障、送電線路故障、送電線路檢修不及時等,并通過專家對其進行評估打分。
膠囊是一組用于表示不同特征的神經(jīng)元的集合,且用其模長來表征其存在的概率大小,主要用于探究局部與整體之間的關(guān)系的算法。
首先將專家打的分數(shù)通過歸一化公式x=(x-xmin)/(xmax-xmin)進行歸一化處理,作為膠囊的內(nèi)部特征神經(jīng)元,由此形成計劃膠囊、采購膠囊、生產(chǎn)膠囊、配送與送電膠囊??紤]到供應(yīng)鏈風險中可能存在一些其他的不確定因素,所以通過隨機生成引入不確定因素膠囊,每一個膠囊里面包含了影響此膠囊的各種特征,采用x1表示計劃膠囊,x2表示采購膠囊,x3表示生產(chǎn)膠囊,x4表示配送與送電膠囊,x5表示不確定因素膠囊,xij表示第i個膠囊中第j個特征,其中xi∈R5,對于內(nèi)部因素不足的膠囊采用零補齊。
基于獲得的底層膠囊的特征,考慮底層膠囊到高層目標膠囊的信息轉(zhuǎn)化,采取如式(1)的信息轉(zhuǎn)化公式:
uj|i=wijxi
(1)
其中,wij?R5×6表示底層第i個膠囊高層第j個膠囊的信息轉(zhuǎn)化矩陣,uj/i表示由底層第i膠囊經(jīng)信息轉(zhuǎn)化矩陣wij后到高層第j個膠囊所傳遞的信息。
每一個底層膠囊到高層目標膠囊的權(quán)重值是不一樣的,其權(quán)重值的大小表示了該底層膠囊對高層膠囊的影響大小,采用式(2)對其進行概率化,則每一個底層膠囊到高層膠囊所轉(zhuǎn)化的信息量可表示為公式(3):
(2)
mij=cijuj|i
(3)
其中,cij表示經(jīng)過式(2)概率化后第i個底層膠囊的信息到第j個高層膠囊的信息所具有的權(quán)重,mij表示底層第i個膠囊到到高層第j個膠囊所轉(zhuǎn)化的信息。
將每一個底層膠囊i到高層膠囊j的轉(zhuǎn)化的信息mij進行求和得到高層膠囊j的特征表達膠囊,可表示為
(4)
其中,sj表示的是高層第j個膠囊,是所有底層膠囊的信息傳遞給其的總和。
為將sj的模長壓縮到(0,1)之間,采用擠壓函數(shù):
(5)
bij=bij+uj|i·vj
(6)
其中,bij初始化時都為0,通過計算高層膠囊vj與uj/i的相似度,動態(tài)地迭代更新bij。
膠囊網(wǎng)絡(luò)使用模長來表征其存在的概率大小,為了使正確類的膠囊擁有比較大的模長,而錯誤類的膠囊擁有較小的模長,采用如下的損失函數(shù)

(7)
式中,Nk是標簽值,采用了獨熱編碼,表示這個膠囊屬于第k個類別,π+、π-、λ分別為0.9、0.1、0.5的超參數(shù)。
將打好標簽的46 890個數(shù)據(jù)集,70%劃分為訓練集,10%劃分為驗證集,20%劃分為測試集,詳細細節(jié)請見表1。

表1 數(shù)據(jù)集劃分 單位:個
為了證明所提模型的有效性,將所提出的模型CPE與模糊聚類算法、k近鄰分類(k-nearest neighbor classifica-tion, KNN)算法、支持向量機(support vector machine, SVM)算法、卷積神經(jīng)網(wǎng)絡(luò)算法(convolutional neural network, CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(long short-term memory, LSTM)進行對比。每一類算法都在訓練集上訓練好,在測試集上跑10次,取10次的均值作為模型的最終正確率,如表2可以看出,所提模型取得了比較好的實驗效果,顯著優(yōu)于傳統(tǒng)的機器學習方法如模糊聚類、KNN、SVM,同時也好于CNN和LSTM。

表2 不同模型正確率
在實驗過程中,將模型在訓練集上訓練,然后將訓練好的所有模型在同一個數(shù)據(jù)集上跑10次,模型的最終正確率取10次的平均值。從實驗結(jié)果分析可得:第一點,從模型的識別正確率進行比較,發(fā)現(xiàn)所提出的模型CPE的正確率達到了89.8%,不僅超過了傳統(tǒng)的機器學習的方法(模糊聚類、KNN、SVM),還優(yōu)于深度學習領(lǐng)域中常用的CNN和LSTM方法,KNN的結(jié)果受限于初始化參數(shù)的影響,難以捕捉較好的初始化參數(shù),而SVM對核函數(shù)的選取要求比較高,且它不適合用在大量樣本中的數(shù)據(jù)集,CNN的特征提取能力強,但其后常常伴隨池化層,而本實驗數(shù)據(jù)集的維度比較低,又通過池化層,信息丟失比較嚴重,LSTM的特征提取能力較弱,相比較上述算法的弱點,膠囊網(wǎng)絡(luò)的特征提取能力強,信息不易于丟失,不易受初始化參數(shù)影響,且其對于數(shù)據(jù)要求比較大,所以優(yōu)于其他模型。第二點,從圖1可以看出,CPE模型的波動幅度較小,其他模型的波動幅度都遠大于它,所以CPE模型具有較好的魯棒性。第三點,圖2可視化了高層危險膠囊與底層膠囊之間的權(quán)重值,發(fā)現(xiàn)配送與送電膠囊導(dǎo)致危險的因素是最高的,同時計劃部分也占了很重的值,因此合理地制定計劃至關(guān)重要。

圖1 測試準確率

圖2 危險權(quán)重值
提出的模型CPE的正確率超過了傳統(tǒng)的機器學習的方法,還優(yōu)于深度學習領(lǐng)域中常用的CNN和LSTM方法,且CPE模型的波動幅度較小,具有較好的魯棒性。本模型同時可視化了高層危險膠囊與底層膠囊之間的權(quán)重值,解決了傳統(tǒng)方法下電力供應(yīng)鏈分析識別準確率低、泛化能力和魯棒性差的情況。