王宏剛,王一蓉,于 宙,李君婷,孫 妮
(國家電網有限公司大數據中心,北京 100032)
隨著經濟全球化和化工、電力等企業的快速發展,供應鏈的風險事故不斷,例如郵輪泄露事故、口蹄疫、戰爭、氯氣泄露事件等,使得企業所面臨的經營環境發生了本質化的改變,給供應鏈造成了巨大的沖擊,包括許多化工企業因供應鏈的瓦解而破產倒閉。此類事故不但給化工供應鏈上下游企業帶來重大損失,同時也給周圍環境和生命安全帶來不可估量的損失[1]。因此,對供應鏈風險進行檢測評估,對保證供應鏈安全和促進供應鏈的綠色可持續發展具有重要意義。此外對提高化工行業競爭力和保護社會環境和生命財產安全具有非常重要的實際意義。隨著互聯網時代和大數據時代的到來,供應鏈體系發生了一系列的深刻變化,隨著供應鏈一體化程度的提高,化工、電力等企業面臨諸如商品風險、網絡安全漏洞或自然災害等系統性風險的可能性也越來越大[2-3]。因此,研究大數據環境下的企業供應鏈風險檢測具有非常重要的理論意義和實際價值。
為實現供應鏈風險的快速和高精度的檢測,本文在風險管理實踐的基礎上,提出基于大數據技術的供應鏈風險檢測方法。首先,通過層次分析法建立供應鏈風險等級評價指標體系;之后,支持向量機的參數設置對其性能的影響,運用沙丘貓群算法[4](SCSO)優化SVM模型參數,提出一種基于SCSO-SVM的供應鏈風險檢測方法。
為實現供應鏈風險檢測,建立供應鏈風險特征指標是前提條件。本文在現有的采購風險管理模式分析中,結合相關文獻的采購實踐活動[5-6],提出一種基于外部風險(環境風險、競爭風險)、外部風險(道德風險、財務風險和交付風險)和管理風險(內部管控風險)的供應鏈風險特征評價指標。
環境風險:供應商是否被政治、經濟或者政策影響。
競爭風險:供應商面臨新領域、新技術、新產品、新的商業模式的競爭性如何。
道德風險:供應商是否誠信、是否遵守法律法規并承擔社會責任的企業。
財務風險:供應商會因為遇到財務困難或者危機而導致產品和服務無法交付。
交付風險:供應商是否能夠基于友好的合作按時交付質量過關的產品和服務。
內部管控風險:是否有完善的、有效的內部管理機制和系統。
SCSO算法是模擬沙丘貓生存行為而提出的仿生算法,主要模擬了沙丘貓的搜尋獵物行為和攻擊獵物行為[4]。
假設沙丘貓的種群規模為N,所要優化問題的維數為d,搜索空間上下限分別為ub=[ub1,ub2,…,ubd]T和lb=[lb1,lb2,…,lbd]T,SCSO算法按照式(1)進行種群隨機初始化。然后,就目標函數對每一只沙丘貓進行適應度評估,選擇出最優的沙丘貓個體,其他的個體向該個體移動。
XN×d=rand(N,d)×(ub-lb)+lb
(1)
式中:XN×d為沙丘貓位置矩陣;rand(N,d)為N×d維的隨機向量。

(2)
(3)
(4)
(5)

(6)

(7)
式中:當|R|≤1時,強制搜索代理進行攻擊獵物(利用);當|R|>1時,強制搜索代理進行搜索獵物(探索)。
SVM數學模型為[7]:
(8)
拉格朗日乘子代入公式(8)可以求解出SVM分類數學模型為:
(9)
式中:K(xi,xj)為RBF核函數。
(10)
SVM模型參數直接影響模型的性能。懲罰參數C數值越大,SVM模型容易過擬合;反之,SVM模型容易欠擬合。核函數參數g數值越小,SVM模型泛化性能越好;反之,泛化性能越差。為提高供應鏈風險檢測的精度,運用SCSO算法優化選擇SVM模型參數,提出一種基于SCSO-SVM的供應鏈風險檢測模型。首先,將供應鏈的風險探測資料分為培訓與檢驗;在此基礎上,應用SCSO算法進行訓練。SVM模型的參數組合(C,g)建立基于SCSO-SVM的供應鏈風險檢測模型;最后,將最佳參數組合(C,g)代入SVM模型進行供應鏈風險檢測測試。基于SCSO-SVM模型的供應鏈風險檢測模型算法步驟描述如下:
Step1:讀取供應鏈風險檢測數據,歸一化處理,并劃分訓練數據和測試數據:
(11)
式中:xmax、xmin分別為數據特征的最大值與最小值;LB、UB分別為歸一化處理后數據特征的最小值與最大值,取LB=-1,UB=1;x、xnew分別為原始特征數據與歸一化處理之后的特征數據。
Step2:設定SCSO算法參數,最大迭代次數Tmax、搜索維數D、種群規模N,文中優化SVM模型的懲罰因子C和核函數參數g,因此D=2;C和g搜索空間分別為[Cmin,Cmax]和[gmin,gmax];隨機產生沙丘貓初始種群個體,每個沙丘貓種群個體位置為SVM模型參數組合(C,g)。
Step3:根據式(12)計算沙丘貓個體適應度;
(12)
式中:acck為第k折計算出的準確度;ACC為K折交叉驗證的平均準確度。
Step4:在[0°,360°]產生一個隨機角度,當|R|≤1時,強制搜索代理進行攻擊獵物(利用);當|R|>1時,強制搜索代理進行搜索獵物(探索)。
Step5:判斷算法終止條件,若當前迭代次數t>Tmax,則算法終止,輸出全局最優位置即對應SVM模型的最優參數組合(C*,g*);反之,返回Step3~Step4迭代優化。
Step6:運用SVM模型的最優參數組合(C*,g*)對測試數據進行供應鏈風險檢測。
結合供應商分類分級研究成果,全面收集供應商的外部資料,包含供應商注冊資料、稅務資料、財務資料等;社會保障信息,業務信息,企業關系信息,司法訴訟信用信息等[8-9],檢驗和分析供應商的風險。運用層次分析法從外部風險(環境風險、競爭風險)、外部風險(道德風險、財務風險和交付風險)和管理風險(內部管控風險)等方面構建出供應商風險檢測指標體系[10]。供應商風險檢測評價指標數據和供應商風險等級由專家咨詢問卷調查法獲取,專家組成員包括:供應鏈21名管理專家,9名風險管理專家,20名專家,精通供應鏈管理的專家、風險評價模型以及風險管理理等相關領域內容,共回收有效問卷50份;供應鏈風險等級如表1所示。

表1 供應鏈風險等級評價標準Tab.1 Supply chain risk rating evaluation criteria
4.2.1參數設置
為了檢驗SCSO-SVM模式在供應鏈中的應用效果和可信度,設置不同的模型參數:(1)SCSO算法:群體大小N=20,迭代最大值Tmax=50。(2)粒子群算法(PSO):群體大小N=20,迭代最大迭代次數Tmax=50,學習因子c1=c2=2,慣性權重w=0.2;(3)遺傳算法[12-15](GA):種群規模N=20,最大迭代次數Tmax=50,變異概率pm=0.1,交叉概率pc=0.7;(4)螢火蟲算法(FA):螢火蟲數量N=10,最大迭代次數Tmax=50,初始吸引度β0=1和步長因子α=0.5。訓練集和測試集的評價精度如表2所示;尋優曲線對比圖和運行10次的ACC折線圖分別如圖1和圖2所示。

表2 不同模型評價結果Tab.2 Evaluation results of different models

圖1 尋優曲線對比圖Fig.1 Comparison of optimization curves

圖2 運行10次的ACC折線圖Fig.2 ACC polygraph with 10 runs
4.2.2結果分析
由表2可知,在訓練集和測試集上,SCSO-SVM的準確率分別為92.02%和81.69%,優于PSO-SVM的90.80%和78.87%,GA-SVM的89.57%和76.06%以及SVM的88.96%和74.65%。與單獨的SVM模型相比,SCSO-SVM的供應鏈風險檢測的準確率分別提高了3.06、7.04個百分點,從而說明SCSO-SVM可以有效提高供應鏈風險檢測的精度[16-20]。
從圖1可以看出,與FA-SVM、PSO-SVM和GA-SVM相比,SCSO-SVM進行供應鏈風險檢測的收斂速度更快,適應度值更低,效果最好。從圖2可以看出,不同算法各獨立運行10次,從整體上來看,SCSO-SVM進行供應鏈風險檢測的準確率體明顯優于SVM、GA-SVM、PSO-SVM和FA-SVM,其中SVM進行供應鏈風險檢測的準確率最低。
為了進步說明SCSO-SVM進行供應鏈風險檢測的有效性,將SCSO-SVM與隨機森林回歸(RFR)、網格搜索優化隨機森林回歸(Grid- RFR)和粒子群優化隨機森林回歸(PSO- RFR)進行對比,對比結果如表3所示。

表3 不同算法供應鏈風險檢測結果Tab.3 Supply chain risk detection results of different algorithms
由表2可知,SCSO-SVM模式的供應鏈風險在培訓集合和測驗集合中具有最好的識別精度。在評價指標準確率、精準率、召回率和Fscore這4個評價指標上,SCSO-SVM均優于PSO-RFR模型、Grid-RFR模型和RFR模型,從而驗證了SCSO-SVM進行供應鏈風險檢測的有效性和可靠性,為供應鏈風險檢測提供了新的方法。
針對支持向量機參數設置對供應鏈風險水平的影響。提出一種基于沙丘貓群算法(Sand Cat Swarm Optimization,SCSO)優化SVM的供應鏈風險等級檢測方法。研究結果表明,SCSO-SVM可以有效提高供應鏈風險檢測的精度,為供應鏈風險檢測提供了新的方法。