楊玉梅,張慶年,楊 杰,涂 敏,叢 喆,張 威
(1.武漢理工大學交通學院,湖北 武漢 430063;2.武漢理工大學信息工程學院,湖北 武漢 430070)
航運具有運量大、成本低、耗能少、污染小等優勢,在國民經濟中發揮著重要的作用。“21世紀海上絲綢之路”的提出以及建設長江黃金水道的推出,將航運業融入了國家的重大發展戰略[1-2]。隨著國家對航運業的重視,航運業得到了蓬勃發展,其在拉動國民經濟的同時,也顯露出安全事故頻發的問題。2018年僅僅是長江海事局轄區內,就發生了172起航運安全事故,其中27起是船舶等級以上事故,共造成35人死亡失蹤、沉船19艘,直接經濟損失高達3 925.6萬元[3]。因此,航運安全日漸成為航運管理者關注的重點。而航運安全與航運安全投入密切相關,航運安全投入是能夠保障航運安全的必要手段,但是由于安全投入的效益是間接性的,且金融危機之后,近幾年航運業的發展勢態并不樂觀,許多航運企業在進行安全投入決策時,考慮到成本的原因,大多盡可能地壓縮安全投入,這就間接導致了航運事故率持續升高。
針對安全投入的研究,很多學者做了大量的研究,也取得了很多研究成果,但是這些研究成果主要集中在煤礦、建筑和工程建設領域。在煤炭領域中,李樹剛等[4]構建了基于“人—技術—管理”的多因素煤礦安全投入評價指標體系;陳贊[5]構建了基于IPSO-SVR的綠色煤礦生產安全投入優化模型;屈奎[6]建立了基于灰色預測的煤電廠安全投入優化模型等。在建筑和工程建設領域中,王永柱[7]采用系統動力學仿真模型對建筑施工企業安全投入進行了動態分析;周建明等[8]利用李克特5分法量化了施工項目風險指數并對不同建設項目間安全投入的分配進行了研究;馮領香等[9]采用蒙特卡羅方法對Agent模型仿真得到的建設項目安全投入指標的敏感性進行了排序等。而對于航運安全投入的研究則相對較少,且大部分的研究主要集中在定性研究方面,能提出切實可行建議的定量研究較少。如陳超[10]通過費效分析提出了航運企業的安全投入產出模型,通過計算可得到航運企業成本效益最優化的安全投入費用,可為航運企業的安全管理模式和安全投入決策提供指導;邵萬兵[11]利用廣義DEA模型對江蘇地區30家航運企業的安全投入和安全風險數據進行了分析,得出了各個航運企業的安全投入效率和安全風險分布情況,進而推動了航運企業對安全投入的重視和管理力度;容敏敏等[12]建立了航運企業安全投入的博弈模型,確定了影響航運安全投入決策的因素,并指出政府應充分發揮其監管作用;李昊[13]提出了航運系統動態安全域價值理論,并利用最小二乘法擬合了特定安全范圍里的超平面,解析了航運系統安全與安全投入的關系。
綜上研究可見,煤礦、建筑和工程建設領域對于安全投入的研究相對成熟,有一定的借鑒意義。為此,本文結合航運企業安全的實際情況,提出了一種基于GA-SVR-PSO的航運安全投入優化方法,構建了航運安全投入的優化模型,并通過Z航運公司2018年安全投入的實例分析,驗證了該模型的可靠性和可行性。
遺傳算法(Genetic Algorithm,GA)參照了Mende的遺傳學說和Darwin的進化論,是一種由模擬自然界內生物進化機理發展而來的具有隨機性全局搜索及優化能力的方法。遺傳算法不像傳統搜索優化方法那樣依賴梯度信息,而是利用編碼技術,對由染色體組成的對應群體的進化過程進行模擬來尋求最優解。該算法利用選擇、交叉、變異等操作產生新個體,通過選擇適應度較高的個體形成新種群,建立起一個迭代過程,使種群里的個體不斷地進化,并使種群漸漸接近最優,最終解決最優化計算問題。其中,選擇操作,即根據個體適應度,參照一定的方法或者規則,例如聯賽選擇、 輪盤賭選擇、Boltzmann選擇等,從當前種群里選擇優良個體作為父代繁殖下一代,達到選擇的目的,同時體現了達爾文適者生存的思想;交叉操作,它是遺傳算法里重要的操作之一,通過交叉操作能產生組合父輩特性的新個體,以某個交叉概率交換群體內搭配成對的個體之間的部分染色體,即進行部分信息交換,則能得到互換信息后的新個體,常用的交叉操作的方法主要有點交叉、多點交叉和均勻交叉等;變異操作,即通過變異概率來改變種群中的個體里某一個或某些基因座上面的基因值為其他等位基因,從而產生新個體。
支持向量機(Support Vector Machine,SVM)是Vapnik[14]在1995年提出的以統計學習理論為基礎的多方面應用的一種新方法。SVM借助最優化理論,能成功地解決模式識別問題(SVC)和回歸問題(SVR)等,是數據挖掘中能推廣到綜合評價和預測領域的一種新技術[15-20]。本文應用支持向量回歸(SVR)模型模擬航運安全投入與經濟損失之間的定量關系。
SVR模型將輸入的自變量指標x1,x2,…,xm映射至高維特征空間[φ(x1),φ(x2),…,φ(xm)]中,能將原始非線性模型轉化為特征空間里的線性模型,即:
f(xi)=ωTφ(xi)+B
(1)
式中:xi為樣本點;φ(xi)為非線性映射;f(xi)為特征空間中的線性函數;ω為待辨識的權重;B為常數項。
根據結構風險極小化和SVR原則,對該回歸模型中待辨識的權重ω和常數項B進行處理,得到SVR模型的優化函數:
(2)

從而得到SVR模型的決策函數:
(3)
K(xi,x)=exp(-g‖xi-x‖2)

交叉驗證(Cross Validation,CV)是一種應用于驗證分類器性能的統計分析方法,其基本思想是將原始數據在某限制下劃分組別,一部分當成訓練集,另一部分當成驗證集,先將訓練集輸入模型訓練模型,再將驗證集輸入訓練好的模型進行測試,并以此作為評價性能指標。常見的CV方法有Hold-Out Method、K-fold Cross Validation(K-CV)和Leave-One-Out Cross Validation(LOO-CV)三類。CV方法能保證模型的可靠性和穩定性,因此本文選取K-CV方法進行交叉驗證,將原始數據均分為K組,用每個子集分別做一次驗證集,剩余的K-1組子集當成訓練集,結果生成K個模型,將K個模型最終驗證結果的平均數作為該K-CV方法的性能指標。
粒子群優化算法(Particle Swarm Optimization,PSO)源于對鳥群覓食全過程的模擬,被Kennedy等[21]于1995年開始用于優化計算,大量的實踐證明PSO是很好的優化算法[22-29]。PSO算法基于群體的概念而產生,一系列個體粒子組成粒子群,個體粒子在自變量定義域確定的搜索空間中進行運動,在搜尋最優解的過程中,飛行經驗會對粒子的飛行速度進行即時動態調整,見公式(4),每一個粒子的位置代表著每一個可能解,見公式(5):
(4)
(5)



圖1 PSO算法流程圖Fig.1 PSO algorithm flow chart
SVR模型的預測精度受參數c、g、p的影響較大,懲罰因子參數c設置太大或太小都會引起模型過學習或者欠學習,核函數參數g也會間接地影響模型構建分類器空間的性質,不敏感損失系數p對模型支持向量的數目和預測精度也有影響。GA算法具有全局搜索和速度快的優點,而K-CV方法能有效地避免欠學習和過學習狀態,因此將兩者結合能較好地優化SVR模型的參數。因此,本文采用GA和K-CV結合的方式對SVR模型的參數進行優化。GA-SVR模型的構建流程見圖2。

圖2 GA-SVR模型的構建流程圖Fig.2 Construction flowchart of GA-SVR model注:Gen為迭代次數
3.1.1 某航運公司安全投入指標原始數據
影響航運安全的因素很多,但是實際上航運企業能通過安全投入改善安全狀態的因素主要集中在“人—機—管理”這一系統里。本文結合“人—機—管理”系統工程理論和實際調研情況,將2001—2018年Z航運公司安全投入指標和當期航運事故造成的經濟損失原始數據列出,見表1。

表1 2001—2018年Z航運公司安全投入指標和航運事故經濟損失原始數據表(單位:萬元)
由表1可知,隨著航運業的發展,航運量不斷增加,Z航運公司不斷擴大規模,因此安全投入費用也相應增加;但是在2008年金融危機之前的鼎盛期,Z航運公司的安全投入已跟不上公司規模擴大后航運安全的需要,導致航運事故經濟損失出現高升狀態,2008年經融危機之后,航運業一直處于低迷狀態,Z航運公司在已擴大的規模上進行相應的安全投入已經有點力不從心,因此航運事故經濟損失仍保持在較高的水平。
3.1.2 原始數據預處理
為了方便模型訓練以及數據統一化,本文采用最大最小化方法對原始數據進行歸一化處理,將原始數據控制在[0,1]范圍內。原始數據具體的歸一化處理公式如下:
(6)
3.1.3 模型參數的初始設置
交叉驗證采取5折驗證的方式,將原始數據均分為5組,用每一個子集分別做一次驗證集,剩余的4組子集當成訓練集。GA算法中的進化代數設為250,種群數量根據經驗應為變量數目的4~6倍[31],即為20~30個,本文采用試湊法確定其為30個。c、g、p參數的初始范圍分別設置為[0,100]、[0,100]、[0,1]。
3.1.4 模型訓練與驗證
本文采用2001—2015年Z航運公司安全投入指標數據作為訓練集,其中將“人員—船舶—管理”涉及的[安全教育和激勵費、勞動保護用品費]、[維修檢測費、安全技術措施費]和日常安全管理費這五個安全投入指標數據作為GA-SVR模型的輸入指標,以航運事故經濟損失作為輸出指標,并采用2016—2018年Z航運公司安全投入指標數據作為測試集驗證模型訓練的效果。GA算法對SVR模型參數進行尋優過程中,種群適應度函數曲線見圖3,最終搜尋到的最優參數為c=14.631 7、g=0.396 54、p=0.033 287。

圖3 種群適應度函數曲線Fig.3 Population adaptation function curves
將最優參數輸入SVR模型對訓練集數據進行訓練,得到訓練好的SVR模型,模型中訓練集和預測集的擬合曲線見圖4。訓練集預測的均方誤差MSE為0.01,相關系數為0.91,其擬合效果較好。

圖4 訓練集的擬合效果圖Fig.4 Fitting effect diagram of the training set
將測試集數據代入訓練好的GA-SVR模型中驗證模型預測的精度,模型中測試集和預測集的擬合曲線見圖5。測試集預測的MSE為0.005,其預測精度較高。

圖5 測試集的擬合效果圖Fig.5 Fitting effect diagram of the test set
經過模型訓練與驗證,說明構建的GA-SVR模型能很好地表達出Z航運公司安全投入與事故經濟損失之間的定量關系,可為后續該公司航運安全投入優化研究奠定基礎。其定量關系表達式如下:
(7)

3.2.1 航運安全投入優化目標與約束條件
本文以Z航運公司2018年安全投入為例進行航運安全投入優化研究。Z航運公司2018年安全投入總費用約為4 000萬元,安全投入優化目標是在2018年總安全投入費用4 000萬元以及分項投入約束條件下當期航運事故經濟損失最小。根據相關規定和Z航運公司安全決策限制,為了防止安全投入在每一個投入分項里投入不足或者過高,對每一個投入分項設置投入上、下限,Z航運公司安全投入的優化決策表達式如下:
目標函數為
(8)
目標約束為
(9)
3.2.2 基于PSO算法的安全投入優化計算
由于決策函數是高維空間的線性函數,用一般的尋優算法難以進行尋優,因此本文采用自適應權重PSO算法對目標函數最小值進行搜索,PSO算法參數的初始設置見表2。

表2 PSO算法參數的初始設置
通過PSO算法編程計算,經過約8.5 s,計算得到該航運公司航運事故經濟損失最小值為1 979.96萬元,比2018年該公司航運事故實際經濟損失降低了733.28萬元,此時最優的安全投入組合為x=[507.51,430.41,434.52,1 146.74,1 153.39],合計總安全投入費用約為3 700萬元。
將計算結果與實際情況進行對比可知,本文建立的航運安全投入-事故經濟損失關系模型與航運安全投入優化模型能夠很好地結合,可為航運企業安全投入決策提供依據。
本文驗證了通過GA-SVR模型構建的航運安全投入與事故經濟損失定量關系模型的有效性和可靠性,并結合實際決策限制,利用PSO算法對航運安全投入優化模型進行了優化,最后以Z航運公司2018年安全投入為實例,驗證了基于GA-SVR-PSO的航運安全投入優化方法的可靠性,經安全投入優化組合后預計能降低733.28萬元的航運事故經濟損失。該方法可為航運企業安全投入決策提供可靠的依據,從而提高航運安全投入效率,減少事故經濟損失。
本文在模型構建時,由于樣本數量有限,并受到實際安全投入財務資料的限制,模型參數設置受到隨機因素的影響。但該方法若能應用于多家航運企業,并能采用更長年份的歷史數據,則可進一步提高模型的預測精度,從而提高其實際應用價值。