999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于隨機森林的船舶避臺失敗原因分析

2021-10-08 04:34:45王元棟盛進路劉琴
上海海事大學學報 2021年3期

王元棟 盛進路 劉琴

摘要:為提高船舶避臺成功率,采用隨機森林對船舶避臺失敗的原因進行分析,并與決策樹進行對比。結果表明:隨機森林和決策樹對船舶避臺失敗事故的平均診斷率分別為84.23%和75.56%;隨機森林對一般事故和重大事故具有更高的診斷率,分別達到90.0%和96.1%。事故原因分析表明:造成船舶避臺失敗的首要原因是船員責任感不強;船員責任感不強、決策出現(xiàn)差池和船舶日常管理混亂極易導致船舶避臺失敗事故。本文研究可為船舶實施合理避臺措施提供一定的參考。

關鍵詞:? 船舶避臺失敗事故; 決策樹; 隨機森林

中圖分類號:? U698.6

文獻標志碼:? A

Meeting of the Waterborne Transport Division, World Transport Convention 2021 (WTC 2021)

Analysis on failure reasons of ship avoiding typhoon

based on random forest

WANG Yuandonga, SHENG Jinlub, LIU Qinb

(a.School of Shipping and Naval Architecture; b.College of Traffic & Transportation,

Chongqing Jiaotong University, Chongqing 400074, China)

Abstract: In order to improve the success rate of ship avoiding typhoon, the random forest is adopted to analyze the failure reasons of ship avoiding typhoon, and is

compared with? the decision tree. The results show that: the average diagnostic rates of the random forest and the decision tree for the failure accidents of ship avoiding typhoon are 84.23% and 75.56%, respectively; the random forest is of higher diagnostic rate for general accidents and serious accidents, and the diagnostic rates reach 90.0% and 96.1%, respectively. The analysis on accident reasons shows that: the primary reason for the failure of ship avoiding typhoon is the lack of crews responsibility; the lack of crews responsibility, the incorrect decision-making, and the chaotic daily management for ships can easily lead to the failure accidents of ship avoiding typhoon.It can provide reference for the implementation of reasonable measures for ship avoiding typhoon.

Key words: typhoon avoidance failure accident of ship; decision tree; random forest

收稿日期: 2021-03-28

修回日期: 2021-06-29

作者簡介:

王元棟(1992—),男,青海海東人,碩士研究生,研究方向為海事安全與環(huán)境工程,(E-mail)1774980941@qq.com;

盛進路(1976—),男,山東煙臺人,教授,博士,研究方向為港航企業(yè)運行與管理,(E-mail)forwardlulu@163.com

0 引 言

據德國安聯(lián)保險集團發(fā)布的《2020年安全與航運報告》,2019年100總噸以上船舶近五分之一的全損事故是由惡劣天氣和海況(如臺風、寒潮、濃霧)造成的,其中由臺風造成的約占75%。往往由臺風造成的事故損失巨大,救援極為困難,影響范圍廣,在威脅船舶安全航行的同時,還帶來極大的生命財產損失,甚至對海洋生態(tài)環(huán)境造成嚴重污染。因此,為給船舶安全航行提供有力的保障,研究船舶避臺失敗的原因極為重要。

船舶事故分析主要采用事故樹、故障樹、貝葉斯網絡等方法。楊威[1]應用事故樹對典型船舶避臺失敗事故原因進行了分析,缺乏一般性。吳郁等[2]以長江干線江蘇段945起碰撞事故為研究對象,采用隨機森林對缺失數(shù)據進行插補,與Logistic回歸、Probit回歸、樸素貝葉斯等方法進行對比得出,所采用的隨機森林誤分率最低。WAN等[3]在人因分析與分類系統(tǒng)(human factors analysis and classification system,HFACS)模型基礎上,根據事故統(tǒng)計分析結果和專家判斷結果,利用故障樹對碰撞事故基本風險因素進行定性分析,并制訂風險控制措施。李奕良[4]基于貝葉斯網絡對干散貨船自沉事故進行致因分析,挖掘事故致因鏈,并有針對性地提出相關風險控制措施。賀立敏等[5]應用隨機森林對船舶柴油機故障數(shù)據進行降維處理后,再采用支持向量機進行分類,并未完全發(fā)揮隨機森林的優(yōu)點。方匡南等[6]對隨機森林從原理、性質、應用等方面做了全面的分析。

事故樹起源于決策樹,是按事故發(fā)展的時間順序由初始事件開始推論可能的后果,而決策樹恰好相反。決策樹按一定的程序步驟可以向貝葉斯網絡轉化,換言之,貝葉斯網絡具有決策樹和事故樹的功能。貝葉斯網絡表達形式簡單,其繁雜程度隨著問題復雜程度呈線性增長,而事故樹的繁雜程度隨問題復雜程度呈指數(shù)形式增長。貝葉斯網絡是一個優(yōu)缺點并重的算法模型,在獨立分布的前提下,貝葉斯網絡優(yōu)于其他算法且需要的樣本量少。隨機森林是一種集成算法模型,集成學習的目的是通過結合多個基礎學習器的分析結果,改善單個基礎學習器的魯棒性和泛化性能,其最大的優(yōu)點在于訓練時不太可能出現(xiàn)過擬合現(xiàn)象。

通過上述事故分析模型關系與特征的分析,本文采用隨機森林與決策樹對比的方法,對船舶避臺失敗原因進行分析。首先根據事故報告按事故致因、事故等級形成二進制數(shù)據庫,其次對數(shù)據進行預處理,剔除個別事故的罕見致因,最終形成450×11的矩陣,最后應用隨機森林和決策樹進行結果分析,尋出船舶避臺失敗的關鍵致因。

1 隨機森林算法

1.1 隨機森林算法思路

隨機森林將多個決策樹進行有效組合,組建成一個學習系統(tǒng),其中每個決策樹是這個系統(tǒng)的組成單元,隨機森林的學習能力在系統(tǒng)中所占的權重根據訓練可能會有所不同,但其泛化性能優(yōu)于其中任何一棵決策樹[7-8]。

集成算法有兩個流派,Bagging流派和Booting流派,兩者最為明顯的區(qū)別是前者各學習器之間有依賴關系,而后者沒有[9]。通常將Bagging的集成思想與決策樹的結合稱為隨機森林,其基本思路見圖1。

1.2 隨機森林算法流程

相對于事故樹單分類器,隨機森林算法具有更好的診斷性能,但由于該算法本身的隨機性,診斷結果存在波動性[10]。針對這個問題,

首先對采集的數(shù)據進行預處理和降維處理,以減少訓練時間;再根據事故等級劃分和變量確定,形成完備的二進制數(shù)據庫;然后計算數(shù)據庫中事故等級的一階原點矩,確保一階原點矩周圍事故診斷率達到90%以上,并進行交叉驗證確定最佳決策樹和最少葉子節(jié)點數(shù);最后通過隨機森林模型得出最終決策樹。本文隨機森林算法流程見圖2。

2 基于隨機森林的船舶避臺失敗原因分析

數(shù)據挖掘分析中最為重要的是數(shù)據源的科學性、合理性和準確性。本文數(shù)據來源于中國海事局船舶避臺失敗事故報告(www.msa.gov.cn/)。

2.1 事故等級劃分

依據《中華人民共和國統(tǒng)計法》、《中華人民共和國海上交通安全法》和《中華人民共和國內河交通安全管理條例》,將水上交通事故按照人員傷亡和直接經濟損失情況,分為5個等級:小事故、一般事故、大事故、重大事故和特大事故。對事故等級進行量化處理,

上述5個等級量化值依次為1、2、3、4、5。本文數(shù)據來自450份船舶避臺失敗事故報告,其中有小事故6起、一般事故146起、大事故229起、重大事故45起和特大事故24起。

2.2 事故原因確定

對事故報告進行系統(tǒng)全面的分析,發(fā)現(xiàn)船舶避臺失敗的原因有11項,見表1。在統(tǒng)計時,若該項為某起船舶避臺失敗事故的原因,則記為1,否則記為0。

事故原因統(tǒng)計概率見圖3。從圖3可知,臺風風速及影響范圍不規(guī)律變化(x11)占比78%,準備工作不足(x6)占比74%,決策失誤(x5)占比66%。

3 分析過程

(1)讀取數(shù)據。應用MATLAB自帶函數(shù)xlsread讀取二進制數(shù)據庫,然后應用unifrnd產生450×1的均勻矩陣,并用round函數(shù)對矩陣進行整數(shù)化處理,最后應用randperm產生一個均勻隨機的數(shù)字序列,為后續(xù)抽樣做準備。

(2)計算事故等級原點矩。對事故等級進行統(tǒng)計概率分析,結果見表2。由原點矩可知,總體樣本事故等級的期望為2.85,因此樣本的總體事故等級在一般事故與大事故之間。

(3)留一法抽樣。為保證每組數(shù)據既能作訓練集也能作測試集,采用留一法抽樣:先把總樣本(共450起事故)均勻分成10組,然后利用Bootstrap重采樣,任選一組為測試集,剩下的9組為訓練集,接著再選1組為測試集(選過的不再選擇),剩下的9組為訓練集,以此類推。這樣不僅能保證每組數(shù)據既作為訓練集又作為測試集,而且便于決策樹交叉驗證。

(4)創(chuàng)建隨機森林分類器進行仿真測試。應用R語言中的隨機森林工具包Class RF _ train和Class RF _ predict創(chuàng)建隨機森林分類器進行仿真測試。

(5)分析過程。初始決策樹為500棵,葉子節(jié)點數(shù)為9。為每個非葉子節(jié)點選擇事故原因前,從11個事故原因中隨機抽取9個作為當前節(jié)點的分裂屬性,并以這9個屬性中最好的分裂方式對該節(jié)點進行分裂,在整個森林生長過程中,每棵樹都完整生長不進行剪枝;然后采用投票的方法,將訓練集決策樹輸出最多的類別作為測試集所屬類別;對測試集中的每個決策樹進行訓練,得到對應的類別;最后采用投票的方法,將訓練集決策樹輸出最多的類別作為測試集樣本所屬類別。

(6)最佳決策樹數(shù)量與最少葉子節(jié)點數(shù)確定。在保證一般事故和大事故的診斷率不小于90%的條件下,通過葉子節(jié)點含有的最小樣本數(shù)與交叉驗證誤差的關系(見圖4)和隨機森林中決策樹數(shù)量與診斷率的關系(見圖5),確定最少葉子節(jié)點數(shù)為14和最佳決策樹數(shù)量為150棵左右。

4 結果對比分析

4.1 隨機森林分析

采用隨機森林對船舶避臺失敗原因進行分析,結果見表3。

由于受樣本數(shù)量限制,小事故、重大事故和特大事故的診斷率呈現(xiàn)特殊情況:由于小事故樣本數(shù)為6,選取的測試集中未包含小事故,因此診斷失效。

由于事故等級是根據人員傷亡和直接經濟損失兩個指標劃分的,一些事故的人員傷亡指標隸屬于大事故但直接經濟損失指標隸屬于重大事故,因此最終將其確定為重大事故。

最終決策樹見圖6。由圖6可知:最終決策樹葉子節(jié)點數(shù)為14,其中一般事故、大事故、重大事故、特大事故對應的葉子節(jié)點數(shù)分別為4、8、1、1。

船舶避臺失敗的原因從主要到次要分為5個層級,一層級中有x4(船員責任感不強),二層級中有x3、x5(船員職業(yè)技能低、決策失誤),三層級中有x1、x2、x11(海務監(jiān)管不力、船舶日常管理混亂、臺風風速及影響范圍不規(guī)律變化),四層級中有x2、x5、x8(船舶日常管理混亂、決策失誤、船舶船齡長),五層級中有x3、x7(船員職業(yè)技能低、船體結構差)。

x4—x3—x11—x5—2是最終決策樹的左邊枝,x4—x5—x1—x2—5是最終決策樹的右邊枝,而x4、x5、x1、x2造成的事故后果比x4、x3、x11、x5的更嚴重;最短枝有x4—x3—x11—3、x4—x3—x1—3、x4—x5—x2—2和x4—x5—x2—3:因此,若同時存在這5類問題x1、x2、x3、x4、x5(海務監(jiān)管不力、船舶日常管理混亂、船員職業(yè)技能低、船員責任感不強、決策失誤),則極易引發(fā)船舶避臺失敗事故。

4.2 決策樹分析

根據決策樹對船舶避臺失敗原因進行分析,結果見圖7。從圖7可知:修剪后的決策樹含有35個葉子節(jié)點,其中小事故、一般事故、大事故、重大事故、特大事故對應的葉子節(jié)點數(shù)分別為1、12、15、3、4。

船舶避臺失敗的原因從主要到次要分為10個層級,一層級中有x4(船員責任感不強),二層級中有x3、x1(船員職業(yè)技能低、海務監(jiān)管不力),三級層中有x1、x2、x9、x11(海務監(jiān)管不力、船舶日常管理混亂、船舶技術狀況差、臺風風速及影響范圍不規(guī)律變化),四層級中有x2、x3、x5、x6、x7、x8(船舶日常管理混亂、船員職業(yè)技能低、決策失誤、準備工作不足、船體結構差、船舶船齡長),五層級中有x3、x5、x6、x7、x8、x9(船舶日常管理混亂、決策失誤、準備工作不足、船體結構差、船舶船齡長、船舶技術狀況差),六層級中有x5、x6、x10(決策失誤、準備工作不足、臺風路徑不規(guī)律),七層級中有x10(臺風路徑不規(guī)律),八層級中有x1、x2(船員職業(yè)技能低、船舶日常管理混亂),九層級中有x9(船舶技術狀況差),十層級中有x2(船舶日常管理混亂)。

x4—x3—x11—x5—2是最終決策樹的左邊枝(事故致因鏈),x4—x1—x2—x5—4(5)是最終決策樹的右邊枝,而x4、x1、x2、x5造成的事故后果比x4、x3、x11、x5的更嚴重;最長事故致因鏈為x4—x3—x11—x7—x6—x5—x10—x1—x9—x2—3(2)。

4.3 對比分析

隨機森林與決策樹對船舶避臺失敗事故的診斷結果對比見表4。從表4可知,隨機森林的診斷率明顯比決策樹的高,而且得到的最終決策樹的層級和葉子節(jié)點更簡潔。

綜合表4,并對比圖6、7得出以下結論:(1)在訓練樣本與測試樣本數(shù)量相同的情況下,相比于決策樹,隨機森林的平均診斷率更高,收斂性更強。(2)從隨機森林和決策樹得出的最終決策樹可以看出,隨機森林的最終決策樹更加簡明,各層級之間事故致因交叉少,更符合邏輯;而決策樹得出的最終決策樹的事故致因鏈較長,各層級之間事故致因交織在一起,邏輯結構不夠簡明。(3)船舶在防抗臺風過程中,避臺失敗事故的主要致因是人的因素。由隨機森林和決策樹得出的最終決策樹顯示,船員責任感不強是所有事故的首要致因;從最短事故鏈看,海務監(jiān)管不力、船舶日常管理混亂、船員職業(yè)技能低、船員責任感不強和決策失誤,極易引發(fā)船舶避臺失敗事故。

5 結 論

本文提出一種基于隨機森林的船舶避臺失敗原因分析方法,與決策樹相對比,隨機森林具有快速學習且不需要剪枝的優(yōu)勢。在確保診斷率的情況下,隨機森林對一般事故和大事故有良好的診斷效果。當決策樹的葉子節(jié)點為14時交叉驗證誤差最小,當決策樹為150棵左右時既能保證較高的診斷率又能提高診斷效率。最終決策樹顯示,海務監(jiān)管不力、船舶日常管理混亂、船員職業(yè)技能低、船員責任感不強、決策失誤、準備工作不足是脆弱性致因,船員責任感不強是船舶避臺失敗的導火索,其他5項(船體結構差、船舶船齡長、船舶技術狀況差、臺風路徑不規(guī)律、臺風風速及影響范圍不規(guī)律變化)為從屬致因。

參考文獻:

[1]楊威. 基于事故樹的船舶避臺失敗原因分析[D]. 大連: 大連海事大學, 2017.

[2]吳郁, 張金奮, 范存龍, 等. 基于隨機森林的船舶碰撞事故缺失數(shù)據插補[J]. 武漢理工大學學報(交通科學與工程版), 2019, 43(6): 1120-1124. DOI: 10.3963/j.issn.2095-3844.2019.06.026.

[3]WAN Yaoyi, XIA Haibo. Application of HFACS model in marine traffic accident field[J]. International Core Journal of Engineering, 2021, 7(3): 135-140. DOI: 10.6919/ICJE.202103_7(3).0019.

[4]李奕良. 基于貝葉斯網絡的干散貨船舶自沉事故致因分析[D]. 大連: 大連海事大學, 2020.

[5]賀立敏, 王峴昕, 韓冰. 基于隨機森林和支持向量機的船舶柴油機故障診斷[J]. 中國航海, 2017, 40(2): 29-33.

[6]方匡南, 吳見彬, 朱建平, 等. 隨機森林方法研究綜述[J]. 統(tǒng)計與信息論壇, 2011, 26(3): 32-38.

[7]MUTANGA O, ADAM E, CHO M A. High density biomass estimation for wetland vegetation using WorldView-2 imagery and random forest regression algorithm[J]. International Journal of Applied Earth Observation and Geoinformation, 2012, 18: 399-406. DOI: 10.1016/j.jag.2012.03.012.

[8]謝宏, 楊環(huán). 一種隨機森林與深度學習結合的室內定位方法[J]. 上海海事大學學報, 2020, 41(3): 117-121. DOI: 10.13340/j.jsmu.2020.03.019.

[9]牟小輝, 袁裕鵬, 嚴新平, 等. 基于隨機森林算法的內河船舶油耗預測模型[J]. 交通信息與安全, 2017, 35(4): 100-105.

[10]CHEN Jiangguo, LI Kenli, TANG Zhou, et al. A parallel random forest algorithm for big data in a spark cloud computing environment[J]. IEEE Transactions on Parallel and Distributed Systems, 2016, 28(4): 919-933. DOI: 10.1109/TPDS.2016.2603511.

(編輯 趙勉)

主站蜘蛛池模板: 久久青草免费91线频观看不卡| 高清国产va日韩亚洲免费午夜电影| 无码中文字幕精品推荐| 久久窝窝国产精品午夜看片| 欧美日韩国产高清一区二区三区| 欧美成人综合视频| 久久久精品无码一二三区| 国产一区二区三区在线观看视频| 免费一级大毛片a一观看不卡| 97se综合| 亚洲娇小与黑人巨大交| 国产亚洲欧美日韩在线一区二区三区| 午夜福利无码一区二区| 亚洲αv毛片| 国产美女丝袜高潮| 1024你懂的国产精品| 午夜国产小视频| 99精品国产自在现线观看| 狠狠色综合久久狠狠色综合| 成人噜噜噜视频在线观看| 毛片网站在线看| 亚洲美女久久| 精品久久高清| 精品色综合| 亚洲AV无码不卡无码| 中文精品久久久久国产网址| 国产成人精品男人的天堂| 亚洲第一在线播放| 日韩欧美高清视频| 亚洲无卡视频| 99久久精彩视频| 欧洲极品无码一区二区三区| 99久久精品国产精品亚洲| 久久伊人久久亚洲综合| 久久伊人色| 国产免费怡红院视频| 无遮挡一级毛片呦女视频| 手机精品视频在线观看免费| 国产欧美亚洲精品第3页在线| 色悠久久综合| 欧美α片免费观看| 国产91丝袜在线播放动漫| 色婷婷综合在线| 永久毛片在线播| 精品精品国产高清A毛片| 国产丝袜精品| 国产精品网址你懂的| 真实国产乱子伦视频| 免费在线色| 亚洲国产精品日韩欧美一区| 三区在线视频| 亚洲中文无码av永久伊人| 一级一级一片免费| 在线欧美一区| 四虎成人免费毛片| 成人福利在线视频免费观看| 天天操天天噜| 尤物亚洲最大AV无码网站| 亚洲欧美国产五月天综合| 国产va免费精品| 久久精品午夜视频| 狠狠亚洲五月天| 国产成人综合日韩精品无码不卡 | 亚洲一级毛片| 黄色一级视频欧美| 波多野结衣国产精品| 综合天天色| 亚洲第一成网站| 国内熟女少妇一线天| 久久国语对白| 亚洲毛片网站| 日韩精品亚洲精品第一页| 五月六月伊人狠狠丁香网| 国产在线自在拍91精品黑人| 草草影院国产第一页| 国产91蝌蚪窝| 亚洲香蕉在线| 青青草国产一区二区三区| 美女视频黄频a免费高清不卡| 日本欧美午夜| 亚洲国模精品一区| 在线免费观看AV|