







摘要:為有效識別超高層建筑的安全隱患,消除潛在危險,預防同類事故重復發生,采用隨機森林算法作為基礎學習者,在構建安全事故案例庫的基礎上,引入雙層模型構建雙層隨機森林模型,以事故信息和事故評價指標作為輸入,通過模型映射將事故整改輔助決策指標作為輸出,識別和匹配超高層建筑安全事故致因及預防措施。結果表明,雙層隨機森林模型能對事故案例進行高精度的匹配分析,并通過映射將事故輔助決策與整改意見直接進行成果應用,可為避免同類事故提供參考和借鑒。
關鍵詞:超高層建筑;施工安全事故;隨機森林模型;機器學習;案例庫
0 引言
近年來,我國超高層建筑的發展較為迅速,但超高層建筑的特殊工作環境、復雜結構特性和項目獨特性等導致安全事故頻繁、重復發生,在造成極大事故死亡率的同時,往往伴隨著巨大的直接和間接經濟損失。與此同時,由于超高層建筑的發展特性及所處的特殊地理環境條件[1],事故的發生往往對城市、經濟和社會的發展造成重大影響,安全形勢十分嚴峻。因此,研究超高層建筑施工安全事故的致因規律,建立科學的管理機制和有效的管理手段,并提高超高層建筑施工安全管理水平十分迫切。
目前,超高層建筑施工安全事故影響因素研究主要采取問卷調查及專家評分等方式從相關文獻中獲取主觀數據,并結合故障樹分析、探索性因子分析和時間序列危險性排序等方法,識別火災、坍塌、高處墜落等事故的影響因素,構建風險評價指標體系。這些研究聚焦于事故影響因素識別和風險評價體系的構建,但較少基于真實事故數據進行分析,且研究視角較為單一,缺乏對事故處理措施和事故后果控制的研究和分析。特別是針對事故頻繁、重復發生這一特性,較少提出實際指導意見和科學的整改措施,無法找出有效方法避免同類事故。
與此同時,超高層建筑施工安全事故的偶發性、突發性和事故信息的滯后性等特征,極易導致事故數據的搜集難度大、數據樣本量殘缺等情況??紤]到決策樹在致因規律研究方面的廣泛運用和隨機森林算法(Random Forest,RF)對信息殘缺樣本處理預測的高精度準確性,本研究通過廣泛搜集超高層建筑施工安全事故調查報告和事故信息,以期在構建超高層安全事故案例庫和案例特征指標體系的基礎上,通過雙層隨機森林算法決策出最終的超高層建筑施工安全事故管控措施,為項目管理提供參考和借鑒,并在安全管控方面提出相應的輔助決策與合理的整改意見,以剖析同類安全事故重復發生背后的“密碼”。
1 超高層建筑施工安全事故風險因素識別
鑒于超高層建筑的快速發展和安全事故的頻繁發生,諸多學者逐漸將研究視角轉向建筑安全風險致因問題,并取得了豐富成果,為本研究指標體系的構建提供了有力支撐。
在風險因素識別方面,Larsson等[2]在超高層建筑施工安全事故的影響因素研究中發現,在火災、高處墜落、坍塌等6種頻繁發生的事故中,火災造成的危害最嚴重。Ismail等[3]聚焦于建筑工人對事故的影響,研究發現人因是施工安全管理中影響程度最大的因素。石娟等[4]將建筑安全事故預警指標及建筑工人的不安全行為狀態分別作為輸入和輸出,基于BP神經網絡提出預警模型,以準確識別和預測工程施工中的不安全行為。Anandhababu[5]將建筑安全施工風險因素進行分類,并基于事故情況識別出包括消防隱患、心理應激因素等在內的超高層建筑安全十大風險因素。在事故指標體系構建方面,胡志雄等[6]結合高層建筑的特點分析可能發生的安全事故類型,并從人、物、環境、管理多個視角分析事故致因,建立高層建筑風險評估體系。Ona等[7]指出,建筑安全事故評價研究應關注“事故發生的可能性”,但當前一些微觀數據較難搜集。Trucco等[8]提出,不僅要聚焦于誘發事故的微觀因素,還應著眼于宏觀視角,重點關注“事故的嚴重程度”,重視項目情況和事故特征等宏觀因素[9-10],并指出宏觀指標與微觀指標間通常可以通過風險指標層級劃分得到更完整的評價指標體系。對此,張兵等[11]按照事故特征屬性、項目特征屬性和組織特征屬性三個維度進行指標劃分,并結合事故數據建立超高層建筑施工安全事故風險評價指標體系。
通過對文獻的總結歸納,本研究在事故特征、項目特征和組織特征三個維度上增加事故嚴重程度評價指標,結合所搜集的事故案例,從事故資料和事故調查報告中梳理提煉出包含事故傷亡人數、事故類型等15個描述超高層建筑施工安全事故基本特征的二級指標及分類賦值處理后的表征屬性可選值,并采用序關系分析法(G1)確定指標的權重系數,見表1。
為避免同類型超高層建筑施工安全事故,在安全管控方面提出相應的輔助決策與合理的整改意見尤為重要,而過往事故案例中的決策和整改經驗對此具有一定的指導和借鑒作用。因此,本研究采用文本挖掘技術從過往事故案例整改報告中提取事故整改措施,進行數據處理后應用于雙層隨機森林模型。
在對事故輔助決策指標進行提取時,采用python編碼并對jieba庫進行調用,對所搜集的超高層建筑施工安全事故整改報告進行分詞和詞頻統計,找出事故發生后較常采取的整改手段和措施。根據程序運行結果,統計得出在眾多事故整改報告中,高空作業、消防設施、圍擋管理、模板、施工圍擋等詞所出現的頻次較高,根據詞頻統計和對事故整改報告的梳理,分別從中提取對應的安全管理內容,如高空作業安全維護、消防設施維護、圍擋維護等8個一級指標。結合事故整改報告提取后的安全管理輔助決策二級指標見表2。
2 超高層建筑施工安全風險因素分析模型構建
2.1 指標權重計算
為避免所搜集案例指標量化結果帶來的不確定性,本文采用G1算法進行指標權重計算。作為一種主觀賦權法,G1算法在權重計算前需要先按照專家建議或一定規則對指標進行重要性排序,通過排序后可以得到單個指標與其前后指標之間的重要程度比值,計算規則為
Wk-1Wk=Rk(k=2, 3, …, m)
式中,Wk-1為指標Xk-1的權重值;Wk為指標Xk的權重值;Rk為指標Xk-1與Xk的重要性程度比。Rk的賦值按Xk-1與Xk的重要性程度確定,見表3。
確定重要性排序后,根據其逆序計算指標權重,本文所選的15個指標計算后的權重系數見表1。計算規則為
Wm=11+∑mk=2∏mj=kRj
Wk-1=RkWk(k=m,m-1,…,2)
2.2 構建雙層隨機森林模型
隨機森林模型具有高成熟度、高精度等優勢,在現階段的機器學習中應用十分廣泛,適用于很多研究背景,在事故預警和分析中也有廣泛應用。與Bagging算法類似,隨機森林模型的基本框架是將多棵決策樹進行組合并由這些決策樹對樣本進行訓練。然而,傳統的隨機森林模型在對數據建模時可能會出現過度擬合的情況。因此,為了避免模型出現較大誤差和過度擬合情況,本研究在傳統隨機森林模型的基礎上,引入雙層模型構建思路[12],新增加一層隨機森林訓練模型,對第一層模型所產生的誤差值進行建模和計算,從而提高模型精度,實現新案例與過往事故案例的匹配和輔助整改措施結果指標的輸出,實現過往事故調查報告中的輔助整改措施的匹配和直接運用。隨機森林模型研究設計如圖1所示。
在模型中,將超高層建筑施工安全事故案例數據作為訓練集,記輸入為X,通過第一層模型(Model Ⅰ)完成案例第一步映射,其輸出值為實際值的預估值。模型產生的誤差值可以根據實際值與輸出預估值計算得到,將實際值記為y,則誤差為y-。誤差值經過處理后與原訓練集組成新訓練集,再通過第二層模型(ModelⅡ)進行建模,完成案例輸入值X到誤差y-之間的映射,其輸出值即模型訓練的最終值。雙層隨機森林模型輸入輸出見表4。
3 數據分析與結果驗證
3.1 數據來源
超高層建筑施工安全事故由于其事故后果的嚴重性和極高的事故發生率,一直備受社會各界的關注,其案例信息也散落于各大新聞網頁和媒體。為保證超高層建筑施工安全事故過往案例數據的真實性和有效性,本研究主要搜集2010年以來國家及各省市住房和城鄉建設部(廳)網站、應急管理部門等政府公開信息門戶所發布的超高層建筑施工安全事故案例信息和事故調查報告,并廣泛查閱新聞媒體網頁所發布信息作為案例信息補充。各渠道信息的關注點不同,信息描述的詳盡程度也存在顯著差異,因此本研究采用文本挖掘手段,對非官方平臺的相關網站及網頁所獲取到的事故案例使用Python和計算機處理技術進行數據挖掘,提取出具有價值的事故信息。基于上述條件和指標體系,搜集到2010年以來的超高層建筑施工安全事故案例185個,案例類型包括超高層建筑火災事故、基坑坍塌、高處墜落事故等。
3.2 數據處理與模型訓練
3.2.1 數據處理與準備
在模型訓練前,需要對所搜集的案例進行數據預處理,完成數據篩選和參數設置,并完成模型訓練所需的測試案例庫的抽取和準備。
(1)數據篩選?;谒鸭降?85個超高層建筑施工安全事故案例,結合事故評價指標,剔除缺乏關鍵信息的案例45個,最終梳理構建出包含140例事故的過往案例信息庫作為本研究的過往案例庫訓練集。
(2)參數設置。為保證模型精度,需先確定決策樹數目n及節點處p的特征數兩個參數,并選取均方誤差(MSE)對模型匹配精度進行表征。即:基于案例庫,在隨機森林模型中設置多個常用參數值,根據MSE=1N∑Ni-1(oi-yi)2計算模型輸出值與案例真實值的均方誤差,結果如圖2所示。
當p=3和p=4時,不同數量決策樹的決策精度波動較大;但當pgt;4時,不同決策樹的決策精度基本一致。同時,對于p值相同的隨機森林模型,當決策樹數量ngt;300時,模型性能趨于穩定。因此,本研究設置參數為:節點特征數p=4,決策樹數量n=300。
(3)設置測試集。隨機從包含140個案例的案例庫中抽出一定比例的數據作為測試集,并將剩余數據作為訓練集及備選案例庫,以完成模型訓練和案例匹配準備工作。本研究中抽取比例為5%,命名為A5(5%),實際抽取案例7個,并編號A51~A57,將剩余的133個案例數據作為訓練集并完成模型訓練過程。
3.2.2 訓練雙層隨機森林模型
調整設定完成基礎參數值后,將所抽取備選案例庫的數據作為訓練集,并對應輸入雙層隨機森林模型的ModelⅠ中進行訓練,映射匹配得出實際案例在模型運算中的預估值。ModelⅠ中映射關系將由300棵決策樹進行表示,其中一棵決策樹的決策結果可視化如圖3所示。
該決策樹的每個節點隨機選取指標進行劃分,劃分依據為節點樣本數量,當基尼指數為0或節點樣本數量小于2時停止分支,所有節點停止分支時,決策樹停止生長。葉節點經過機器語言處理后得到單棵決策樹的預估值,模型中的300棵決策樹所得預估值經過處理后得到輸出值和誤差值,通過輸出值和誤差值繼續構建Model Ⅱ的訓練模型,兩層映射關系構建完成后,雙層隨機模型訓練完畢。
3.3 案例結果驗證
3.3.1 案例情況
經查詢案例庫可知,編號為A51的案例為南通中南匯泉國際廣場火災事件。匯泉國際廣場位于南通核心CBD,樓高277.96m,2010年5月31日下午發生火災,火勢由樓層中部向上蔓延,未造成較大經濟損失,無人員傷亡。量化后指標屬性值見表5。3.3.2 結果驗證
完成模型訓練后,將案例A51的指標代入進行測試。將案例的指標值輸入Model Ⅰ,計算得到輔助決策指標推薦率預估值。在此基礎上,將案例指標值輸入Model Ⅱ,通過映射得到誤差調整值,見表6。
預估值經過與誤差調整值處理后輸出指標推薦程度的最終值,經過模型計算后,推薦的安全管理輔助決策指標和整改意見為:加強施工場地可燃材料管理、加強焊接作業工作環境明火監管和加強施工現場易燃物品清理等,對應的指標推薦率分別為97.5%、77.9%和62.8%。
經查詢官方通報的事故信息可知,南通中南匯泉國際廣場火災事故的直接原因是電焊工在進行外部裝修切割時,未對周圍施工環境及可燃物進行細致檢查,從而導致事故發生,現場安全施工意識薄弱,未能有效落實消防安全措施。同時,裝修施工單位在外墻保溫中使用可燃材料,也是導致火災蔓延的直接原因。事故報告指出,由于疏散及時,本次火災未造成人員傷亡和較大財產損失,未造成較大火勢蔓延;相關工人在施工過程中缺乏安全意識,沒有進行安全操作,需要及時加強安全生產知識教育培訓;在施工場地缺乏完備的消防設施,未能在火災發生的關鍵時間點控制火勢,需要加強現場消防設施建設和現場應急消防培訓等。
綜上,所構建模型給出的輔助決策指標與事故實際整改意見相似,說明雙層隨機森林模型可以有效運用于對超高層建筑施工安全事故的輔助決策與整改意見的提出。在新建項目時,可以將建筑高度、建筑用途等工程基本屬性和施工單位資質情況、行政處罰數量等組織情況作為匹配指標,通過案例相似度的計算和匹配,找出最為相似的過往事故案例,得到相關的安全管理輔助決策和合理的整改意見,對新建超高層項目進行更有針對性的施工安全管理,避免同類超高層安全事故。
4 結語
通過對近年來超高層建筑施工安全事故的梳理和分析發現,其事故致因總是重復的、相似的。對此,本研究得出的主要結論有:
(1)采用集成學習算法,在進行有效的算法驗證基礎上,構建雙層隨機森林算法模型,完成事故安全管理輔助決策指標及整改措施的匹配和輸出。
(2)使用Python計算機編程,選擇sklearn.ensemble包中的RandomForesstClassifier模塊構造函數并進行參數設置,使用wx.Python第三方庫實現案例查詢階段的可視化輸入,實現模型構建。
(3)通過雙層隨機森林模型對案例進行匹配分析并通過映射將分析結果直接進行成果應用,以此為超高層建筑施工安全管理提供方法,為避免同類事故提供規避措施和建議。
參考文獻
[1]詹銳.基于隨機森林的超高層建筑安全事故案例推理研究[D].揚州:揚州大學,2021.
[2]LARSSON T J,FIELD B.The distribution of occupational injury risks in the Victorian construction industry[J].Safety Science,2002(40):439-456.
[3]ISMAIL Z,DOOSTDAR S,HARUN Z.Factors influencing the implementation of a safety management system for construction sites[J].Safety Science,2012(50):418-423.
[4]石娟,常丁懿,鄭鵬.基于BP神經網絡的建筑工人不安全行為預警模型[J].中國安全科學學報,2022,32(1):27-33.
[5]ANANDHABABU S.A study on risk assessment in construction project of an educational institution[J].Energy amp; Buildings,2014,3(23):296-298.
[6]胡志雄,錢楓,吳麗娟.高層住宅小區施工現場安全管理研究[J].建筑安全,2017,32(11):73-77.
[7]ONA J D,LOPEZ G,MUJALLI R,et al.Analysis of traffic accidents on rural highways using latent class clustering and bayesian networks[J].Accident Analysis and Prevention,2013(51):1-10.
[8]TRUCCO P,CAGNO E,RUGGERI F.A bayesian belief network modelling of organisational factors in riskanalysis:a case study in maritime transportation[J].Reliability Engineering and System Safety,2008(93):823-834.
[9]王興鵬,雷書華,劉文梅.基于CBR的地鐵工程事故應急決策方法研究[J].鐵道工程學報,2018,35(9):104-109.
[10]吳超,王秉.行為安全管理元模型研究[J].中國安全生產科學技術,2018,14(2):5-11.
[11]張兵,詹銳,關賢軍,等.基于CBR的超高層建筑施工安全事故研究[J].土木工程與管理學報,2019,36(6):92-98.
[12]邢書豪,高廣玲,張智晟.基于雙層隨機森林算法的短期負荷預測模型[J].廣東電力,2019,32(9):160-166.
PMT
收稿日期:2022-10-17
作者簡介:
張兵(1983—),男,博士(后),副教授,研究方向:項目管理、建筑安全。
盧倩(通信作者)(1997—),女,研究方向:建筑安全。
詹銳(1996—),男,助理工程師,研究方向:建筑安全。
於亞輝(1985—),男,高級工程師,研究方向:項目管理。