孫龍龍,王其寬,施 凱,顧嘉浩,雷吉烽
(1.重慶大學管理科學與房地產學院,重慶 400044;2.中國地質大學(北京)工程技術學院,北京 100083)
建筑業是高風險行業,建筑施工現場存在的諸多安全風險因素導致安全事故時有發生,這不僅威脅著工人的生命安全,還會給企業和社會造成重大損失。據中華人民共和國住房和城鄉建設部辦公廳關于2019年房屋市政工程生產安全事故情況的通報顯示,2019年全國共發生生產安全事故773起、死亡904人,比2018年事故起數增加39起、死亡人數增加64人,分別上升了5.31%和7.62%。因此,加強建筑工程安全管理具有重大意義。國內外學者對該領域的研究一直在持續進行,涉及的研究內容包括安全風險因素識別、安全風險評估、安全事故預防以及借助建筑信息模型(BIM)、VR/AR可視化技術輔助安全管理等多個方面。上述研究表明,建筑工程安全事故的成因是復雜多樣的,各個因素之間存在相互聯系和相互作用,幾乎每個事故因果模型和相關研究都提到了包括人為因素和物理因素在內的復雜因素,它們是建筑施工現場安全事故發生的主要原因。因此,實現這個復雜因素的準確檢測與識別對建筑工程安全管理工作具有現實意義。
近年來,計算機視覺技術的快速發展為建筑工程安全管理提供了可能性。計算機視覺技術的發展被認為是一種自動識別不安全行為和不安全狀態的可靠方法。從工程的角度來看,計算機視覺技術旨在實現人類視覺系統無法執行任務的自動化,可以更加智能、高效地檢測施工現場的人為因素和物理因素,實現風險的識別與預警。同時,隨著多種數字技術和深度學習技術的發展,將這些技術與計算機視覺技術相結合,其自動化水平將會進一步提升。
盡管計算機視覺技術在處理建筑安全風險問題上具有較大的優勢,但其發展同樣存在不足及局限,同時國內外學者在該領域的研究方向較分散,缺乏對計算機視覺技術在建筑安全領域應用的綜述性研究。因此,本文基于2000—2020年間Web of Science核心合集中的相關研究文獻,借助VOSviewer文獻計量軟件對計算機視覺技術在建筑安全領域應用的研究現狀進行了綜述,并對未來的研究方向進行了展望。
本研究的文獻計量搜索主要是針對Web of Science(WOS)數據庫。WOS是綜合性文摘索引數據庫,基本可以包括某一領域的主要研究文獻,解釋該領域的研究發展方向。具體而言,文獻計量搜索主要包括以下幾個步驟:
(1) 首先在Web of Science數據庫中使用高級檢索,輸入檢索詞形式為“TS=((construction site*) AND ((safety) OR (risk)) AND ((computer vision*) OR (vision-based)))”,檢索時間為“2000—2020”,點擊檢索,初步獲得173篇文獻。(請注意,符號*用于捕獲一個關鍵字的變體,例如“computer vision”的變體有“vision system”“visual system”)。
(2) 然后根據關鍵詞、研究領域、語種(只選英文版)等方面對總體文獻進行篩選,刪除與主題不相關的文獻。篩選的主要標準是:采用計算機視覺技術、專注于建筑領域的安全風險。最終獲得166篇研究文獻。
本研究的科學計量分析是通過文獻計量軟件VOSviewer進行的。VOSviewer是一款知識圖譜分析工具,支持大規模數據處理,可以生成多種基于文獻計量關系的可視化圖譜,如作者或期刊的共引關系圖、關鍵詞共現關系圖,用以研究文獻的研究動態與熱點。常見的知識圖譜分析工具還有CiteSpace,可用于追蹤某一領域的研究熱點與發展趨勢。與之相比,VOSviewer文獻計量軟件的分析結果更適合WOS數據的分析,同時具有圖形展現方式豐富、顯示清晰、結果易于解釋等特點。
本文使用VOSViewer1.6.15文獻計量軟件作為研究分析工具,基于“數據檢索→生成可視化圖譜→可視化分析→結果討論”的研究路線,對計算機視覺技術在建筑安全領域的研究現狀與發展趨勢進行了可視化定量分析并輔以定性分析。
根據第1.1節文獻計量搜索獲得的166篇文獻,通過VOSviewer生成關于期刊來源、作者、關鍵詞的可視化圖譜。
首先按出版年份對166篇文獻進行了分析,如圖1。

圖1 不同年份研究文獻發表數量Fig.1 Number of papers published in different years
由圖1可見,從2004年起,計算機視覺技術在建筑安全領域的應用研究有了零的突破;2010年后,該領域的研究逐步引起了學者的注意,較多研究文獻開始出現,自2015年后,該領域的研究已成為熱門,這與建筑信息模型化(BIM)技術與大數據技術在建筑業內的推廣有時間上的匹配關系;尤其是2018和2019年,研究文獻發表數量暴漲,這些研究趨勢與計算機視覺技術本身的發展密不可分。在本世紀初,基于學習的計算機視覺技術開始流行,2015年基于深度學習的計算機視覺技術也成功促進了該領域的研究。
除了每年發表的文獻數量外,本文還對這些文獻的出版物來源進行了分析。在VOSviewer中,選擇引文分析,將最小文獻數和最小引用數分別設置為2和0,總共110篇文獻中有15種出版物達到了閾值。按文獻發表數量排序,取前十名的出版物及其對應的數據,見表1。

表1 出版物量化數據
由表1可知,從發文量、總引用量來看,Automation
in
Construction
期刊對計算機視覺技術在建筑安全領域研究的影響最大;Advanced
Engineering
Informatics
期刊雖然發文數量排第四,但其總引用量、均引次數及總鏈接強度均排第二,說明其論文質量較高;Computer
-aided
Civil
and
Infrastructure
Engineering
期刊雖然發文數量較少,但其均引次數高居第一,說明該期刊在該領域具有一定的影響力。進一步從期刊的質量情況來看,其中SCI期刊占比高達84%,一方面說明該領域論文質量整體水平較高,能夠較好地代表該領域最新的研究成果,另一方面說明該領域的研究處于較好的研究環境且擁有較高的關注熱度,有利于該學科的發展。作者共現分析是為了探討計算機視覺技術在建筑安全領域知識主體的研究及合作情況,明確該領域的核心作者及其合作關系,有助于全面把握該領域的研究現狀。通過VOSviewer獲得作者合作網絡圖和主要作者發文情況統計表,見圖2和表2。

圖2 作者合作網絡圖Fig.2 Network diagram of authors’ cooperation

表2 主要作者發文情況統計表
圖2顯示了該領域主要研究人員及其合作關系,其中節點大小表示發文量的多少,連線長短表示合作關系的緊密程度。由圖2可見,所有作者可以分為6個合作群體,從整體來看,合作群體相對分散,表明不同群體之間缺乏合作。
由表2可知,Lee、Li、Luo、Zhu、Han、Teizer是計算機視覺技術在建筑安全領域的主要研究作用,在2015—2020年間他們的研究熱度較高,其研究方向和內容在一定程度上反映了計算機視覺技術在建筑安全領域的研究方向。其中,Teizer等在該領域是先行者,早在2006年就提出利用智能計算和傳感技術確保施工現場安全;Lee和Han關注從人體工程學和生物力學角度對工人的不安全行為進行識別和評估;Zhu則更關注人機交互行為的識別與預測;Li和Luo在近幾年表現較為活躍,他們關注將計算機視覺技術與深度學習技術相結合,并集成多種數字技術用于提升建筑工程安全管理的效益。
通過VOSviewer對作者所在國家和研究機構做進一步分析發現,密歇根大學、華中科技大學和香港理工大學等研究機構在該領域的表現良好,且其他研究機構與三者都有著較強的聯系;美國、中國、加拿大、韓國和澳大利亞等國家的學者在該領域的表現良好,但不同國家與研究機構的學者之間的合作較少。因此,在未來的研究中,不同國家與研究機構之間應加強交流與合作,使研究成果更具實踐價值;在時間上,美國等國家涉足該領域較早,而中國在近年來后來者居上。
關鍵詞反映了論文的核心內容,并展示了某一領域研究的范圍。為了構建和映射建筑安全風險與計算機視覺技術之間的關系,使用VOSviewer獲得了建筑安全研究領域中的關鍵詞共現網絡分析圖,并進行了聚類分析。連線的長短表示兩個關鍵詞之間關系的強度,節點的大小表示關鍵詞出現的次數,不同的顏色代表通過VOSviewer聚類的不同知識領域。將關鍵詞最小出現次數設置為5,獲得達到閾值的40個關鍵詞,見圖3。

圖3 關鍵詞聚類分析圖Fig.3 Cluster analysis of keywords
由圖3可見,很明顯“computer vision”“construction”“equipment”等關鍵詞出現的頻次較高,表明計算機視覺技術被積極用于建筑安全領域;其次“construction safety”“safety”等關鍵詞也多有出現,表明建筑安全領域安全管理與計算機視覺技術正在緊密結合。根據顏色分布,可將主要關鍵詞分為3個研究主題,詳見表3。

表3 關鍵詞聚類分析獲得的研究主題表
由表3可知,通過關鍵詞聚類分析獲得的3個研究主題可概括為設備的識別與跟蹤、工人的不安全行為識別以及計算機視覺及其發展。其中,第一聚類涉及“equipment”“recognition”“tracking”等關鍵詞,說明該主題關注的是施工現場設備的識別與跟蹤,而設備的不安全狀態往往會導致安全事故的發生;第二聚類涉及“safety”“construction worker”“action recognition”等關鍵詞,說明該主題關注的是施工現場工人的安全管理,通過對工人不安全行為的識別,進而實現安全計劃與預警;第三聚類涉及“computer vision”“deep learning”等關鍵詞,說明該主題關注計算機視覺的應用,并且隨著深度學習技術的發展,計算機視覺技術也將更加智能和高效。
關鍵詞共現網絡是研究領域的靜態表示,但不能反映研究領域隨著時間的變化,VOSviewer提供了時間網絡圖,每個節點都由文獻中使用關鍵詞的平均年份來表示。圖4顯示了近4年間該領域關鍵詞的變化情況。

圖4 關鍵詞時間分布圖Fig.4 Time distribution diagram of keywords
由圖4可見,“construction”“construction safety”“computer vision”“deep learning”等關鍵詞依次出現,表明建筑領域對建筑安全更加關注,并積極與計算機視覺技術結合,深度學習技術在最近研究中成為熱點。將圖3與圖4進行對比來看,第一聚類涉及的關鍵詞發表時間大致對應2018年前后,第二聚類涉及的關鍵詞發表時間對應2017年以及之前年份,第三聚類涉及的關鍵詞發表時間對應2019年前后。
根據檢索的文獻,本文對計算機視覺技術在建筑安全領域的研究現狀及其不足進一步做定性分析,以展望未來的研究方向。
基于計算機視覺技術識別信息的準確性和可靠性是安全監督系統成功的關鍵,然而動態復雜的施工環境往往給計算機視覺技術帶來挑戰,造成許多技術局限,如光照條件、遮擋和攝像機放置等。本文檢索的文獻中,相關學者試圖通過一些方法來克服這些技術限制,其中有學者使用深度學習算法來擴展訓練數據集,以解決部分遮擋的問題;還有學者提出使用無人機代替施工現場的固定攝像機,以解決攝像機放置的空間限制。但是,這些方法仍不能完全解決技術上的局限性。因此,本文建議將多種數字技術與計算機視覺技術相結合,以增強目標特征的提取精度并克服局限性,比如傳感器、物聯網、BIM等;其次利用深度學習技術,解決施工現場數據集的問題,如Zhang等建議建立大型綜合的現場數據集,該數據集由現有數據和未來更多研究數據一同組成,逐步完善,并通過建立數據共享平臺和獎勵機制實現平臺的可持續運轉。
工人在施工過程中不佩戴個人防護設備(PPE)將會增加事故發生的可能性,因此計算機視覺技術在檢測PPE方面的研究已得到廣泛的關注。本文檢索的文獻中已經能夠檢測工人不戴安全帽、高能見度背心和安全帶的情況。需要注意的是,為了更好地確保工人的安全,對PPE的識別需要努力提升檢測精度和計算效率,如利用Faster R-CNN目標檢測算法。雖然現有研究致力于檢測未佩戴PPE的工人,但尚無研究能夠確定未用或誤用PPE的準確時間,致使對工人的預警與保護不夠及時。
整體場景信息是指施工現場所有或者大部分組成部分的信息。在安全風險管理領域,盡管計算機視覺技術在目標檢測與跟蹤方面取得了顯著的進步,但多數研究僅針對施工現場的部分個體目標進行檢測,而忽略了目標所處環境的空間邏輯關系,導致計算機視覺技術的自動化程度不高。相關研究指出,可以使用高級視覺算法提取視覺語義或者借助本體的高級信息技術解決該問題。
綜合安全監控系統是指對施工現場所有潛在的不安全行為或狀態進行監控的系統,其應包括數據的輸入、處理、結果輸出以及安全反饋,檢測的現場不安全信息要求具有全面性。現有研究中僅研究了部分安全事故類型中涉及的目標,例如機械碰撞事故中的機械(如挖掘機)和工人,然而施工現場事故類型多樣,目前尚未有較為綜合的安全監控系統來解決多種安全事故的監控。
相關研究提出的綜合安全監控系統應滿足:①面向不同的用戶,即面向不同職能、不同文化水平等情況的人員,如工人與管理人員;②面向不同的項目級別;③快速及時地反饋。邊緣計算可能滿足綜合安全監控系統的實時要求,使用先進的5G移動無線網絡可以靈活地支持各種設備和服務,實現綜合安全監控系統各部分的集成。
Automation
in
Construction
期刊在計算機視覺技術對建筑安全領域研究中的影響最大,Computer
-aided
Civil
and
Infrastructure
Engineer
-ing
期刊具有一定的影響力。(2) 通過作者共現分析發現,作者形成了6個研究合作群體,但合作群體分布分散,彼此缺乏合作;在國家層面,美國、中國、加拿大、韓國和澳大利亞等國家學者在該領域的表現良好,但不同國家與研究機構的學者之間的合作較少。因此,不同國家與研究機構之間應加強交流與合作,使研究成果更具實踐價值。
(3) 通過關鍵詞聚類分析,得出當前研究大致分為3個主題:設備的識別與跟蹤、工人不安全行為的識別以及計算機視覺及其發展。關鍵詞時間分析表明,建筑領域對建筑安全更加關注,并積極與計算機視覺技術結合,深度學習技術在最近的研究中成為熱點。
(4) 在文獻計量分析的基礎上,進一步分析了計算機視覺技術在建筑安全領域的研究現狀,并確定了未來的研究方向有:克服技術的挑戰(嘗試將計算機視覺技術與多種數字和深度學習等技術相結合)、增強個人防護設備檢測的及時性、整體場景信息的獲取以及綜合安全監控系統的設計。