999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于控制語句自動獲取的建筑工程質量表象與對應原因分析*

2022-11-09 05:56:54張明媛劉運鵠周光毅
施工技術(中英文) 2022年20期
關鍵詞:規范文本混凝土

張明媛,賀 凱,劉運鵠,周光毅

(1.大連理工大學建設工程學部,遼寧 大連 116024;2.中國建筑第八工程局有限公司東北分公司,遼寧 大連 116021)

0 引言

建設工程項目的質量安全水平對我國國民經濟發展與人民生活幸福具有直接影響。由于建筑工程行業固有的危險性,質量安全事故頻繁發生,使國家財產遭受巨大損失,人民生命安全遭受巨大威脅[1]。以2020年12月應急管理部公布的6起建筑施工領域質量安全事故典型案例為例,6起事故共造成77人不幸身亡、68人受傷。建筑工程質量問題是現今工程事故研究分析中的重要命題。因此,有必要深入研究建筑工程質量。

GB 50300—2013《建筑工程施工質量驗收規范》作為指導建設單位、施工單位、監理單位等多個項目參與方完成工程驗收的規范性文件,從質量驗收規范入手開展研究是有效減少工程質量事故的基礎,能從質量監管角度為建筑業高質量發展做出貢獻[2]。建筑工程質量管理在一定程度上能預防質量事故的發生,但現有質量驗收規范中的控制語句未經過系統分類整理,如何從海量建筑信息中較為快速、準確地定位質量問題產生原因,特別是,目前的質量原因分析過程是由專家閱讀質量報告的方式進行推斷,如何將這一人工過程進行自動化實現,并將質量表象問題與背后的施工技術方案進行對應,從施工源頭查找質量問題產生原因,提高管理效率并及時為其他工程實施提供技術方案的優化參考,保障施工質量,避免施工問題發生,是當前建筑質量管理領域所面臨的重要問題。

Zhang等提出基于自然語言處理與本體技術的信息轉換方法,即利用建立好的語義映射規則和沖突解決規則將建筑規范的部分章節轉換為可用于規范檢查的邏輯句子[3];Le等提出了基于規則的合同風險自動提取模型,并將其應用于建筑信息的檢索研究中[4];胡海盟利用自然語言處理技術對建筑工程質量驗收規范進行預處理,并使用正則表達式完成抽取分析[5];胡云忠等基于本體,開發出工程質量管理規范檢索系統[6];魏然等實現了自然語言設計規范條文向計算機語言的轉換,為建立基于BIM的建筑專業施工圖合規性自動審查系統奠定基礎[7]。現有工程質量自動化實現研究內容具有以下共性:①一般自動化研究方法基于設計、施工圖紙合規性審查等展開,針對建筑工程質量原因分析的自動化研究較少;②均圍繞建筑信息展開,各類自動化實現方法仍停留于理論研究層面,缺乏對實際工程中質量檢查工作環節的指導。

為彌補工程質量原因自動化分析研究應用的空白,本文結合Python等數據挖掘工具,構建建筑工程施工質量控制語句庫。結合實際工程質量檢查報告文本文件,依據報告中質量問題出現頻次及頻率,將梳理出的15類質量問題表象集中劃分為滲漏、裂縫、外保溫問題3項子類,并通過實際工程項目施工質量檢查情況,總結質量問題表現形式,即質量問題表象;建立問題表象-質量控制語句對應關系,為后續自動化實現質量文本分析提供關系模型。

為建立工程質量問題產生原因與質量問題表象的正確對應關系,本文邀請業內技術質量專家進行訪談,建立質量控制語句與質量問題表象關系庫。質量問題的發生是由于未遵守某些質量規范所表述的工作內容。以從質量規范中提取的質量控制語句為基礎,將質量問題對應的技術措施分解到分部分項工程,既能明確質量問題的產生原因,同時又能明確未來工程施工質量管理工作中需重點加強監管的細節,從原因分析和操作控制兩方面共同提升工程質量管理效率。技術路線如圖1所示。

圖1 技術路線

1 質量驗收規范文本集建立

1.1 質量驗收規范集建立

結合本文實際研究對象——混凝土結構建筑工程,規范內容的選擇以混凝土結構分部分項工程為主。規范文檔不局限于GB(國家標準)正式文件,本文將GB/T(國家標準/推薦)、JGJ(建筑工程行業建設標準)、JGJ/T(建筑工程行業建設標準/推薦)也納入規范集的數據收集與建立過程。最終共選取GB 50204—2015《混凝土結構工程施工質量驗收規范》等35部相關工程規范,建立質量驗收規范集。

1.2 質量驗收規范文本格式轉換

由于獲取的建筑工程施工質量驗收規范均為PDF格式,且包含計算機無法識別的水印及圖片信息,因此,需進行驗收規范文本格式轉換。同時為降低無關文字對文本處理精度的影響,在轉換過程中將英文摘要、英文目錄等信息人工刪除。經高精確度的文本識別轉換后,各質量規范條文轉變為計算機可二次處理的TXT格式,為質量驗收規范文本處理工作提供便利。

2 質量驗收規范文本集處理

2.1 jieba分詞

jieba中文分詞庫作為Python第三方中文分詞庫,利用中文分詞庫確定各漢字間的關聯程度,將關聯程度較大的漢字組成詞語,生成分詞結果。jieba分詞共支持3種分詞模式:精確模式、全模式、搜索引擎模式[8]。3種分詞模式特點及適用范圍如表1所示。

表1 3種分詞模式特點及適用范圍

精確模式能實現對語句最精確的切分且不存在冗余數據,適用于高精度的文本分析工作,符合本文的文本處理要求。因此,使用jieba分詞精確模式,完成質量驗收規范文本分詞操作。

2.2 去停用詞

停用詞是指在信息檢索過程中,為實現提高工作效率及節省存儲空間的目的,在對文本進行分析處理前過濾對文本內容影響較小的字詞及符號等,被提前過濾掉的內容稱為停用詞。

在通用的“哈爾濱工業大學停用詞庫”“四川大學機器學習實驗室停用詞庫”“百度停用詞表”等基礎上[9],根據實際需要,添加“建設工程、規劃”等建設領域通用但與質量問題關聯度不高的詞匯,形成本研究使用的停用詞表,如表2所示。

表2 停用詞

2.3 關鍵詞提取

在自然語言處理中,關鍵詞作為表述文本中心思想的詞語,常被用于檢索文本信息、文本系統分類等工作。關鍵詞提取是文本信息挖掘的領域分支,其對文本檢索、摘要生成、情感分析、文本聚類等研究提供便利。關鍵詞的精準與否將對規范語句處理效果產生直接影響。

從計算機算法角度來看,關鍵詞提取算法共分為兩類:有監督關鍵詞提取算法、無監督關鍵詞提取算法。有監督關鍵詞提取算法需人工標注語料庫,通過訓練學習等多種方式判斷詞語的重要程度;無監督關鍵詞提取算法無須以人工方式標注訓練集,提取效率高,但提取效果與有監督算法相比較差。由于有監督算法需耗費高昂的人工成本,因此,選擇適用性較強的無監督關鍵詞提取算法。

TF-IDF作為常用的無監督關鍵詞提取方法,基于統計學原理,將詞頻(TF)與逆向文件頻率(IDF)進行相乘,產生并保留高頻詞匯,從而獲取規范文本關鍵詞,具備操作簡單、詞頻統計嚴謹的特征。計算如式(1)~(3)所示[10]:

(1)

(2)

TF-IDF=TFw·IDFw

(3)

該方法使用優勢明顯,經算法分析后,詞語的重要程度與出現次數成正比,與詞語在語料庫的出現頻率成反比,區分能力較強,適合文本分類。綜上,采用TF-IDF法提取質量驗收規范文本關鍵詞,用于后續規范語句處理工作。

3 質量控制語句獲取

3.1 質量控制語句提取

質量驗收規范由大量質量控制語句構成,共同保障工程施工質量。作為規范文本的核心內容,在已獲取關鍵詞的基礎上,使用re正則表達式,實現控制語句提取。

正則表達式是對字符實現規則操作的邏輯公式,使用前需事先完成規則字符串的構建。其能對1個或多個規則字符串進行文本搜索匹配,獲取用戶需要的文本內容,具有邏輯性強、靈活度高、功能性好的特點。re模塊作為處理正則表達式的模塊,二者共同為質量控制語句提取工作提供技術支撐。

目前,Python中常用處理正則表達式匹配的有search,split,sub,findall等函數,具備實現字符串的查找匹配、分割、替換等功能。其中findall函數能在文本中獲取所有匹配的規則字符串,并以列表形式輸出對應結果。該函數工作原理正適用于提取質量控制語句,因此使用re.findall完成質量控制語句提取。

3.2 質量控制語句分類

建筑工程施工工序包含大量分部工程,每個分部工程中又涵蓋了更為細致的分項工程。各分項工程的精確劃分直觀展現出建筑物施工技術流程,能使專業施工與管理人員更有針對性地完成工程施工與質量驗收工作,保證建筑物施工質量良好。

利用re正則表達式,將質量控制語句依據分部分項工程進行分類梳理,為質量問題分析提供便利,能實現質量問題產生原因的快速分析。經過對規范文本中的全部信息進行初步篩選,剔除與規范文本關鍵詞關聯度不高的語句,并在此基礎上對控制語句進行分項工程分類,形成質量控制語句庫,有效減少質量控制語句基數數量。將分類后的語句應用于后文專家訪談環節,依據分項工程分類結果,專家可優先對與質量問題關聯度高的分項工程開展分析,提高原因分析工作效率與結果準確度。

4 實證分析

混凝土結構建筑主要承重構件為鋼筋混凝土,具有堅固耐久、承重能力強、消耗建材少、投入成本低等特點,是當下最普遍且常用的建筑結構形式[11]。鑒于混凝土結構建筑的普適性與常見性,選擇混凝土結構建筑開展質量問題實證分析。

4.1 混凝土結構建筑工程質量驗收規范文本集的建立與處理

根據第1,2節所述方法,共選取35部工程規范建立質量驗收規范集,使用Python 3.7編寫jieba分詞、去停用詞與TF-IDF關鍵詞提取方法的代碼。運行程序后總結提取出“混凝土、澆筑、鋼筋、施工、模板”5個文檔關鍵詞。

4.2 混凝土結構建筑工程質量控制語句獲取

在獲取文檔關鍵詞的基礎上,編寫re正則表達式代碼實現質量控制語句提取與分類操作。將質量控制語句依據混凝土結構分部工程進行分類,劃分為鋼筋工程、混凝土工程、模板工程、現澆結構工程、預應力工程、裝配式結構工程6項分項工程。

經程序運行及結果整理,共提取質量控制語句398條。其中,鋼筋工程83條,混凝土工程213條,模板工程66條,現澆結構工程6條,預應力工程17條,裝配式工程13條,分類結果如表3所示。

表3 混凝土結構建筑工程質量控制語句分類結果

經篩選后獲取的質量控制語句存在數量過多、精度不高的缺陷,為進一步提高語句提取精度,利用文檔關鍵詞進行二次提取。以混凝土工程為例,第一次提取分類結果共獲取213條語句。基于此分類結果,使用“澆筑、鋼筋、施工、模板”4個關鍵詞進行二次提取。

程序運行后,混凝土工程第二次語句分類結果共獲取136條語句,相較首次提取結果共計過濾77條語句,有效實現精度的提升。以此類推,分別對其余5項分項工程分類結果進行二次提取,共獲取241條語句。

上述操作能有效減少語句基數數量,建立的質量控制語句庫實現了從繁雜的文本集中篩選出與規范文本關鍵詞關聯度較高的語句的目的。

4.3 混凝土結構建筑工程質量問題表象梳理

選取37家工程單位的63份混凝土結構建筑工程質量問題報告作為分析樣本,運用統計學方法對其質量問題完成初步分析,具體質量問題及頻率統計如表4所示。

表4 混凝土結構建筑工程質量問題梳理及頻率統計

研究發現,滲漏與裂縫問題在工程質量問題中占比高達56%。滲漏與裂縫問題將對建筑物后期使用功能產生較大影響,作為工程質量問題的頻發項目,需持續跟蹤檢查,加強質量風險管理。

地下室是典型的混凝土結構建筑工程。地下室常見的工程質量問題集中在因混凝土結構裂縫、接縫相關原因導致的滲漏、裂縫。結合質量檢查報告,匯總整理多個項目存在的地下室滲漏問題表現形式,如圖2所示。

圖2 混凝土結構建筑工程質量共性問題

4.4 地下室滲漏質量問題產生原因分析

以地下室滲漏問題為例,結合已建立的質量驗收規范集,探討由于混凝土結構存在裂縫、接縫等情況導致地下室產生滲漏問題的原因。邀請業內5名技術質量專家進行地下室滲漏質量問題訪談,包括總工程師1名、質量總監2名、技術負責人2名。根據已建立的質量控制語句庫,專家從中遴選出與地下室滲漏質量問題產生關系最為密切的若干控制語句,將控制語句與質量表象產生的背后原因建立關聯。至此,建立了一套地下室滲漏的“質量控制語句(質量規范)-質量表象(滲漏)-質量問題原因”的對應關系自動化檢測條目。根據專家訪談結果,地下室滲漏質量問題可能由101項原因造成,如表5所示。

表5 地下室滲漏質量問題產生原因

研究結果表明,地下室滲漏質量問題的發生是多個分項工程因素共同作用的結果。其中,混凝土工程施工對地下室滲漏問題的影響最為顯著,從混凝土材料生產、運輸澆筑、現場施工管理、施工縫后澆帶留設、澆筑振搗養護及冬期施工等多角度出發,共歸納70項具體原因。由于所選取的施工規范關注于混凝土主體結構工程澆筑過程產生的裂縫,故對防水層等材料施工過程造成的裂縫暫未考慮。

4.5 小結

1)以地下室滲漏為例進行質量問題原因的文本分析研究,其他工程質量問題原因分析過程與之相似。通過建立“質量規范(質量控制語句)→質量問題表象→質量問題原因→質量控制(質量保障規范技術措施)”這一閉環的自動化質量分析框架,可形成工程質量“表象-原因”關系庫,為最終真正實現大規模的基于人工智能的工程施工自動化質量檢測、分析與預防提供基礎。

2)對比國內同領域研究成果,胡云忠等基于本體,針對建筑質量管理規范進行建模研究[6],在一定程度上完成規范文本整理工作,而本研究實現規范文本自動化處理,能夠在短時間內篩選處理大量質量驗收規范文本數據,提升文本挖掘效率;潘杏等提出基于LDA的地鐵施工安全隱患排查要點挖掘方法[12],運用自然語言處理技術歸納整理出34項安全隱患要點,而本研究以地下室滲漏為例,總結6類101項潛在原因,分析結果更為全面,且與工程實際控制標準相關,彌補實際工程質量檢查環節應用的空白。

3)提出的研究方法框架,不僅適用于地下室滲漏質量問題,同樣適用于建筑工程項目中其余質量問題。借助計算機Python編程手段,實現大規模、自動化處理質量規范文本,有效提高語句獲取效率。在此基礎上,探尋具體質量問題與其誘發原因之間的關聯,深入挖掘各質量問題背后的潛在原因,將質量管控提前至實施前期,避免或減少工程質量問題帶來的損失。

5 結語

通過自動化提取控制語句的方式,建立了質量控制語句庫。同時,依據實際工程質量檢查報告,歸納梳理了質量問題表象。借助專家訪談方式,構建質量控制語句庫與質量表象間的關聯,探尋質量問題背后的產生原因。從而形成了一套較為完整的工程質量問題分析框架,為實現自動化、高效地開展質量原因分析和質量管控工作提供全新的思路。

1)依據各分項工程提前加以劃分,借助Python編程,將與實際工程質量問題具有強相關性的分項工程語句進行自動化篩選、歸類,能有效減少質量控制語句庫中語句數量,達到精煉語句庫的目的。解決了現有工程規范涵蓋多種分部工程,語句數量較多且種類繁雜的問題。從而進一步提升質量問題原因分析的工作效率與結果準確度,實現較為快速、準確地定位質量問題產生原因的目的。

2)利用提出的“質量規范(質量控制語句)→質量問題表象→質量問題原因→質量控制(質量保障規范技術措施)”自動化質量問題原因分析框架,以地下室滲漏質量問題為例開展實證分析。通過將這一框架應用于其余工程質量問題,能逐步建立起更加全面的工程質量問題“表象-原因”關系庫,優化質量管控與監督體系,提高工程質量管理水平,彌補實際工程質量檢查環節暫未使用自動化方法的空白。

本研究對實際工程施工環節的考慮并不全面,如未充分研究地下室滲漏質量問題中由于外設防水層施工而產生的裂縫。在后續“表象-原因”關系庫的建設中,將不斷豐富完善各類質量問題。同時,為進一步提高工程質量問題的分析效率,也將繼續優化質量控制語句語義分析和質量問題產生原因判定方法,最終實現基于施工技術文件的質量問題自動化檢查與分析過程,為“雙碳”需求下的智慧施工提供質量保障。

猜你喜歡
規范文本混凝土
混凝土試驗之家
現代裝飾(2022年5期)2022-10-13 08:48:04
關于不同聚合物對混凝土修復的研究
來稿規范
來稿規范
PDCA法在除顫儀規范操作中的應用
來稿規范
混凝土預制塊模板在堆石混凝土壩中的應用
在808DA上文本顯示的改善
混凝土,了不起
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
主站蜘蛛池模板: 99国产在线视频| www.亚洲一区| 青青青草国产| 国产成人精品午夜视频'| 无码中文字幕乱码免费2| 无码国产伊人| 国产在线精彩视频论坛| 亚洲精品波多野结衣| 国产精品yjizz视频网一二区| 91久久偷偷做嫩草影院| 91麻豆久久久| 天天色天天综合| 国产人人射| 国产一二三区视频| 国产成人精品三级| 偷拍久久网| 欧美成人h精品网站| 黄色a一级视频| 91精品国产一区自在线拍| 大陆国产精品视频| 无码高潮喷水专区久久| 91av成人日本不卡三区| 国产天天射| 国产精品理论片| 91视频国产高清| 久草网视频在线| 美女一级免费毛片| 国产精品永久久久久| A级全黄试看30分钟小视频| 午夜福利亚洲精品| 美女扒开下面流白浆在线试听 | 精品少妇人妻一区二区| 国产xxxxx免费视频| 亚洲—日韩aV在线| 亚洲欧美在线综合一区二区三区| 欧美日韩91| 国产在线日本| 精品国产福利在线| 国产精品私拍在线爆乳| 免费在线看黄网址| 强乱中文字幕在线播放不卡| 国产欧美一区二区三区视频在线观看| 无码中文字幕精品推荐| 久草视频精品| 欧美成人国产| 操国产美女| 99热这里都是国产精品| 色婷婷成人| 国模沟沟一区二区三区| 亚洲熟妇AV日韩熟妇在线| 久久视精品| 国产91线观看| 亚洲欧美一区二区三区蜜芽| 日本一区二区不卡视频| 欧美日韩另类国产| 91精品久久久久久无码人妻| 精品少妇人妻无码久久| 精品欧美视频| 久久综合干| 国产一区二区三区视频| 国产精品久线在线观看| 大陆精大陆国产国语精品1024| 国产成+人+综合+亚洲欧美| 亚洲成年人网| 亚洲AV无码乱码在线观看裸奔| 午夜天堂视频| 久久精品这里只有国产中文精品| 亚洲AV无码久久精品色欲| 国产一区亚洲一区| 亚洲福利片无码最新在线播放| 成人福利在线视频免费观看| 久久特级毛片| 亚洲h视频在线| 国产欧美视频在线观看| 亚洲天堂视频网| 久久精品丝袜| 国产精品入口麻豆| 国产精品偷伦在线观看| 欧美成人午夜在线全部免费| 久久鸭综合久久国产| 久热中文字幕在线观看| 欧美国产精品不卡在线观看|