999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

建筑基本周期多因素機器學習預測模型

2024-02-25 01:28:14宋穎豪王澤濤
工程力學 2024年2期
關鍵詞:特征建筑模型

陳 雋,宋穎豪,王澤濤

(1.同濟大學土木工程學院,上海 200092;2.土木工程防災國家重點實驗室,同濟大學,上海 200092)

建筑物的基本周期是建筑結構最重要的動力特性,綜合反映了結構的剛度、質量及其分布情況,在設計階段的荷載估計、參數化建模,以及使用階段的結構健康監測、實際性能評估等方面,都有十分重要的用途。例如,結構基本周期決定了地震下頻譜加速度/地震影響系數[1-2],影響基底剪力設計值;已建結構健康監測系統設計時基本周期的預估,周期的變化也往往預示著結構中系統性損傷的發生與演變[3];城市區域抗震分析中,建筑物周期是參數化建模的核心變量[4]。

面向設計階段對建筑周期快速預測的需要,以及無實測條件時已建建筑物特性評估的需求,學者們提出了大量的結構基本自振周期經驗預測模型[5-7]。然而,受傳統的指定函數后擬合回歸建模手段的限制,目前大多數預測模型僅含有單因素(如建筑高度或層數等),再通過對結構形式或材料進行分類的方式反映其他因素的影響,回歸模型形式大多如:

式中:T為基本周期;H為高度。但是,大量實測數據表明:除高度、材料以外,建筑物結構形式和功能、基礎類型、地域等因素對于周期的影響也不能忽視。

近年來,機器學習方法因其強大的數據特征提取能力和處理大規模數據的優勢,作為一種新型建模手段備受關注。例如,基于生成對抗網絡的方法研究主余震下結構的破壞機制[8]、基于決策樹和人工神經網絡等方法建立砌體填充混凝土框架的基本周期預測模型[9]、基于BP 神經網絡的RC 框架結構地震易損性曲面分析[10]。上述工作基于機器學習方法得到了有價值的成果,也展示了用于建筑基本周期預測的可行性,但還存在如下需要解決的問題:① 由于實測數據獲取困難,現有機器學習模型大多基于數值模擬的數據進行訓練,如果要包含多因素影響,特別是語義型因素,必須基于既有建筑的實測數據來建立新模型;② 預測模型的輸入參數在結構初步設計階段難以獲取,因此,新模型應使用容易確定的結構參數,并應允許部分輸入參數缺失;③ 模型的超參數調節和模型選擇過程需要人工參與,難以隨著數據量的增加實現模型的高效、動態更新,因此,新模型應具有對新增數據的自學習能力,以及對新型機器學習算法的自適應能力。

針對以上關鍵問題,本文收集了公開文獻中大量的建筑周期的實測數據,并建立了數據庫。在此基礎上,以新興的AutoML(Auto Machine Learning,自動機器學習)技術建立基本周期預測模型,可利用結構初步設計階段全部或部分已知信息作為輸入參數,預測建筑結構的周期。最后,分別采用本文模型、現有規范模型和文獻建議公式對未參與訓練過程的500 多棟實際建筑進行了周期預測,并對結果進行了對比分析。

1 實測結構周期數據庫

1.1 數據來源

建筑物基本周期的數據來源分為實測數據和模擬數據。由于數值模型與實際結構顯然存在差異,難以反映真實的建筑物周期,本研究只選用實測數據進行分析。作者在文獻[5]中報告了實測周期數據收集的詳細過程和結果,為全文完整性,本節做簡要說明。

研究采用從大量公開發表的文獻和書籍中檢索建筑物基本周期(及其相關信息)的方式,截至本文撰寫時,已經完成了上萬篇論文的檢索,并建立了原始數據庫。進一步,采用查重、離群點檢驗等手段進行數據清洗,形成用于建模分析的可靠數據庫。其中,由于不同文獻中可能存在相同的建筑,通過比較位置、結構信息和名稱等可識別重復的建筑。此外,由于研究角度的差異,不同文獻中對同一建筑的描述信息不同,綜合多篇文獻的內容可實現信息補全。

本文分析的主要數據來源于文獻[7, 11 - 29],其他僅包含單條數據的文獻,由于數量眾多,不一一列舉。主要數據來源和建筑數量情況見表1。

表1 主要建筑周期信息數據庫來源及相關信息Table 1 Main buildings period information database sources and related information

1.2 數據特征說明

經數據收集與數據清洗后,目前數據庫包含2561 條記錄。雖然在收集數據時已盡可能全面地收集建筑信息,但不同數據來源所包含的信息完整性會有差別,因此在選擇用于機器學習的建筑特征(如材料、抗側力體系、功能等)時,既要關注它們與基本周期的相關性,也需考慮數據庫中包含對應特征的有效記錄數量。

結合已有研究的成果,本研究初步從數據庫中篩選出了16 個能夠影響到建筑物周期的特征,并將其歸為分類型(即語義型)和數值型兩大類,具體見表2。表2 和圖1 同時給出了在2561 條數據中,16 個特征各自的有效數據量比例。可見,包含“抗側力體系”“材料”“高度”及“所在國”四個特征的數據均超過了70%。此外,“基礎深度”的有效數據量最小,為8.9%,但也有228 條。以往研究中,文獻[12 - 13]的預測模型分別用到287 條和574 條,文獻[15]用到244 條。因此,認為初篩的建筑特征的最低有效數量滿足建模要求。

圖1 不同特征的有效信息占比Fig.1 Percentage of valid information of different factors

表2 特征類型及具體特征Table 2 Feature type and specific features

收集數據過程中,分類型數據的“值”(文本)盡量遵照原文描述,如抗側力體系中的“框架”“框架剪力墻”等,這可能導致某些分類值所對應的數據偏少。若將此類數據直接用于訓練,機器學習模型容易對這些分類值的特征產生過擬合。為此,需要對語義型特征的分類值進行聚合操作,即合并某一種特征中相近的分類值。由于“材料”和“平面形狀”兩特征在聚合前,其分類值所對應的數據量就比較多,因此將聚合前的數據作為其補充信息用于模型訓練,其余的分類型特征則僅保留聚合后的特征數據。對于目前數據量很小且難以與其他分類值聚合的情況,如圖2抗側力體系的“核心筒”“框架-核心筒”“框架-砌體承重墻”分類以及圖3 材料中的“木材”“砌體+木材”分類,統一聚合為對應特征的“未知類型”。一方面,解決數據量小不利于模型訓練的問題;另一方面,提升模型包容未來新增其他類型的能力。表3 為聚合完成后,模型具體的分類型輸入特征。

圖2 抗側力體系數據分布情況Fig.2 Data distribution of lateral force resisting system

圖3 材料數據分布情況Fig.3 Data distribution of material

表3 分類型特征輸入Table 3 Input of classified features

2 基本周期自動機器學習預測模型

2.1 數據填充

不完整性是大數據的重要特點,本文問題中體現為并非每條數據都包含全部上述16 個特征信息,用于模型訓練前還必須進行填充處理。本研究針對分類型和數值型兩類記錄,采用了不同的填充方式,具體為:

1) 分類型特征填充。采用缺失值處理為對應分類型特征中的“未知類型”的方式進行填充[32]。表4 展示了分類型數據的缺失示例(表4 中的“[未知類型]”表示缺失值及其填充處理)。

表4 分類型數據填充示例Table 4 Classification data filling example

2) 數值型特征填充。表5 為數值型數據填充示例,對于缺失值分別嘗試了常用的中位數、平均數和眾數填充,對比表明最終模型的預測效果相差不大。因此,后續分析中均采用了中位數填充。

表5 數值型數據填充示例Table 5 Numerical data filling example

填充好的2561 條數據再分為訓練集(1844 條)、驗證集(205 條)和測試集(512 條)3 部分,分別用于后續模型訓練和測試。

2.2 基于AutoML 的預測模型

選擇合適的模型并進行訓練調參,是傳統機器學習任務中不可避免、十分繁瑣但非常重要的一個環節,需要嘗試多次并且依賴一定的經驗才能得到性能相對優秀的模型。當數據量增加后,往往還需要重新進行模型的調參優化,使用不便。

考慮建筑物類型會不斷變化及實測數據會不斷增加的需求,本研究采用了AutoGluon[32]策略來實現自動學習,此方法的基本思想類似于采用基函數的線性組合來逼近復雜函數,通過融合多個未進行調參的簡單模型來提高最終模型的性能,稱為stacking(堆疊)方法。

本研究采用目前常用的三類機器學習模型:BP 神經網絡、XGBoost[33]和LightGBM[34]作為“基模型”,并預先設置每類模型的超參數選擇空間。以BP 模型為例,隱藏層有3 層(可取50×40×30、100×80×60、300×200×100 三種,數字為每層神經元數)、二層(200×100)或一層(100、1000)三種選擇;3 種激活函數(Relu、Tanh、Softrelu)、學習率在10-5與10-2之間、5 種計算輪次(100、200、300、400、500)、神經元丟失(dropout)概率在0 與0.5 之間。隨后,對每類基模型在其對應的參數空間內隨機選取N組超參數,可得到3×N個模型,構成底層學習器,本研究將N取為20。此外,為了節約資源AutoGluon 會提前終止預測精度不再隨訓練而顯著提升的底層學習器,以便為其他底層學習器釋放計算資源。

利用訓練集和驗證集數據對底層學習器中的每個模型進行訓練,訓練好的模型在訓練集和驗證集上的周期預測結果連同對應的真實值,組成新的訓練集和驗證集,分別是[1844, 61]和[205, 61]的數組(其中61 列=3 類×20 列預測值+1 列真實值)。最后,利用新的訓練集和驗證集對一個線性回歸模型進行訓練,獲得最終的模型。該線性回歸模型的輸入是前3×N個模型的預測值,輸出是這些值加權平均后的結果。

圖4 是AutoGluon 融合建模的全過程。整個建模過程中,超參數的選擇、單個模型的訓練都無須人工介入、無須先驗經驗。由于底層學習器中的每個“基模型”自身比較簡單,其訓練成本不高且可并行完成,模型的計算效率很高。當有新的數據加入或者有更好的“子模型”出現,重復上述建模步驟重新訓練即可完成模型的更新和功能提升,實現數據驅動的模型自動學習。

圖4 模型建立流程Fig.4 Model establishment process

2.3 AutoML 預測模型性能對比

為了證明AutoGluon 算法的有效性,將融合模型結果與僅使用底層學習器的結果作了對比。表6 為模型的預測性能的排序,按照512 條測試集數據上的RMSE 從小到大排列,受篇幅限制只比較了融合模型和4 個最優的底層學習器的預測精度性能和預測時間成本。結果顯示,融合模型的預測精度(RMSE)最好,特別是在模型訓練中未接觸過的測試集上。同時,相較于底層學習器,融合模型的預測時間也非常小。

表6 不同機器學習模型性能對比Table 6 Performance comparison of different machine learning models

此外,AutoGluon 預測模型中包含2.1 節中的數據填充功能,模型使用時就可將結構在初步設計階段尚未明確的參數(如平面形狀、基礎類型、基礎深度等)作為“未知類型”輸入,從而顯著提高模型的適應性。因融合模型的預測是底層學習器加權平均后的結果,其預測需在底層學習器預測之后才能計算,所以預測時間高于底層學習器,平均下來每次預測在0.01 s 以內,是可以接受的。

訓練數據時除了將數據劃分為訓練集和驗證集這種簡單交叉驗證方式外,還可采用k折交叉驗證。k折交叉驗證的步驟如下:

1) 將樣本分為k個大小相等的樣本子集;

2) 依次遍歷這k個子集,每次把當前子集作為驗證集,其余所有樣本作為訓練集,進行模型的訓練和評估;

3) 最后把k次評估指標的平均值作為最終的評估指標。

本研究分別嘗試了5 折交叉驗證以及10 折交叉驗證,結果發現采用交叉驗證后訓練時間增加了數十倍,且在測試集上的預測精度也沒有明顯提升,RMSE 分別為0.3585、0.3598。因此本研究采用簡單交叉驗證的方法進行訓練。

3 特征指標重要性的量化分析

1.2 節中初步選擇了16 個影響周期的特征,傳統上可進一步采用方差分析、卡方檢驗、最大信息系數等方式,分析其中是否存在冗余特征或不相關特征。利用已經建立的融合模型,也可以通過置換重要性[35]的方式來量化分析各特征參數的重要性,具體方法如下:

1) 將順序正確的驗證集數據輸入已經訓練好的預測模型,得到預測結果。

2) 將驗證集數據中某一特征對應的某列數據隨機打亂后輸入預測模型,得到預測結果。重復M次。

3) 比較每次數據打亂前后模型的預測結果,如均方誤差RMSE 的差異。

4) 對其他特征參數重復上述步驟。

以“高度”特征為例,將205 條驗證集記錄的高度值隨機打亂后輸入預測模型,由于高度信息是錯誤的,預測誤差應增大,誤差增大的程度可用來量化“高度”特征的重要性。若誤差不變或減小,說明該特征對于預測模型無效或有害。為了減小計算偶然性,對205 條驗證集數據的每列數據都進行了100 次順序打亂,最終計算結果如表7 所示,其中P值表征特征無效的概率。例如,P值為0.01 表示有1%可能性,該特征對建立模型是無用的或有害的。

表7 特征重要性及相關參數Table 7 Feature importance and related parameters

表7 顯示:高度、所在國、地上層數、材料和抗側力體系五個特征重要性程度高,除去“所在國”,其余特征與以往研究認識相同。對于“所在國”特征,由于過往研究的數據大多集中于某一地區,地域因素的影響未受到重視。由于“所在國”特征暗含了設計規范、經濟水平等因素,值得隨著數據的增加進一步關注,文獻[36]也提出,中國規范《高層建筑混凝土結構技術規程》(JGJ 3-2010)中對于高層建筑的劃分顯著地影響到了建筑的基本周期。重要性排在最后四位的特征為:平面形狀、地下層數、基礎深度和基礎類型,可以認定為冗余特征。在預測模型中刪除這些冗余特征后,發現訓練時間未有明顯減少,從模型的發展及完備性角度考慮,目前研究中保留了所有特征作為模型輸入。

4 預測模型性能分析

4.1 預測性能

圖5、圖6 為最終模型在訓練集和測試集數據上的預測結果,其中橫軸為真實值,豎軸為預測值,預測結果越靠近圖中斜線越好,左上角為平均絕對誤差MAE、平均百分比誤差MAPE 和均方根誤差RMSE,訓練集和測試集的這三項指標都較小。可見,模型的預測效果良好。

圖5 訓練集基本周期預測結果Fig.5 Training set natural period prediction results

圖6 測試集基本周期預測結果Fig.6 Testing set natural period prediction result

4.2 對比分析

與以往預測模型以及相比,本研究預測模型基于多源實測數據,可以預測多種類型的建筑。與之前研究[4]采用傳統統計回歸的建模思路不同的是,本研究采用機器學習的方法建模,模型的參數更加復雜多樣,同時進一步應用新興的AutoML技術,大大簡化了模型建立流程。

表8 中給出了當前規范和文獻中的一些結構周期預測模型,本文將它們的預測結果與自動機器學習模型結果進行對比。

表8 規范及文獻中基本周期預測模型Table 8 Natural period prediction model in specification and literature

本研究訓練模型時采用的訓練集包含1844 棟建筑,驗證集包含205 棟建筑,測試集包含512 棟建筑未參與任何工作,為了保證驗證結果的可靠性,將測試集的建筑用于預測模型的對比。由于傳統的預測模型大多針對某類建筑進行預測,在進行預測之前需要進一步篩選出不同預測模型所適用的建筑。

以GOEL 和CHOPRA[19]的模型為例,其模型主要針對框架結構,測試集中相應建筑一共有205 棟,圖7 為GOEL 和CHOPRA[19]的模型與本文模型預測結果對比。可見,機器學習模型的預測結果在真實值附近,而GOEL 模型的預測結果總體上較真實值偏低。

圖7 GOEL 和CHOPRA[19]模型與本文模型在框架結構預測結果對比Fig.7 Comparison of prediction results between GOEL and CHOPRA[19] model and this model in frame structure

圖8、圖9 為表8 中的四個預測模型與本研究預測模型在MSE 和R2兩個指標上的對比。MSE是指真實值與預測值之差平方的期望值,MSE 越小說明預測精度越好;R2用以衡量整體的擬合度,R2越大表示擬合效果越好。此外,表9 給出了MAE、MAPE、RMSE 的對比結果。可以發現,本文預測模型在整體上保證預測范圍廣泛的情況下,整體上預測結果的準確性也是最好的。

圖8 不同模型預測結果MSE 對比Fig.8 Comparison of MSE of prediction results of different models

圖9 不同模型預測結果R2 對比Fig.9 Comparison of R2 of prediction results of different models

表9 模型其他準確性指標對比Table 9 Comparison of other accuracy indexes of model

5 結論

本文基于多源實測數據,利用機器學習方法建立了建筑結構基本周期的多因素自動機器學習預測模型。所提出的機器學習模型較以往模型可以考慮多因素影響,并適用于多類型建筑,從而顯著提高了周期預測的準確性。所建立的自動機器學習模型具有三方面特點:

(1) 無須調參,顯著提升了建模效率。

(2) 當有新型、性能更好的“子模型”出現時,僅需對底層學習器進行更換。

(3) 當有新的實測數據加入,也可自動實現模型的更新和功能提升。

將此模型與云端動態更新的建筑周期數據庫相結合,可形成一種全新的、網頁開放的、在線自學習的建筑周期預測功能。本文模型的源代碼將連同文章一起公開,服務于科學研究與工程實踐。

猜你喜歡
特征建筑模型
一半模型
《北方建筑》征稿簡則
北方建筑(2021年6期)2021-12-31 03:03:54
重要模型『一線三等角』
關于建筑的非專業遐思
文苑(2020年10期)2020-11-07 03:15:36
建筑的“芯”
現代裝飾(2020年6期)2020-06-22 08:43:12
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
主站蜘蛛池模板: 欧美精品一二三区| 精品久久久久久中文字幕女| 精品综合久久久久久97超人| 国产成人精品一区二区不卡| 98超碰在线观看| 免费AV在线播放观看18禁强制| 精品一区二区三区水蜜桃| 午夜国产理论| 久久久四虎成人永久免费网站| 狼友av永久网站免费观看| 国产美女人喷水在线观看| 五月天香蕉视频国产亚| 91成人在线观看视频| 特黄日韩免费一区二区三区| 亚洲精品欧美日本中文字幕| 婷婷在线网站| 国产成人三级| 国产精品第页| 亚洲人成网站色7799在线播放| 人妻一区二区三区无码精品一区| 亚洲区视频在线观看| 女人18一级毛片免费观看| 天天综合网色中文字幕| 欧美在线黄| a网站在线观看| 国产精品亚洲天堂| 亚洲欧美在线综合图区| 最新日本中文字幕| 日韩小视频在线观看| 久久久久人妻精品一区三寸蜜桃| 亚洲无限乱码| 幺女国产一级毛片| 久久这里只有精品国产99| 免费xxxxx在线观看网站| 久久婷婷五月综合色一区二区| 激情综合网址| 1024国产在线| a级毛片免费网站| 日韩在线网址| 国产精品对白刺激| 国内精品久久九九国产精品 | 制服丝袜亚洲| 天堂网亚洲系列亚洲系列| 四虎亚洲国产成人久久精品| 亚洲三级a| 国产91麻豆视频| 国模极品一区二区三区| 欧美精品啪啪一区二区三区| 2021最新国产精品网站| 国产在线98福利播放视频免费| 欧美精品一区在线看| 欧美成人精品高清在线下载| 国产精品99久久久久久董美香| 中文字幕乱妇无码AV在线| 欧美不卡视频在线观看| 国内99精品激情视频精品| 國產尤物AV尤物在線觀看| 日韩国产无码一区| 国产精品午夜福利麻豆| 国产一区在线视频观看| 国产成人一区免费观看 | 日韩毛片免费| 无码久看视频| 成人一级免费视频| 无码专区国产精品一区| 成人福利在线观看| 日韩高清无码免费| 91精品小视频| 国产成人精品亚洲77美色| 最近最新中文字幕免费的一页| 熟妇无码人妻| 天天色综合4| 亚洲日本韩在线观看| 波多野结衣在线se| 亚洲伊人久久精品影院| 国产欧美视频在线| 91视频99| 国产三级毛片| 久久青草免费91观看| 亚洲一区无码在线| 免费人成又黄又爽的视频网站| 成人av专区精品无码国产|