0 引言
市政工程造價預測極為重要,僅依賴經驗和簡單統計難以完成復雜的造價預測。機器學習憑借其強大算力,可提升預測精度。目前關于此方面的研究已有不少。李姣姣[研究了基于混合機器學習模型的建筑工程造價預測方法,陳悅華等[2研究了基于機器學習的工業建筑工程造價預測方法,劉芳[3]研究了基于BP神經網絡的建筑工程造價的快速預測方法,余維娜[4研究了基于改進BP神經網絡的土建工程造價精準預測方法。
雖然不少學者將機器學習用于市政工程造價預測,但仍存在造價預測的準確性等問題。本文研究基于機器學習算法的市政工程造價預測,目的是為市政工程造價提供可靠和準確的依據,推動機器學習在市政工程造價領域的應用。
1工程概況
某跨江大橋市政工程項目全長為 2.6km ,采用預應力混凝土連續箱梁結構,橋面寬度為 30m ,雙向六車道,總投資額為8.5億元。該跨江大橋工程造價構成如表1所示。
表1跨江大橋工程造價構成

2機器學習5種算法
2.1 線性回歸算法
線性回歸是用于預測連續值的監督學習算法,是一種廣泛應用的回歸模型,其核心是經優化算法找到最佳擬合線以最小化誤差。在市政工程造價預測中,可把材料成本、人工成本以及施工周期作輸入特征,訓練模型確定影響程度,實現準確造價預測。線性回歸模型公式如下:
y=WX+b" "(1)
式中: y 為預測值,w為權重, X 為輸入特征值,b為偏置。
2.2支持向量機算法
支持向量機(SVM)是基于最大邊距分類思想的機器學習算法。在市政工程造價預測里,針對回歸問題可用ε- 支持向量回歸(ε-SVR)。以造價為目標變量,影響因素為特征變量,借助SVM算法,實現新工程項目造價預測。
2.3隨機森林算法
隨機森林算法是一種集成學習算法。在市政工程造價預測中,通過構建多個決策樹綜合預測展現優勢,可處
理高維數據、耐受異常值和噪聲,經過樣本抽樣、特征選擇、決策樹構建,綜合各樹結果取得最終預測值。隨機森林算法示意如圖1所示。

2.4決策樹算法
決策樹是樹形結構的分類、回歸算法。在市政工程造價預測里,借著歷史數據構建樹形結構,節點、分支、葉子節點各有含義。決策樹的生成主要經歷特征選擇、節點分裂、剪枝等過程,選最優特征作判斷,依條件分數據,通過剪枝防止過擬合。
2.5BP神經網絡算法
BP神經網絡模擬人腦神經元,由多個神經元構成。在市政工程造價預測中,通過BP神經網絡分析歷史數據、學習非線性映射關系,進行網絡結構設計、權重初始化和訓練,確定網絡參數,隨機初始化權重后用反向傳播算法調整權重值,使預測誤差減小。
3市政工程造價數據特性分析
3.1多源異構特性
市政工程造價數據來源廣泛,包括材料價格、施工工藝、政策法規等,數據類型多樣且格式不一致。例如:材料價格可能來自市場調研數據,施工工藝可能來自工程圖紙,政策法規可能來自政府公告。這些數據的整合和處理需要耗費大量時間和精力。
3.2強非線性特性
市政工程造價與影響因素之間的關系復雜,存在明顯的非線性關系。施工環境的復雜性、材料價格波動等因素都會對工程造價產生顯著影響。傳統的線性模型難以捕捉這種非線性關系,因此需要選擇能夠處理非線性關系的機器學習算法。
3.3 高噪聲特性
市政工程數據中存在大量噪聲,如數據缺失、錯誤記錄等,這些噪聲會影響模型的訓練效果。例如:某些材料價格可能因市場波動而出現異常值,某些施工記錄可能因人為失誤而存在錯誤。如何降低噪聲對模型的影響,是提高預測精度的關鍵。
4機器學習算法在市政工程造價預測中的應用效果
為驗證不同機器學習模型在市政工程造價預測中的效果,本文采用該跨江大橋市政工程項目數據庫的實際工程數據進行實驗分析。數據包含多個項目的造價和相關特征。預處理階段對原始數據清洗和標準化,以消除噪聲和異常值。隨后分別采用線性回歸、決策樹、隨機森林、SVM和BP神經網絡等模型進行訓練和測試。
4.1模型性能指標計算
為了評估不同機器學習模型對該跨江大橋市政工程項目造價的預測效果,本文采用均方誤差(MSE)、平均
絕對誤差(MAE)和決定系數 (R2) ,其計算公式如下:



式中: n 為測試集樣本數量, yi 為實際工程造價,
為預測工程造價,
為實際工程造價的平均值。
4.2特征選擇與數據處理
結合相關性分析和方差膨脹因子(VIF)分析,從眾多特征變量中篩選出對工程造價影響較大的變量。首先,通過計算各特征變量與工程造價之間的相關系數,去除相關性較低的特征。隨后,利用VIF分析進一步檢測特征之間的多重共線性問題,剔除VIF值大于設定閾值(通常取10)的特征,最終確定20個特征變量作為模型的輸入。
4.3不同算法預測模型的性能指標對比分析
4.3.1不同算法預測模型性能指標
通過計算,得到5種算法預測模型性能指標如表2所示,5種算法預測模型性能指標示意如圖2所示。
表25種算法預測模型性能指標


4.3.2性能指標對比分析
從表2和圖2可知,隨機森林模型在市政工程造價預測中的表現最優,其MSE、MAE最小, R2 最高。線性回歸模型的表現最差,其MSE、MAE最大, R2 最低。決策樹、支持向量機和神經網絡模型的表現介于隨機森林和線性回歸之間。因此,可以認為隨機森林模型在市政工程造價預測中具有更好的預測準確性和穩定性。
4.4市政工程數據特性對算法性能的影響
市政工程造價數據多源異構,含材料價格波動、施工環境復雜、政策法規約束等,呈強非線性與高噪聲特性。隨機森林通過特征隨機選擇與多樹集成抑制噪聲,適用于冗余特征處理;SVM利用核函數(如RBF)映射數據到高維空間解決小樣本非線性問題,但需參數調優且計算成本高;反向傳播神經網絡(BPNN)擅長捕捉深層非線性關系,但需大量訓練數據且易局部最優,市政工程應用需結合早停法優化訓練。
4.5與其他文獻中算法的對比
本文采用的隨機森林算法與其他文獻中算法的對比,如圖3所示。文獻[1]使用PCA優化SVM模型,其R2為0.83,而本研究中隨機森林模型的 R2 達到0.892,表明隨機森林在集成學習和特征降維方面具有獨特優勢。文獻[3」基于BP神經網絡預測建筑造價,其MAE為0.21,而本文采用的隨機森林模型的MAE降至0.178,充分顯示出隨機森林在應對復雜市政工程時的魯棒性。文獻[4]改進BP神經網絡實現土建工程精準預測,但需要人工精細調參,而隨機森林模型通過引導聚集算法自動平衡偏差與方差,更符合市政工程實際應用中對模型適應性和穩定性的要求。通過對比可知,隨機森林模型在實際工程應用中的優勢更為明顯。
5市政工程造價預測的優化策略和案例工程預測效果
5.1小樣本場景的優化
市政工程建設的部分項目因歷史數據少導致樣本有限,給傳統算法帶來了挑戰。本研究構建Stacking集成模型,以SVR、KNN為基模型初步預測,用貝葉斯優化的隨機森林作元模型綜合優化。經案例驗證,集成模型R2比單一模型提升了 6.3% ,提高了小樣本場景造價預測的準確性。
5.2時序特征的優化
市政造價數據中,對預測起關鍵作用的材料價格具有時序性。本文引入LSTM(長短期記憶)模塊捕捉時序特征。以鋼筋價格預測為例,LSTM模塊能夠自動學習鋼筋價格隨時間的變化趨勢,有效預測價格波動。實驗顯示引入LSTM后,鋼筋價格預測MAE降至 3.2% ,提高了時序數據預測精度,為造價預測提供準確材料價格。
圖3采用隨機森林算法與其他文獻算法的對比

圖4傳統模型與隨機森林效果對比

5.3案例工程預測效果與取得的效益
5.3.1隨機森林模型應用效果
該跨江大橋市政工程項目應用優化后的隨機森林模型,在造價和工期預測方面取得顯著成果。造價預測誤差率僅為 2.7% ,遠低于傳統方法的 9.3% ,顯著提升了預測準確性,為預算編制和成本控制提供了可靠依據。通過模型分析,成功識別15項潛在成本超支點,提前采取措施節約預算8200萬元。同時,工期預測精度達 94% 有效支持資源動態調配,確保項目按計劃推進,避免工期延誤帶來的額外成本。傳統模型與隨機森林效果對比如圖4所示。
5.3.2案例工程取得的效益
優化后的隨機森林模型在該跨江大橋項目中顯著提升了預測準確性和精度,降低了誤差率。從經濟效益看,精準的造價預測和成本超支點的有效識別,節約了大量資金并顯著提高了投資回報率。從項目管理角度看,工期預測精度的提升優化了施工進度安排和資源配置,提高了項目管理效率。
6結束語
本文以某跨江大橋市政工程項目為研究對象,深入分析了市政工程造價數據的多源異構、強非線性和高噪聲特性,并結合多種機器學習算法進行造價預測建模與效果對比。研究結果表明,隨機森林模型在預測準確性和穩定性方面表現最優,能夠有效應對復雜數據特性。在實際工程應用中,優化后的隨機森林模型顯著提高了造價和工期預測精度,節約了項目資金,提升了管理效率。本研究為市政工程造價決策提供了科學依據,推動了機器學習在市政工程領域的應用,為行業數字化轉型提供了實踐范例。
參考文獻
[1]李姣姣.基于混合機器學習模型的建筑工程造價預測方法[J].九江學院學報(自然科學版),2023,38(4):47-51.
[2]陳悅華,鄭思敏,劉文路.基于機器學習的工業建筑工程造價預測研究[J].武漢理工大學學報(信息與管理工程版),2021,43(4):314-321.
[3]劉芳.基于BP神經網絡的建筑工程造價的快速預測研究[J].價值工程,2025,44(2):23-25.
[4]余維娜.基于改進BP神經網絡的土建工程造價精準預測方法[J].中國建筑金屬結構,2024,23(9):36-38.