摘要:采用數據挖掘方法,構建高效的市政道路工程投資估算模型,根據項目分解結構分析了工程特征指標,并邀請具有豐富經驗的專家進行指標篩選,確定了多個關鍵因素。對歷史數據進行預處理和集成,缺失值處理、離群值分析,以保證數據的準確性和可用性。此外,利用人工蜂群算法優化超參數,結合XGBoost和Bagging算法構建集成估算模型。通過案例分析,與傳統方法相比,優化后的模型在偏差率和估算精度方面均有顯著提升,證明了所提方法的有效性和精確性。
關鍵詞:數據挖掘"市政道路工程"投資估算"智能算法
Research"on"Intelligent"Estimation"Method"for"Municipal"Road"Engineering"Investment"Based"on"Data"Mining
WU"Jiabin
China"Design"Group"Co.,"Ltd.,"Nanjing,"Jiangsu"Province,"210014"China
Abstract:"An"efficient"investment"estimation"model"for"municipal"road"engineering"is"constructed"by"using"data"mining"methods."Based"on"the"project"decomposition"structure,"the"engineering"characteristic"indicators"are"analyzed,"and"experienced"experts"are"invited"to"screen"the"indicators"to"determine"multiple"key"factors."Then"it"preprocesses"and"integrates"the"historical"data,"handles"missing"values,"and"analyzes"outliers"to"ensure"the"accuracy"and"availability"of"the"data."In"addition,"the"artificial"bee"colony"algorithm"is"used"to"optimize"hyperparameters,"and"an"integrated"estimation"model"is"constructed"by"combining"XGBoost"and"Bagging"algorithms."Through"case"analysis,"compared"with"traditional"methods,"the"optimized"model"has"significantly"improved"in"both"deviation"rate"and"estimation"accuracy,"proving"the"effectiveness"and"accuracy"of"the"proposed"method.
Key"Words:"Data"mining;"Municipal"road"engineering;"Investment"estimation;"Intelligent"algorithm
在現代城市化進程中,市政道路工程作為城市基礎設施的重要組成部分,對城市的經濟發展、交通流動和居民生活有著深遠的影響。隨著城市規模的不斷擴大和城市人口的持續增長,對市政道路工程的投資需求也在不斷增加。然而,市政道路工程投資估算的準確性直接關系到工程的經濟效益和社會效益,因此,如何提高投資估算的準確性和效率,是當前城市規劃和建設領域面臨的一個重要問題。本文旨在研究基于數據挖掘的市政道路工程投資智能估算方法,通過分析市政道路工程投資估算的特點和需求,探討數據挖掘技術在市政道路工程投資估算中的應用策略和方法。
1"市政道路工程特征指標分析
1.1"工程項目分解
采用項目分解結構細化市政道路工程項目,識別投資估算關鍵影響因素。建設規模方面,橋梁類型及其占比、涵洞數量、管道工程的長度、管徑及其支座類型、電力工程電纜長度、照明工程路燈數量影響投資估算。在技術指標方面,道路類型、設計速度和橫斷面類型有影響。建設條件方面,地區降雨量、地形特征、已有管線遷移、征地規模和建設周期等影響建造成本。
1.2市政道路工程特征指標篩選
市政道路工程特征指標篩選采用專家咨詢法,僅邀請有3年及以上經驗的專家,通過面對面訪談和問卷調查收集意見并對每個指標評分,以確定關鍵因素。確定的特征指標有軟基處理比例、路基防護方式、路基寬度、管道直徑、橋梁比例、地形特征、城市類別、建設周期等,這些均是影響市政道路工程投資估算的主要因素[1]。
2"市政道路工程投資估算模型的構建
2.1"市政道路工程相似案例檢索
在市政道路工程相似案例檢索過程中,需要先對特征指標的權重進行分配,以提高檢索準確性。通過專家評估確定案例的影響力度,并根據指標間的波動性和沖突性判斷權重。然后,計算候選案例與待估算工程之間的相似度,采用歸一化處理后的市政道路特征數據,并評估數據間的相似性。在分類指標時,通過轉換方法避免不合理距離計算對結果造成干擾,不同類型的分類指標間的距離均調整至中等相似性(0.5)或弱相似性(1)[3]。通過模糊相似矩陣對案例間的相似性進行評估,并使用權重對矩陣進行調整,得到加權模糊相似矩陣。
2.2"市政道路工程投資估算模型的構建
構建基于IABC優化超參數的集成模型,利用XGBoost的高非線性擬合能力及Bagging算法的并行集成學習特征,同時采用集成學習算法提高估算模型的穩定性和精確度。通過相對均方誤差(eRMSE)作為適應度函數,利用人工蜂群算法在合理調參范圍內尋找最優超參數組合,然后基于參數構建估算模型[4]。
考慮到投資估算的精細化要求,對歷史案例數據進行費用構成分析,并對估算結果相關性因素進行可視化展示。為分析各個特征的相對重要性,并評估不同特征對估算結果的貢獻度。
3"案例分析
3.1"案例概況
某市市政道路工程項目包括道路、橋梁、水供給、污水處理、照明等工程。道路總長2"663.44"m,寬40"m,設計為60"km/h的雙向四車道;橋梁為178.61"m長的連續鋼箱梁橋;市政設施管道總長5.54"km,包括800"mm雨排水管、630"mm的高密度聚乙烯污水管和400"mm的聚乙烯給水管。
3.2"數據預處理
3.2.1"數據清洗
針對道路工程特征指標數據中的缺失和離群問題采用多重插補和箱線圖檢驗的方法。
(1)缺失值處理:應用多重插補技術填補缺失值,包括降雨量在內,從而形成5個數據集。采用決定系數(R2)標準評估插補質量,選擇R2最高值的數據集作為最優插補結果。
(2)離群值分析:使用箱線圖識別異常值,并利用K-均值聚類算法進行異常值處理。數據被分類并替換為距離聚類中心的中值,以減少偏差。處理后的精確數據用于分析,確保評估結果準確可靠。
3.2.2"數據規約
通過逐步回歸方法,從19個變量中篩選出15個與市政道路工程投資估算顯著相關的核心指標。指標包括軟基處理、路基寬度、鋪裝材料、橋梁和管道特征、交通信號、道路類型、橫斷面、降水量、管線遷移、征遷面積、建設時長和城市分類。模型檢驗顯示變量間線性相關(Plt;0.01),R2=0.8502,表明模型對非線性特征的敏感性高,需要引入非線性模型以提高估算精度[5]。
3.3"工程投資估算模型的構建
采用IABC算法進行模型優化,在構建估算模型時,從相似案例中獲取樣本并隨機抽取一部分作為測試集(占20%),其余用作訓練集。所有估算模型在構建過程中都會獨立重校其最優超參數,以確保整體性能達到最佳。
3.3.1估算模型誤差對比分析
對比三種單模型SVR、ANN、XGBoost及引入Bagging集成算法后的推測與區間估算能力,以檢驗集成學習在市政道路工程投資估算中的精確度。
(1)不同相似度閾值對比分析。
分析不同相似度閾值(0.60~0.80)對市政道路工程估算效果的影響。采用模糊聚類分析方法,依據不同閾值范圍篩選案例進行評估。
結果顯示,閾值在0.60~0.65時,案例數穩定;當閾值增至0.80時,案例數顯著下降。評估指標平均相對誤差(eMAPE)隨著相似度閾值的增加而降低,直到閾值達到0.70后,R2呈下降趨勢,該現象由于案例數量不足影響模型泛化能力所致。因此,選擇閾值為0.70,基于此閾值確定的193個案例(訓練集154例,測試集39例)用于進一步分析。
(2)各模型誤差對比分析。
通過R2、eMAPE和eRMSE對SVR、ANN和XGBoost模型及引入Bagging集成算法后的各模型進行對比分析,具體如表1所示。
XGBoost模型在單模型評估中優于SVR和ANN,集成Bagging算法后,模型的性能均有所提升,特別是XGBoost表現出較低的誤差波動。對于區間估算,與SVR和ANN模型比較,XGBoost在3個置信水平80%、90%、95%下均表現出較高的準確性和穩定性。
3.3.2案例工程估算結果分析
在對案例工程的投資估算分析中,應用智能化分析技術,采用區間估算和點估算相結合的方法,并與傳統方法進行對比,如表2所示。
利用經過IABC算法優化的XGBoost集成模型對單位靜態投資進行了估算,結果顯示估算誤差為3.67%,實際投資與95%置信區間范圍內相符。與傳統方法相比,本文的估算方法將偏差率顯著降低了8.88%,驗證了智能化分析方法在精度上的優勢。
4"結語
本研究采用項目分解結構方法對工程進行細化分解,確立了特征指標系統,充分考慮了道路、橋梁、管道等各個環節的關鍵因素,確保了估算的準確性和全面性。通過數據預處理與集成技術,提高了原始數據的質量。利用IABC優化算法和集成學習技術,提高了模型預測的精度和魯棒性。與傳統方法相比,本文所提模型在預測市政道路工程投資方面表現出顯著的效果和較高的準確度,有著明顯的優勢。本研究通過數據驅動的方法論,為市政基礎設施投資估算提供了新的視角和工具,具有較大的實際應用價值。
參考文獻
[1]張靜.市政道路工程投資估算方法改進研究[J].工程造價管理,2021(5):57-63.
[2]孫銘澤,劉泓志,魏連濤,等.基于某抽水蓄能項目交通工程投資影響因素研究與分析[J].水電與抽水蓄能,2022,8(6):110-113,116.
[3]蔣明輝,嚴敏嘉,嚴鵬,等.市政道路可行性研究階段投資估算影響因素及對策研究[J].建筑經濟,2021,42(2):60-64.
[4]歐陽勤.基于數據挖掘的市政道路工程投資估算模型研究[D].廣西:廣西大學,2023.
[5]楊愛萌,吳奇威,楊宇昕.城市美術館項目投資估算及設計概算控制方法研究:以無錫美術館建設項目為例[J].工程造價管理,2024,35(4):62-66.