樊文廣



摘 要: 成本預估是建筑工程管理中的一個重要研究方向,傳統模型無法精準描述建筑工程造價的變化趨勢,導致建筑工程造價成本預估精度低,為此,設計了基于數據挖掘的建筑工程造價成本預估模型。建立建筑工程造價成本預估的數學模型,采用最小二乘支持向量機對建筑工程造價成本預估數學模型進行求解,并采用改進粒子群算法對模型再優化,通過具體建筑工程造價成本預估實驗對有效性進行驗證,數據挖掘提高了建筑工程造價成本預估的精度,且建筑工程造價成本預估性能要優于當前其他建筑工程造價成本預估模型。
關鍵詞: 建筑工程; 質量管理; 成本預估; 數據挖掘; 數學模型; 工程造價
中圖分類號: TN911.1?34 文獻標識碼: A 文章編號: 1004?373X(2018)07?0170?04
Data mining based estimation model of construction project cost
FAN Wenguang1, 2
(1. Tianjin University, Tianjin 300072, China; 2. Inner Mongolia Technical College of Construction, Hohhot 010020, China)
Abstract: The cost estimation is an important research direction in the construction project management. The traditional model can′t accurately describe the change tendency of the construction project cost, and has low estimation accuracy of construction engineering cost. Therefore, a data mining based estimation model of construction project cost was designed. The mathematical model of the construction project cost estimation was established. And then the least square support vector machine (SVM) is adopted to solve the mathematical model of the construction project cost estimation. The improved particle swarm optimization (PSO) algorithm is used to optimize the model. The concrete estimation experiment of construction project cost was performed to verify the effectiveness of the model. The data mining can improve the estimation accuracy of construction project cost, and the performance of the model is higher than that of other construction project cost estimation models.
Keywords: construction engineering; quality management; cost estimation; data mining; mathematical model; project cost
0 引 言
隨著經濟的不斷發展,人們生活水平不斷提高,而住房水平是其中最為重要的一部分,使得大中小城市的建筑業發展迅速。由于材料、人工費、管理費用的不斷增加,建筑工程造價的成本也相應增加,對建筑工程造價成本進行預估,為工程管理者和企業提供有價值的信息成為當前重要研究內容[1?3]。
原始建筑工程造價成本預估主要通過一些管理人員根據統計學方法進行,該過程十分復雜,極易出錯,導致建筑工程造價成本預估的誤差大,很難為建筑工程造價成本的管理者提供有效的信息[4]。多元線性回歸模型根據建筑工程造價成本的歷史數據,對相似建筑工程造價成本進行回歸和擬合,比人工方法的建筑工程造價成本預估結果更加可信,但多元線性回歸模型認為建筑工程造價成本是一種固定的線性增加變化趨勢,這與實際情況不太相符,因為建筑工程造價成本是一種非線性變化系統,不僅有一定的線性變化趨勢,同時具有一定的非線性波動,使得建筑工程造價成本預估精度有待進一步提高[5]。人工神經網絡具有智能學習能力,可以對建筑工程造價成本與其影響因素之間的關系進行非線性擬合,從而描述建筑工程造價成本的變化趨勢,預測精度較高,但人工神經網絡的結構復雜,如何合理確定其結構沒有統一的看法,且易得到“過擬合”的建筑工程造價成本預估結果[6]。數據挖掘技術是近幾年發展起來的一種非線性建模方法,其中支持向量機是一種最為常用的方法,可以對建筑工程造價成本變化趨勢進行深度挖掘,準確估計建筑工程造價成本與影響因素之間的聯系,泛化能力強,成為建筑工程造價成本預估的主要工具[7?9]。但當建筑工程造價成本的數據較多時,支持向量機的缺陷就體現出來了,出現學習速度比較慢,有時甚至無法實現的情況[10]。
最小二乘支持向量機是一種新型的數據挖掘技術,學習速度快、泛化能力強,針對當前模型無法精準描述建筑工程造價的變化趨勢,預估精度低的問題,提出基于數據挖掘的建筑工程造價成本預估模型(PSO?LSSVM),通過最小二乘支持向量機擬合建筑工程造價成本變化趨勢,結果表明,數據挖掘提高了建筑工程造價成本預估的精度,預估誤差小于其他建筑工程造價成本預估模型。
1 建筑工程造價成本預估的數學模型
建筑工程造價成本與許多因素相關,如人工費、材料等,設共有[n]個因素,它們可以表示為[xi,i=1,2,…,n,]建筑工程造價成本為[y],那么兩者之間的變化可以描述為:
式中[f(?)]表示建筑工程造價成本預估函數,其直接影響到建筑工程造價成績預估的好壞。
2 數據挖掘的建筑工程造價成本預估模型
2.1 最小二乘支持向量機
設建筑工程造價成本的歷史樣本為[xi,yi,][xi∈Rn]為建筑工程造價成本的影響因素,即輸入向量,[yi∈R]表示相應的建筑工程造價成本值,采用非線性映射[?(?)]對[xi]進行映射,建立如下的建筑工程造價成績預估的回歸模型:
[y=f(x)=ω?(x)+b] (2)
從式(2)可知,在建立準確建筑工程造價成績預估模型時,確定最優的權向量[ω]和偏差[b,]根據結構風險最小化原理,引入松弛變量[ζi]將其變為等式約束的優化問題,具體如下:
式中[γ]表示正則化參數。
采用拉格朗日函數對式(3)求解,建立如下的拉格朗日方程:
式中[αi(i=1,2,…,N)]表示拉格朗日乘子。
由Karush?Kuhn?Tucher條件通過變換能夠得到:
[0STSK+Ic bα=0Y] (5)
式中:[S=[1,1,…,1]Τ;][α=[α1,α2,…,αN];][Y=[y1,y2,…,yN];][K=?Τ(xk)?(xN)=K(xk,xN)]為核函數,本文選擇的核函數具體如下:
[K(x,xi)=exp-x-xi22σ2] (6)
式中[σ2]表示核函數的寬度。
對式(6)進行求解,得到基于最小二乘支持向量機的建筑工程造價成本預估模型為:
[f(x)=i=1NαiK(x,xi)+b] (7)
最小二乘支持向量機的結構如圖1所示,每個中間節點對應一個支持向量。
對最小二乘支持向量機的建筑工程造價成績建模過程進行分析可知,參數[γ]和[σ2]影響建筑工程造價成本預估結果,為了提高建筑工程造價成本預估效果,采用粒子群算法確定參數[γ]和[σ2]的最優值。
2.2 粒子群算法
粒子群算法是一種模擬鳥群飛行覓食行為的算法,問題潛在解可采用一個粒子代表,粒子根據問題的求解目標確定適應度函數值,適應度函數值描述粒子位置的好壞,設[P]個粒子組成種群[s=s1,s2,…,si,…,sP],第[i1≤i≤P]個粒子的位置為[si=si1,si2,…,siD],[D]表示解空間的維數,在第[t]次迭代時刻,速度向量為[vti=][vti1,vti2,…,vtiD],其最優位置為[pti=pti1,pti2,…,ptiD],可以記為[pbest;]粒子群的最優位置為[ptg=ptg1,ptg2,…,ptgD],可以記為[gbest;]粒子狀態更新公式為:
式中:[w]表示慣性權重;[d]表示粒子維數;[c1]和[c2]為加速因子;[r1]和[r2]為[0,1]區間的隨機數。
慣性權重[w]影響局部和全局的搜索性能,為了提高算法的搜索能力,保證粒子的多樣性,采用自動調整的[w,]粒子多樣性函數定義為:
式中[fαi(t)]為第[i]個粒子的適應度值。
[Fdiversity(t)]表示粒子的運動特性,定義非線性函數[δt]為:
式中[L]為一常數。
慣性權重[w]調整規則方式為:
式中,[εti]表示粒子[i]與最優粒子之間的距離,計算公式為:
式中[sti]為[t]時刻粒子[i]的位置。
2.3 數據挖掘的建筑工程造價成本預估步驟
數據挖掘的建筑工程造價成本預估步驟如下:
Step1:針對具體的建筑工程,通過相關資料收集其造價成本的歷史數據,并對建筑工程造價成本數據做如下處理:
[x′i=xi-min(xi)max(xi)-min(xi)] (14)
Step2:初始化粒子的位置和速度,并確定它們的取值范圍,將最小二乘支持向量機的參數[γ]和[σ2]映射為粒子位置。
Step3:將建筑工程造價成本預估的訓練樣本輸入到最小二乘支持向量機學習,并對粒子位置向量進行反編碼得到參數[γ]和[σ2]的值,通過訓練得到每一個粒子的適應度值。
Step4:確定每一個粒子的最優位置[pti]和種群最優位置[ptg]。
Step5:對慣性權重[w]進行更新操作。
Step6:對粒子狀態進行更新操作,產生新的粒子群。
Step7:通過訓練樣本和最小二乘支持向量機對新的粒子群的適應度值進行計算。
Step8:看是否滿足結束條件,如不滿足,轉Step4繼續執行。
Step9:根據[ptg]得到參數[γ]和[σ2]的值的全局最優組合,對建筑工程造價成本訓練樣本再次進行學習,建立建筑工程造價成本預估模型。
3 仿真實驗
3.1 數據來源
選取某市的建筑工程造價成本數據進行研究,共采集200組數據,具體如圖2所示。對圖2的建筑工程造價成本數據變化趨勢進行分析發現,該數據具有明顯線性變化特點,同時具有較強的非線性變化特點,通過嵌入定理確定建筑工程造價成本數據的延遲時間[τ]和嵌入維數[m,]并建立如下的建筑工程造價成本的預估數學模型:
根據差分熵確定圖2中的建筑工程造價成本數據的延遲時間[τ=12,]嵌入維數[m=7,]最后50個數據作為建筑工程造價成本預估的測試樣本,其他為建筑工程造價成本預估的訓練樣本。
利用最小二乘支持向量機構建建筑工程造價成本預估模型之前,先采用粒子群算法確定參數[γ]和[σ2]的值,它們分別為[γ=100,][σ2=6.725,]粒子的個數為20,[c1=c2=2,]最大迭代次數為500。
3.2 結果及分析
針對相同建筑工程造價成本數據集,選擇BP神經網絡(BPNN)、支持向量機(SVM)進行對比測試,它們的建筑工程造價成本預估結果如圖3所示。從圖3可以看出,BP神經網絡的建筑工程造價成本預估性能最差,而支持向量機和最小二乘支持向量機的建筑工程造價成本相差不大,兩者都獲得了比較理想的建筑工程造價成本預估結果。對BPNN,SVM,PSO?LSSVM的訓練時間和測試結果如表1所示。從表1可以看出,SVM的建筑工程造價成本預估訓練時間相當長,建模效率極低,BP神經網絡雖然建筑工程造價成本預估時間短,但是建筑工程造價成本預估誤差大,無法滿足建筑工程造價成本管理的實際應用要求,而PSO?LSSVM的建筑工程造價成本預估速度快,而且建筑工程造價成本預估效果好,具有明顯的優勢。
4 結 論
為了對建筑工程造價成本進行準確預測,通過數據挖掘技術對其進行建模,并通過仿真實驗得到如下結論:
1) 傳統方法不能高精度地擬合建筑工程造價成本變化趨勢,導致建筑工程造價成本預估誤差大。
2) 最小二乘支持向量機對建筑工程造價成本和影響因素之間的聯系進行學習,能夠有效挖掘其擬合趨勢,提高了建筑工程造價成本預估的準確性。
3) 通過粒子群算法對建筑工程造價成本預估模型的參數進行優化,使得建立的模型更好地描述建筑工程造價成本的變化特點,預估結果要明顯優于其他建筑工程造價成本預估模型。
4) 該模型通用性強,可以應用于其他非線性系統中預測問題的研究,具有較廣的應用前景。
參考文獻
[1] 陳鵬,劉亞南.建筑工程造價管理的現狀與對策[J].工業工程,2015,34(48):33?34.
CHEN Peng, LIU Yanan. Current situation and countermeasures of cost management of construction engineering [J]. Industrial engineering, 2015, 34(48): 33?34.
[2] 梁迅.建筑工程單方造價快速估算方法綜述[J].廣東工業大學學報,2012,9(3):107?110.
LIANG Xun. Review of the new methods of fast estimation of construction engineering unit square cost [J]. Journal of Guangdong University of Technology, 2012, 9(3): 107?110.
[3] 陳小龍,王立光.基于建筑設計參數分析模型的工程造價估算[J].同濟大學學報(自然科學版),2009,37(8):1115?1121.
CHEN Xiaolong, WANG Liguang. A study on estimating approach based on analysis model for design parameters of buildings [J]. Journal of Tongji University (natural science), 2009, 37(8): 1115?1121.
[4] 胡六星.基于時間序列的建筑工程造價預測研究[J].太原理工大學學報,2012,43(6):706?709.
HU Liuxing. Research on prediction of architectural engineering cost based on the time series method [J]. Journal of Taiyuan University of Technology, 2012, 43(6): 706?709.
[5] 牛東曉,乞建勛,邢棉.建筑工程造價預測的變結構神經網絡模型研究[J].華北電力大學學報,2001,28(4):1?4.
NIU Dongxiao, QI Jianxun, XING Mian. Researches on varied structure artificial neural network model for estimating building project cost [J]. Journal of North China Electric Power University, 2001, 28(4): 1?4.
[6] 許寧.基于模糊神經網絡的建筑工程造價估計方法[J].江漢石油學院學報,2000,22(1):87?88.
XU Ning. Estimation method of construction cost based on fuzzy neural network [J]. Journal of Jianghan Petroleum Institute, 2000, 22(1): 87?88.
[7] 鄭周練,鄧紹江,高師嫻,等.建筑工程造價的模糊確定[J].重慶大學學報(自然科學版),2001,24(1):55?58.
ZHENG Zhoulian, DENG Shaojiang, GAO Shixian, et al. Fuzzy estimation on cost of project [J]. Journal of Chongqing University (natural science edition), 2001, 24(1): 55?58.
[8] 孟俊娜,梁巖,房寧.基于BP神經網絡的民用建筑工程造價估算方法研究[J].建筑經濟,2015,36(9):64?68.
MENG Junna, LIANG Yan, FANG Ning. Research on civil construction project cost estimation method based on BP neural network [J]. Construction economy, 2015, 36(9): 64?68.
[9] 胡曉娟.多元線性回歸模型參數的STLS估計法及其在工程造價預測中的應用[J].四川建筑科學研究,2016,42(4):142?147.
HU Xiaojuan. Structured total least squares method for multivariable linear regression model and its application in enginee?ring cost prediction [J]. Building science research of Sichuan, 2016, 42(4): 142?147.
[10] 劉繼業,陳西宏,劉強,等.基于改進粒子群優化LSSVM的衛星鐘差預報研究[J].宇航學報,2013,34(11):1509?1515.
LIU Jiye, CHEN Xihong, LIU Qiang, et al. The improved particle swarm optimization LSSVM satellite clock error prediction based on [J]. Journal of astronautics, 2013, 34(11): 1509?1515.