張飛漣,梁秀峰
基于GA-ELM的城市軌道交通工程投資估算方法研究
張飛漣,梁秀峰
(中南大學 土木工程學院,湖南 長沙 410075)
針對影響城市軌道交通工程投資非線性估算性能的特征指標和估算算法2個關鍵因素,提出優化與改進。對現有城市軌道交通工程投資估算研究成果中14個特征指標,提出優化假設,采用支持向量機(SVM)對樣本數據進行訓練和估算,通過對比優化前后估算結果的RMSE值進行優化假設驗證,最終得到8個特征指標。對城市軌道交通工程投資估算算法,提出遺傳算法(GA)優化極限學習機(ELM)輸入權值和隱含層閾值的算法,對樣本數據進行訓練和驗證,估算結果RMSE值顯示新算法估算精度和穩定性較現有估算算法大幅提高;將提出的城市軌道交通工程投資估算模型與SVM,LSSVM和BP神經網絡估算模型相比,估算結果顯示本文提出的估算模型比其他估算模型精確度較高。
軌道交通;投資估算;極限學習機;遺傳算法;特征指標

傳統軌道交通工程投資主要是采用估算指標和概預算定額乘以一定調整系數估算,或根據已完工的類似工程造價數據,建立線性分析模型,如一元、多元回歸和比例估算等方法估算。由于定額的滯后性、靜態性以及線性函數關系的簡單性,不能很好擬合各工程要素與造價之間高度非線性的要求,因此準確性得不到保障。針對這種情況,許多學者對非線性投資測算方法進行了研究。段曉晨等[1]針對有著大量時序數據和非時序數據的新建高鐵工程項目,采用混沌時序分析和神經網絡分析來估算項目造價;任宏等[2]同樣采用神經網絡法對建筑工程造價進行估算;嚴靜等[3?4]采用不同的方法改進灰色預測模型對企業成本進行預測。理論上這些方法都需要大量的歷史數據才能進行相對準確的預測估算。馬國豐等[5]采用神經網絡對樣本較少的地鐵車站工程造價進行估算,估算結果顯示也相對較準確。但還需要做進一步的驗證。陳進杰[6]采用支持向量機(SVM)的方法對石家莊城市軌道交通1號線的建設成本進行估算。該方法適用于小樣本數據的預測估算,但預測結果與實際情況相比如何還有待檢驗。陳進杰[7]還采用模糊聚類的方法對城市軌道交通運營成本進行了估算,為小樣本數據估算提供了新思路新方法,但同樣估算結果有待實際檢驗。楊文成等[8]采用知識約減法對軌道交通成本指標約減,然后用SVM進行成本的估算,提高了計算效率。除此之外還有神經網絡與其他算法結合的對工程造價成本估算的方法,如粒子群算法[9]、遺傳算法[10]、灰關聯[11]等。以上這些測算方法的基本原理都是通過輸入特征指標數據,采用一定的智能算法,對工程投資或造價進行非線性估算。估算結果準確與否的兩大關鍵因素是特征指標及估算模型的選取是否科學合理。針對城市軌道交通工程投資估算,本文擬SVM對特征指標進行優化,然后擬尋找一種新的方法對城市軌道交通工程進行投資估算。極限學習機(ELM)是一種泛化性能好、學習速度快的高效預測方法。目前已被應用到漿體流速預測[12],壓鑄件晶粒尺寸預測[13],煤礦爆破預測[14]等領域,均取得了較好的預測結果,但尚未應用到城市軌道交通工程成本估算中。雖然ELM在大部分情況下估算預測能力較好,但輸入權值和隱含層閾值是隨機給定的,對ELM的穩定性及精度方面都存在很大影響,因此本研究擬選用遺傳算法(GA)對ELM參數優化。在軌道交通工程投資估算領域提出GA-ELM預測算法,結合SVM優化的特征指標,以期提高城市軌道交通工程投資估算的精確性。
目前針對城市軌道交通工程投資估算的特征指標研究較少,陳進杰[6]對城市軌道交通工程投資估算時,采用較宏觀的特征指標,指標個數14個;趙欣[15]采用較微觀的特征指標,指標個數23個。現有特征指標共同特點是指標數量較多。因此本文擬在現有學者研究的基礎上,對特征指標進行篩減優化。由于軌道交通工程投資估算需要歷史工程投資數據為基礎,再對擬實施的軌道交通工程投資進行估算,如果特征指標較細、較微觀,則樣本數據就很難收集。因此本文以文獻[6]中14個特征指標:通車年份、人均國內生產總值、總里程、地下線長度、地上線長度、地下線比率、地上線比率、車站總數量、地下線車站個數、地上線車站個數、地下線車站比率、地上線車站比率、車輛數量、平均站距為基礎,對這些指標進行優化。以優化后的特征指標作為城市軌道交通工程投資估算的特征指標。
由于城市軌道交通工程特征指標的優劣無法直接評價,而特征指標的優劣是影響估算優劣的重要原因之一,因此采用估算結果的RMSE(均方根誤差)值評估指標的優劣[16]。對特征指標優化,首先在已有指標基礎上提出優化假設,再對這些優化假設進行驗證,得出最終的特征指標。
特征指標優化步驟如下:
1) 提出特征指標優化假設;
2) 運用目前城市軌道交通工程投資估算的SVM模型,選取訓練樣本和測試樣本,采用原特征指標對預測樣本進行估算,估算結果與實際值對比,計算RMSE值,并記錄;
3) 將提出的優化特征指標帶入測算模型,計RMSE值,與原始RMSE值對比。如果RMSE值變小則假設正確,則用優化后指標代替原指標;否則保留原指標;
4) 通過對所有優化假設驗證后,得出城市軌道交通工程投資估算特征指標。
1.2.1 提出優化假設
根據特征指標選取的系統性、獨立性以及可操作性等原則,對文獻[6]中14個特征指標提出以下假設:剔除總里程、敷設方式比率(地下線比率、地上線比率)、車站總數量、車站比率(地下線車站比率、地上線車站比率)、平均站間距。由于這些特征指標為非獨立變量,可由其他指標求得,因此剔除。
將剩余的7個特征指標向城市軌道交通設計院的投資測算專家調研咨詢,專家們提出:可增加編組這一特征指標。因為編組大小直接決定了擬建車站規模大小。我國城市軌道交通的車型有A,B,C和L型,A型車體型最大,B和C型車體型次之且較相似,L型車體型最小。常見的車編組的形式有4A,4B,4C,4L,6A,6B,6C,6L,8A和8B節編組。為對編組進行量化,按照體型相對大小對編組進行賦值:4A=4,4B=3,4C=2,4L=1,6A=8,6B=7,6C=6,6L=5,8A=10和8B=9。
1.2.2 優化假設驗證
本文采用文獻[6]中22個樣本數據(原文獻中有25條城市軌道交通數據,剔除其中的3條輕軌數據),同時在設計院調研過程中收集了16條城市軌道交通工程投資數據,見表1。總樣本數個數為 38個。

表1 設計院收集的樣本數據
選取總樣本的前85%(32個)為訓練樣本,其余為測試樣本,采用SVM模型對上述城市軌道交通特征優化假設進行驗證,驗證指標采用RMSE值。首先計算原14個指標的RMSE值,然后分別對各個假設進行計算驗證,對比優化后與原指標的RMSE值。計算驗證結果見表2所示。
1.2.3 城市軌道交通工程投資估算特征指標
通過對上述優化假設的驗證后,在原來14個特征指標的基礎上剔除了總里程、地上地下線比例(地下線比率、地上線比率)、車站總數、車站比例(地下線車站比率、地上線車站比率)。優化后的城市軌道交通工程投資估算特征指標見圖1所示。

表2 特征指標優化計算驗證結果

圖1 城市軌道交通工程投資估算特征指標
極限學習機(ELM)是一種針對單隱含層前饋神經網絡(SLFN)的新算法[17],ELM的輸入權值和隱含層閾值是隨機給定的,只需設置隱含層節點個數就可產生唯一最優解??赏ㄟ^求解線性方程組的最小二乘解獲得輸出權值。



當訓練樣本個數與隱含層神經元個數相等時,則存在,和使:

式( 2)可寫作:

在ELM算法中,和可隨機給定,則變為一個確定的矩陣,被稱作網絡的隱含層輸出矩陣。輸出權值矩陣可求解式(4)得到。

其中:+為隱含層輸出矩陣的廣義逆。
雖然ELM在大部分情況下估算預測能力較好,但和是隨機給定的,對ELM的穩定性及精度方面都存在很大影響,在實際的應用過程中經常出現病態[18]或過擬合現象。因此本文提出采用遺傳算法(GA)對ELM中的和進行尋優,優化ELM,提高其估算的精確性。
遺傳算法基本原理是將問題的解轉化為染色體,通過選擇、交叉及變異等變換染色體中的信息,最終遺傳進化到符合目標的染色體。
根據上述理論,基于GA優化ELM(GA-ELM)的城市軌道交通工程投資估算步驟如下。
Step 1:載入樣本數據,隨機選取樣本數據的85%,作為訓練集,其余作為測試集,對樣本數據歸一化處理。
Step 2:隨機生成ELM的輸入權值和隱含層閾值,并對其進行二進制編碼,作為GA的初始種群。
Step 3:計算GA目標函數,即RMSE值。將和解碼,將其賦予給ELM,使用訓練樣本對網絡進行訓練,然后采用訓練好的網絡對預測樣本進行估算,并與測試樣本實際輸出值計算RMSE值,得到GA目標函數。
Step 4:通過GA的選擇、交叉、變異得到新群體,即遺傳變異后的和,達到遺傳代數后終止遺傳,得到最終的群體。
Step 5:對迭代遺傳后的最終群體解碼,得到最優和。
Step 6:將最優和賦予ELM。
Step 7:采用最優的和,使用訓練樣本對ELM網絡進行訓練,訓練結束后得到城市軌道交通工程投資估算模型。
樣本數據同樣采用1.2中數據,隨機選取85%(32個)作為訓練樣本,其余作為測試樣本。城市軌道交通投資特征指標選取本文優化后的8個特征指標。
ELM隱含層節點數設置為32[19]。遺傳算法參數設置為:種群大小40,遺傳代數100,染色體長度10,交叉概率0.7,變異概率0.01和代溝0.95。
載入樣本數據,隨機選擇訓練樣本,通過GA優化ELM的和,將其帶入到ELM模型中,訓練網絡模型,對測試樣本進行估算。為驗證本文提出的估算算法性能的優越性,同時采用SVM算法對軌道交通測試樣本進行估測,SVM核函數為RBF,懲罰因子和核函數中的方差采用交叉驗證確定。GA-ELM算法與SVM算法估算結果見表3和如圖2。
從圖2可直觀看出GA-ELM算法估算結果與真實值較貼近,而SVM算法估算結果不太理想。通過計算GA-ELM算法與SVM算法估算結果與實際值的RMSE值見表4,定量評價兩種估算算法的優劣。GA-ELM算法估算結果RMSE值為12.562,SVM算法為28.898。與SVM估算算法相比,GA-ELM算法估算結果的RMSE降低56.5%,預測準確性大幅提高。由于GA-ELM采用遺傳算法優化參數,因此其訓練樣本時間相對SVM算法較長,預測效率較低,還有提升空間。

表3 GA-ELM算法與SVM算法估算結果

圖2 GA-ELM算法與SVM算法預測結果圖

表4 GA-ELM與SVM算法估算結果RMSE值
同時為對比GA-ELM算法與SVM算法估算的穩定性,隨機選取訓練樣本和測試樣本10次,使用優化后的8個特征指標,分別采用SVM和GA-ELM算法估算,計算每次估算結果的RMSE值,計算結果見表5。然后計算SVM和GA-ELM算法估算結果RMSE值的平均值和標準差,通過標準差反映估算結果離散程度,來驗證2種算法的穩定性。從計算結果可以看出SVM估算結果RMSE值的平均值和標準差較大,其估算的準確性和穩定性較差,而GA-ELM算法估算結果的RMSE值的平均值和標準差較小,其估算的準確性和穩定性較好。

表5 隨機10次估算結果RMSE值及其均值和標準差
將優化后的特征指標及算法的估算模型與現有估算模型對比,隨機選取85%(32個)作為訓練樣本,其余15%(6個)作為測試樣本。計算結果見表6。從表6可看出不同模型使用優化后的指標,較使用原指標估算精度大大提高,同時也可看本文優化后的8個特征指標的GA-ELM估算模型,比現有14個特征指標的SVM模型估算精度大大提高。

表6 城市軌道交通工程投資GA-ELM估算模型與SVM估算模型對比
本文提出的城市軌道交通工程投資GA-ELM估算模型比現有SVM模型預測準確和穩定的原因在于剔除了多余或干擾的特征指標,且采用更為先進的GA-ELM算法。
為進一步對比分析城市軌道交通工程投資GA- ELM估算模型性能,分別采用SVM、GA-ELM、最小二乘支持向量機(LSSVM)、BP神經網絡估算模型對城市軌道交通工程投資進行估算對比。同樣隨機選取85%(32個)樣本作為訓練樣本,其余作為測試樣本,對測試樣本進行投資估算,其計算結果對比見圖3。

圖3 各種估算模型估算結果對比圖
從圖3可看出,GA-ELM估算模型計算結果曲線與實際值曲線擬合度及貼近度最好;其次為SVM估算模型,再次為LSSVM估算模型,最后為BP神經網絡估算模型。這進一步驗證了本文提出的投資估算模型比其他估算模型有較好的性能。
1) 在現有城市軌道交通工程投資估算14個特征指標基礎上,通過提出特征指標優化假設及驗證,最后優化得到8個特征指標。特征指標優化后減少了輸入數據,同時提高了估算精度。
2) 針對估算算法,提出了采用GA優化ELM輸入權重和隱含層閾值的估算算法,通過與已有的軌道交通工程投資估算算法估算結果相比,準確性和穩定性有顯著提高。
3) 優化和提出的城市軌道交通工程投資估算模型與SVM,LSSVM和BP神經網絡估算模型相比,估算結果有較高的精度。
[1] 段曉晨, 郭蘭英, 張新寧. 新建高鐵工程非線性造價估算方法研究[J]. 鐵道學報, 2013, 35(10): 114?122. DUAN Xiaochen, GUO Lanying, ZHANG Xinning. Research on nonlinear estimating methods of whole life-cycle cost for china high-speed railway prohect[J]. Journal of the China Railway Society, 2013, 35(10): 114?122.
[2] 任宏, 周其明. 神經網絡在工程造價和主要工程量快速估算中的應用研究[J]. 土木工程學報, 2005, 38(8): 135?138. REN Hong, ZHOU Qiming. Applicaion of neural network for quick estimation of engineering constructon cost and main quantities[J]. China Civil Engineering Journal, 2005, 38(8): 135?138.
[3] 嚴靜. 基于改進灰色預測的成本預測模型構建[J]. 統計與決策, 2014(3): 39?41. YAN Jing. Construction of cost prediction model based on improved grey prediction[J]. Statistics and Decision, 2014(3): 39?41.
[4] 王惠珍. 基于改進灰色系統GM(1,1)模型的成本預測[J]. 統計與決策, 2015(15): 83?86. WANG Huizhen. Cost prediction based on improved gray system GM(1,1) model[J]. Statistics and Decision, 2015(15): 83?86.
[5] 馬國豐, 陳志琴. 基于BP神經網絡的軌道交通車站工程項目估價研究[J]. 項目管理技術, 2011, 9(7): 55?60. MA Guofeng, CHEN Zhiqin. Research on evaluation of rail transit station engineering project based on BP neural network[J]. Project Management Technology, 2011, 9(7): 55?60.
[6] 陳進杰. 城市軌道交通項目廣義全壽命周期成本理論與應用研究[D]. 北京: 北京交通大學, 2011. CHEN Jinjie. Theory and application of generalized life cycle cost of urban rail transit project[D]. Beijing: Beijing Jiaotong University, 2011.
[7] 陳進杰, 王興舉, 高桂鳳. 城市軌道交通運營成本模糊聚類估算模型[J]. 交通運輸系統工程與信息, 2011, 11(2): 136?141. CHEN Jinjie, WANG Xingju, GAO Guifeng. Estimation model for operating costs of urban rail transit based on fuzzy clustering[J]. Journal of Transportation Systems Engineering and Information Technology, 2011, 11(2): 136?141.
[8] 楊文成, 王圓圓, 孫軍先. 基于 KR-SVM 的城市軌道交通建設成本估算評價模型研究[J]. 交通工程, 2017, 17(3): 40?46. YANG Wencheng, WANG Yuanyuan, SUN Junxian. The research on evaluation model of urban rail transit construction cost based on KR-SVM[J]. Journal of Transportation Engineering, 2017, 17(3): 40?46.
[9] 陳偉, 周曼, 葉家軍, 等. 建筑工程安全施工費費率測算的PSO-BP模型研究[J]. 中國安全科學學報, 2016, 26(5): 146?151. CHEN Wei, ZHOU Man, YE Jiajun, et al. PSO-BP modeling research on fee rate measurement of construction project safe construction cost[J]. China Safety Science Journal, 2016, 26(5): 146?151.
[10] 景晨光, 段曉晨. 基于遺傳神經網絡的工程造價估算方法研究[J]. 石家莊鐵道大學學報(社會科學版), 2010, 4(4): 11?17. JING Chenguang, DUAN Xiaochen. Research on model of engineering cost estimation based on genetic neural network[J]. Journal of Shijiazhuang Tiedao University (Social Science), 2010, 4(4): 11?17.
[11] 楊永明, 王燕, 范秀君, 等. 基于灰關聯?神經網絡的電力工程造價估算[J]. 重慶大學學報, 2013, 36(11): 15?20. YANG Yongming, WANG Yan, FAN Xiujun, et al. Cost estimate of power line projects based on grey relational analysis and neural networks[J]. Journal of Chongqing University, 2013, 36(11): 15?20.
[12] 王新民, 李天正, 張欽禮. 基于 GA-ELM 漿體管道輸送臨界流速預測模型研究[J]. 中國安全生產科學技術, 2015, 11(8): 101?105. WANG Xinmin, LI Tianzheng, ZHANG Qinli. Study on prediction model of critical flow velocity in slurry pipeline transportation based on GA-ELM[J]. Journal of Safety Science and Technology, 2015, 11(8): 101?105.
[13] 梅益, 孫全龍, 喻麗華, 等. 基于GA-ELM 的鋁合金壓鑄件晶粒尺寸預測[J]. 金屬學報, 2017, 53(9): 1125?1132. MEI Yi, SUN Quanlong, YU Lihua, et al. Grain size prediction of aluminum alloy dies castings based on GA-ELM[J]. Acta Metallurgica Sinica, 2017, 53(9): 1125?1132.
[14] 溫廷新, 陳曉宇, 邵良杉, 等. 參數優化 GA-ELM 模型在露天煤礦拋擲爆破的預測[J]. 煤炭學報, 2017, 42(3): 630?638. WEN Tingxin, CHEN Xiaoyu, SHAO Liangshan, et al. Prediction on parameters optimized GA-ELM model for cast blasting in open-pit mine[J]. Journal of China Coal Society, 2017, 42(3): 630?638.
[15] 趙欣. 基于BP神經網絡的地鐵土建工程造價估算方法研究[D]. 北京: 北京交通大學, 2008. ZHAO Xin. Resarch on civil engineering cost estimation method of subway based on BPNN[D]. Beijing: Beijing Jiaotong University, 2008.
[16] 張穎, 李梅. 基于粒子群優化極限學習機的水質評價新模型[J]. 環境科學與技術, 2016, 39(5): 135?139. ZHANG Ying, LI Mei. A novel evaluation model of water quality based on PSO-ELM method[J]. Environmental Science & Technology, 2016, 39(5): 135? 139.
[17] HUANG G B, ZHU Q Y, Siew C K. Extreme learning machine: Theory and applications[J]. Neurocomputing, 2006, 70(1): 489?501.
[18] TANG X, HAN M. Partial Lanczos extreme learning machine for single-output regression problems[J]. Neurocomputing, 2009, 72(13?15): 3066?3076.
[19] 史峰, 王輝, 郁磊, 等. MATLAB 智能算法30個案例分析[M]. 北京: 北京航空航天大學出版社, 2011. SHI Feng, WANG Hui, YU Lei, et al. 30 Case analysis of MATLAB intelligent algorithm[M]. Beijing: Beijing University of Aeronautics and Astronautics Press, 2011.
Research on investment estimation method of urban rail transit project based on GA-ELM
ZHANG Feilian, LIANG Xiufeng
(School of Civil Engineering, Central South University, Changsha 410075, China)
According to two key factors affecting the nonlinear estimation performance of urban rail transit engineering investment, the optimization and improvement were proposed. Based on the 14 characteristics of the existing urban rail transit engineering investment estimation results, the optimization hypothesis was proposed. The support vector machine (SVM) was used to train and estimate the sample data. The RMSE value of the estimation results before and after the optimization was compared to optimize the hypothesis verification. Eight characteristic indicators were obtained. For the urban rail transit engineering investment estimation algorithm, the algorithm of genetic algorithm (GA) optimization limit learning machine (ELM) input weight and hidden layer threshold was proposed. The sample data was trained and verified. The estimated result RMSE value reveals that the estimation accuracy and stability of the new algorithm are significantly improved compared with the existing estimation algorithms. Finally, the proposed urban rail transit engineering investment estimation model was compared with the SVM, LSSVM and BP neural network estimation models. The estimation results show that the proposed estimation model is better than the other. The estimation model is more accurate.
rail transit; investment estimation; extreme learning machine; genetic algorithm; feature index
U121
A
1672 ? 7029(2019)07? 1842 ? 07
10.19713/j.cnki.43?1423/u.2019.07.031
2018?09?20
國家重點研發計劃資助項目(2017YFB1201102)
張飛漣(1964?),女,湖南湘潭人,教授,博士,從事工程項目規劃與管理研究;E?mail:zfl@csu.edu.cn
(編輯 蔣學東)