張家忠
基于貢獻度-極限學習機理論算法的輸電線路工程造價預測
張家忠

張家忠 危雪林 李冰清
江西博微新技術有限公司
工程造價預測是工程造價控制的前提,是工程項目可行性研究的基礎,也是招投標制定標底的依據,因此工程造價預測成為工程建設中首要解決的問題。快速而又準確地進行工程造價的預測,對于工程項目的管理實踐具有重大的理論意義和現實意義。本文采用貢獻度-極限學習機這些數學方法構成輸電線路工程造價預測模型,并證明該理論與方法的科學性,進而研究解決工程造價預測效率不高這一難題。
傳統的造價預測一般使用機理型的構建造價預測物理模型,近些年來,隨著智能算法的興起,很多學者開始將灰色關聯理論、BP神經網絡和支持向量機(Support Vector Machine,SVM)等方法應用于對工程造價預測,雖然在各個領域都取得了一定的效果,但方法本身仍存在不足:灰色模型(如GM(1,1),GM(1,N)等)適用于小樣本,具有運算簡單等特點,但其對樣本的分布規律有較嚴格的要求;神經網絡對非線性系統有良好的逼近能力,但難以確定該模型的結構,難以掌握網絡訓練水平,模型求解容易陷入局部最小值,且對連接權系數初值敏感,模型參數不易尋找,過度依賴設計技巧。SVM方法具有可靠的理論基礎,能克服神經網絡的上述不足,較好地解決小樣本、非線性、高維數等實際問題,因此,本文選取極限學習機模型作為輸電線路工程造價預測的預測模型。
為了構建造價預測模型,首先需要在輸電線路造價費用構成模塊中,分析各費用項對工程總造價貢獻度的大小,根據其對工程總造價貢獻的大小,對各費用項進行排序。在工程造價預測時,優先考慮貢獻度較高的費用項,在這里提出費用貢獻度的概念。
費用貢獻度原理:研究各分項費用對總費用構成影響的大小。定義分項費用貢獻度模型為

在實際的分析中,可對貢獻度進行賦權累加分析,直到貢獻度系數區間趨于穩定。
極限學習機(Extreme Learning Machine,ELM)是由Huang等人提出的一種新的性能優良的機器學習算法,該方法摒棄了傳統的調整神經網絡權值的策略,不但避免了陷入局部最小化的風險,而且極大地提高了網絡的學習速度和推廣性能。相關研究表明,ELM和SVM有近似的預測精度,但其參數易得,運算速度非常快,在學習速率上有明顯優勢。


ELM確定隱含層神經元個數和激勵函數g(x),對于每一組隨機生成的w 和b ,都可計算出一個唯一的β與之對應。具體步驟如下:
對網絡的輸入權值wi和隱層節點偏置值bi進行隨機賦值,i=1,2,…,M;
計算隱層輸出矩陣H ;
數據預處理
輸電線路工程造價費用構成主要包括費用、量、價、技術條件等。因此,造價預測研究采集數據來源自各網省《國家電網公司輸變電工程造價分析數據收集表(2013-2014)》,數據共采集2013-2014年各網省輸變輸電線路工程,其工程數量128個、造價分析數據20736個。因為采集到的數據中存在部分數據計算方式不同、數據單位不統一、數量級不統一等問題,需對樣本工程數據進行預處理。數據預處理常用方法為歸一化方法,關于數據的歸一化,很多文獻都有詳細的介紹,本文不再單獨介紹。
貢獻度分析
依據預處理后樣本工程數據,利用matlab軟件,計算“決算.靜態投資”與造價預測指標的貢獻度。取每個預測指標與靜態投資貢獻度的絕對值,貢獻度絕對值相等的指標,其對靜態投資的影響是相同的。將相關系數優化,同時統計有效樣本工程數。
貢獻度系數值越大,表明兩者之間的關聯度越大。初始貢獻度不足以說明兩者之間絕對的關聯度。根據統計學習理論,通過貢獻度累加,二次分析預測指標與靜態投資的貢獻度。
通過貢獻度初始優化和賦權優化,得出貢獻度區間[0.6,0.7]的概率為賦權系數0.8的界限,即對靜態投資的貢獻度系數應大于0.6,則根據貢獻度分析,可得造價預測主要指標包括:線路長度合計(折單)(0.761)、桿塔.總基數(基)(0.603)、桿塔.直線塔(基)(0.653)、導線.線材量(t)(0.886)、土石方量.基坑(0.736)土石方量.接地(0.738)、基礎混凝土總量(m3)(0.718)、基礎鋼材量(t)(0.886)。
隱含層結點分析
根據極限學習機預測理論,首先需確定隱含層神經元個數。通過多次實驗,進行累加計算,直到隱含層個數趨于穩定值。經過多次實驗和累加計算,發現誤差和最低的神經元層數基本確定在26,因此,將平均誤差隱含神經元個數確定值為26。如圖1所示。

圖1 多次待定隱含層個數預測誤差平均
造價預測及評價
樣本工程數量128個,由于主要指標數據缺省,有效樣本工程數量為75個。選取前60條工程數據作為訓練樣本,后15條工程數據為檢驗樣本(工程編號為A001-A015)。應用極限學習機造價預測模型對工程靜態投資進行預測,預測結果如圖2。

圖2 造價預測分析藍色:實際造價值;紅色:預測造價值。
綜合輸電工程造價預測結果,證明極限學習機可用于造價預測,由于采集樣本貢獻度僅為80%,且樣本數據可能有誤,因此預測絕對百分誤差在20%左右可接受。使用樣本數據進行神經網絡和支持向量機進行造價預測,絕對百分誤差分別為31.3%和24.7%,證明了極限學習機算法在預測精度上較神經網絡和支持向量機的優越性。
在算法時間復雜度方面,神經網絡算法訓練迭代10000次,用時22s,支持向量機預測用時14s,極限學習機為保證預測精度,預測500次取均值,僅用時27s,平均預測一次只需0.054s,因此極限學習機的運算速度較神經網絡及支持向量機較優。
10.3969/j.issn.1001-8972.2015.02.054