彭露葦,李壽山,張四江,岳鐵軍,王亞麗
(國網甘肅省電力公司建設分公司,甘肅蘭州 730050)
推進電力工程建設是國民經濟發(fā)展的重要保障,但該工程具有實施周期長、投資成本大及建設環(huán)境復雜等特點。因此,如何通過有效的管控手段保證電力工程造價的科學性與合理性,進而實現(xiàn)投資資金與電力資源的優(yōu)化配置,是一個值得研究的關鍵問題[1-3]。
目前,電力工程造價的預測方法可分為兩類:1)統(tǒng)計學、模糊理論(Fuzzy Theory)等數(shù)學分析方法;2)支持向量機(Support Vector Machine,SVM)[4]、神經網絡(Artificial Neural Network,ANN)[5]等人工智能算法。上述方法雖在電力工程造價預測方面獲得了諸多應用效果,但單一的預測模型仍具有一定的局限性,故無法適應日益復雜的電力工程技術需求[6-8]。而融合多種算法的組合預測模型,能夠有效結合不同算法的優(yōu)勢,并充分利用各個系統(tǒng)的信息,從而進一步提高預測結果的準確性。
文中通過研究融合多類型智能算法的電力工程數(shù)據(jù)處理技術,并運用大數(shù)據(jù)分析算法來實現(xiàn)相關工程造價的精準預測,進而為電力工程的科學管控提供技術支撐。
電力工程數(shù)據(jù)處理系統(tǒng)如圖1 所示,其包括用戶層、展示層、業(yè)務層、數(shù)據(jù)層與數(shù)據(jù)庫。

圖1 電力工程數(shù)據(jù)處理系統(tǒng)
建筑信息模型(Building Information Molding,BIM)技術在電力工程項目的管理過程中被廣泛應用。通過其所構建的虛擬模型,可實現(xiàn)工程建筑全生命周期的信息共享,進而提升電力工程規(guī)劃設計、施工運維等環(huán)節(jié)的效率與智能化水平?;谔摂M建模的電力工程項目信息處理流程如圖2 所示。設計單位利用電力工程CAD 平臺及BIM 模型族庫來完成圖紙設計與電力工程的虛擬模型重建,并利用該模型的關聯(lián)數(shù)據(jù)實現(xiàn)工程量與工程造價的自動計算,從而為施工過程的項目管控提供輔助服務。

圖2 電力工程項目信息處理流程
針對電力工程數(shù)據(jù)處理分析,文中提出了基于虛擬模型重建與智能校核的PCA-PSO-SVR 算法,其框架如圖3 所示。首先,利用虛擬模型重建技術獲取電力工程數(shù)據(jù);然后采用格拉布斯法(Grubbs)對其進行智能校核,并剔除異常數(shù)據(jù),提升數(shù)據(jù)的質量;接著使用主成分分析算法(Principal Components Analysis,PCA)進行數(shù)據(jù)降維,從而提高數(shù)據(jù)處理及分析的速度;同時利用粒子群優(yōu)化算法(Particle Swarm Optimization,PSO)對支持向量回歸(Support Vector Regression,SVR)的懲罰系數(shù)C與核參數(shù)σ進行優(yōu)化,以提高其性能;最終即可實現(xiàn)電力工程造價評估。

圖3 智能校核與PCA-PSO-SVM融合算法框架
將新獲取的數(shù)據(jù)與已有的合理數(shù)據(jù)按照增序排列,則形成的數(shù)據(jù)序列{x}如下:
若新獲取的數(shù)據(jù)xi位于序列{x}的中間,判定其為合理數(shù)據(jù);若位于首尾段,則應利用Grubbs 法加以判斷。
Grubbs 法需首先設置一個異常數(shù)據(jù)識別閾值,該值為較小的概率值。其物理意義為:利用Grubbs法進行數(shù)據(jù)校核出現(xiàn)誤判的可能性[9]。數(shù)據(jù)xi校核結果的置信概率為:
式中,α為異常數(shù)據(jù)識別閾值,且其通常設置為0.010、0.025 和0.050 等。
進一步計算數(shù)據(jù)xi的判定值κ,具體計算公式如下:
式中,與s分別為數(shù)據(jù)序列{x}的平均值和標準偏差,則二者的計算可表征為:
式中,n為數(shù)據(jù)序列{x}的樣本總數(shù)。然后根據(jù)數(shù)據(jù)樣本總數(shù)n及置信概率P通過查詢經驗表來獲取λ(P,n)值。最后根據(jù)κ與λ(P,n)的大小進行判定:
若κ>λ(P,n),xi為異常數(shù)據(jù);否則,xi為合理數(shù)據(jù)。
1)PCA[10-11]是一種多維數(shù)據(jù)處理技術,其通過投影映射方式實現(xiàn)數(shù)據(jù)空間的降維與特征提取。
對于包含N個數(shù)據(jù)樣本,且每個樣本均具有M維特征的數(shù)據(jù)集,所構建的原始數(shù)據(jù)矩陣為:
其中,xnm為第n個數(shù)據(jù)樣本第m維的特征值。
為避免不同特征量綱對計算結果的干擾,需對原始數(shù)據(jù)進行標準化處理:
式中,為標準化后的數(shù)據(jù)值,和σm為所有數(shù)據(jù)樣本在m維特征值的平均值與標準偏差。
計算相關系數(shù)矩陣R=[rij]m×m:
計算相關系數(shù)矩陣R的特征值及特征向量:
式中,假設相關系數(shù)矩陣R共有P個特征值,則第p個特征值為λp,其所對應的單位特征向量為:
計算各個影響因素的貢獻度可得:
按照貢獻度大小進行降序排列,則有:
計算前h個影響因素的累計貢獻率,直至大于設置閾值εp,由此得到h個主要影響因素。前h個特征值對應的特征向量為:
則通過PCA 算法進行映射降維后,得到的數(shù)據(jù)樣本矩陣XPCA為:
2)支持向量回歸[12-13]通過非線性函數(shù)φ(x)將數(shù)據(jù)x映射至高維度空間,從而完成原求解問題的線性轉換。對于已知的數(shù)據(jù)集A={(xi,yi)|i=1,2,…n},可采用以下方法進行回歸擬合:
式中,w為權重矩陣,b為截距。
SVR 分析的關鍵在于求取w的值,通常利用最小化風險函數(shù)來求取:
式中,C為懲罰系數(shù);L為損失函數(shù),其計算方式如下:
其中,ξ為誤差均值。
通過求解式(16)的對偶問題可得到解ai和,則w表示為:
將式(18)代入式(15)可得:
式中,K(xi,x) 為核函數(shù),通常取為徑向基核函數(shù),則有:
式中,σ為核函數(shù)參數(shù)。
3)PSO[14-16]是常用的一種仿生智能算法,對于D維空間的尋優(yōu)問題,粒子i具有位置及速度兩個特征,可表示為:
二者的更新機制如下:
綜上所述,文中所提PCA-PSO-SVR 算法流程如圖4 所示。
以某電網公司輸電工程相關數(shù)據(jù)作為訓練集,驗證所提算法的正確性及有效性。
基于Grubbs 的智能數(shù)據(jù)校核過程分析如下:已存在一組合理的工程基礎土石方數(shù)據(jù),且對于A 工程,其基礎土石方為920.3 m3/km。將其按照從小到大排列,具體如表1 所示。該組數(shù)據(jù)平均值為581.45,標準偏差為161.92,利用式(3)計算得到κ值為2.09。根據(jù)經驗數(shù)值表可知,在95%的置信度下,λ(0.95,8)=2.03,即κ>λ(0.95,8),因此該數(shù)據(jù)為異常數(shù)據(jù),需要剔除。

表1 電力工程基礎土石方數(shù)據(jù)
采用相同訓練集進行模型訓練,并對比分析基于Grubbs 的智能數(shù)據(jù)校核對電力工程造價預測結果的影響,具體如表2 所示。Grubbs-PCA-PSOSVR 算法的平均相對誤差為3.69%,而PCA-PSOSVR 算法誤差則為4.54%。由此可見,Grubbs 模型能夠有效降低異常數(shù)據(jù)對工程造價預測結果的影響。

表2 智能校核模型對預測結果的影響
利用Grubbs 模型對訓練集進行數(shù)據(jù)校核、剔除異常數(shù)據(jù)等操作,并將其作為后續(xù)預測算法模型的輸入。對比文中所提組合模型與BP 神經網絡、SVR及PCA-SVR 等算法模型的預測準確性。所得結果如表3 所示,由數(shù)據(jù)可知,單一模型(BP、SVR)的平均相對誤差均大于10%;相比于單一模型,PCASVR 則經過數(shù)據(jù)降維處理,使得算法的平均相對誤差降低至8.07%;而文中算法在PCA-SVR 算法的基礎上,利用PSO 對SVR 模型的參數(shù)加以優(yōu)化,進而得到具有最優(yōu)性能的SVR 模型,故其平均相對誤差僅為3.73%。

表3 不同模型的預測結果對比
文中分析了電力工程數(shù)據(jù)處理系統(tǒng)架構及虛擬模型重建流程,提出了一種融合智能數(shù)據(jù)校核及組合預測模型的電力工程造價預測算法。仿真算例表明,Grubbs 校核方法能夠準確識別異常數(shù)據(jù),PCAPSO-SVR 組合模型則能夠有效提高電力工程造價預測的準確性。但該算法并未考慮市場、政策等因素的影響,故僅適用于電力工程的靜態(tài)造價預測。因此,這將在后續(xù)研究中進行改進。