孔軍+曹小宇+肖峰
摘 要: 針對影響輸變電工程造價的因素較多,且各個因素之間相互聯系,形成一個相互交疊的網絡,從而導致造價預測難度較大,精度較低的問題。建立基于支持向量機的輸變電工程造價預測模型,其以輸變電工程造價影響因素為輸入自變量,預測造價為輸出值,通過支持向量機求解回歸方程,并通過交叉驗證來確定模型的相關參數,從而確定輸變電工程造價預測模型,進而通過模型來預測輸變電工程造價。最后通過樣本數據來對模型進行訓練,并對模型進行驗證,證明了模型的準確性。
關鍵詞: 輸變電工程; 支持向量機; 造價預測模型; 交叉驗證; 回歸方程; 模型驗證
中圖分類號: TN913?34; TP393 文獻標識碼: A 文章編號: 1004?373X(2018)04?0127?04
Abstract: There exist many inter?relational factors influencing the cost of power transmission and distribution project which form into an overlapping network. As a result, it results in big cost prediction difficulty and low forecasting precision. A predication model of power transmission and distribution project cost based on support vector machine is constructed. The regression equation is solved by the support vector machine with the influencing factors of power transmission and distribution project cost as the input independent variable and the predicted cost as the output value. Relevant parameters of the model are determined by means of cross validation so as to determine the prediction model of power transmission and transformation project cost. The model is trained by sample data, and the accuracy of the model is demonstrated by the model verification.
Keywords: power transmission and transformation project; support vector machine; cost prediction model; cross validation; regression equation; model verification
0 引 言
隨著電網工程的發展,輸變電工程的建設逐漸增多,如何對輸變電工程的造價進行快速精確的預測,成為電網公司急需考慮的問題。然而影響輸變電工程造價的因素較多,且各個因素之間相互聯系,形成了一個相互交疊的網絡,從而導致造價預測難度較大[1?4]。為此,本文建立了基于支持向量機的輸變電工程造價預測模型,并通過樣本數據來對模型進行訓練,最后對模型進行驗證,證明了模型的準確性。
1 模型建立
1.1 支持向量機基本原理
升高維數以及線性化處理是支持向量機的主要工作原理[5?6]。本文的側重點為利用支持向量機來對函數的回歸方程進行求解,并將支持向量機和權系數作為輸出結果返回。基于支持向量機的預測模型如圖1所示。對于一個數據集[ S=xi,yi],其中[i=1,2,…,m,]并且[xi,yi∈Rn],則基于支持向量機的預測模型是利用數據集S的樣本子集 [Sm-1∪xm-l-1,…,xm]來得到預測值[ym-l-1,…,ym]。其中 [l=1,2,…,m,]即在線性函數集中尋找函數[fx=w×x+b],其中[w]為權向量,[w∈Rn],且[Rn]為原始空間,b為函數[fx]的偏置值。為了使用支持向量機來對非線性函數的最優解進行求解,首要步驟是將非線性函數從低維特征空間映射到高維特征空間中,即升維。
1.2 輸變電工程造價預測模型建立
基于支持向量機的輸變電工程造價預測模型[8?10]可等價為基于模式匹配的函數映射。自變量[ xi],[i=1,2,…,n] 組成向量[X=x1,x2,…,xn],其代表影響輸變電工程造價的因素數值,[Xm=xm1,xm2,…,xmn(m=1,2,…,n)]表示第m年影響輸變電工程造價的因素指標值。而模型的應變量則為輸變電工程的造價指標值,設為[ yi],表示第i年的預測值。對于[yi]與 [X=x1,x2,…,xn]的關系,假設存在一個非線性映射關系F使得[yi=F(xm1,xm2,…,xmn)]。以 [Xm]為輸入自變量,[yi]為輸出,通過支持向量機來求解回歸方程[fx=i=1nα*i-αiKxi,x+b*],進而由回歸方程求得輸變電工程造價預測值,其主要步驟為:
1) 選取輸變電造價影響指標值樣本數據確定樣本矩陣,并處理樣本數據;
2) 確定合適的核函數,同時設定一個誤差限[ε],通過交叉驗證來獲得經過優化后的參數(C,[σ)。]具體方法為,將不同的(C,[σ)]分別代入到預測模型中對模型進行驗證,并將計算模型得到的輸變電工程造價預測值與實際數值進行對比,計算其均方誤差(MSE);endprint
3) 取模型預測值與實際造價數值均方誤差最小的所對應的(C,[σ)]作為優化后的(C,[σ)]值;
4) 將優化后的(C,[σ)]代入模型來檢測樣本數據。對于核函數[Kxi,x=exp-xi-x2σ2d],將用支持向量機求得的(C,[σ)]參數以及核函數代入到式(7)中,可得輸變電工程造價預測模型為:
2 計算機仿真及模型測試
2.1 樣本數據選擇
本文選取了某地區近幾年來已經建設完畢的220 kV變電站中的60個造價數據作為輸變電工程造價的樣本數據,來對造價預測模型進行訓練與驗證。樣本數據如表1所示。
首先通過前50組數據對模型進行訓練,然后通過后10組數據來對模型進行驗證。
2.2 參數選擇與模型訓練
對于式(8)所示的預測模型,其誤差限[ε]、懲罰因子C以及核函數參數[σ],均利用Matlab軟件通過交叉驗證法來仿真計算得到。在不同[ε]下對模型進行仿真,其結果如表2所示。可以看出,當[ε=0.05]時,其訓練誤差與測試誤差最小,故選取誤差限[ε=0.05]。
在確定誤差限[ε]后,選取核函數參數[σ]為0.25,在不同懲罰因子下對模型進行訓練,結果如表3所示。由此可知,當懲罰因子C=50時,訓練誤差較小,同時訓練誤差最小,故選取懲罰因子為C=50。
同樣,在確定誤差限預計懲罰因子后分別在不同核函數參數下對模型進行仿真訓練。得出當核函數參數[σ]為30時,此時測試誤差最小,訓練結果見表4。
在經過多次實驗后,確定誤差限、懲罰因子以及核函數參數,并通過Matlab程序來對模型進行訓練,求解得出其偏置值b為58.5,以及權系數[α*i-αi],如表5所示。
將所求得的參數,包括誤差限、懲罰因子和偏置值等參數代入到式(8)中,可得到預測模型。
2.3 預測分析
本文選取前50組樣本數據來作為模型的訓練樣本,并使用后10組樣本數據來測試預測模型的準確性。模型所預測的輸變電工程造價與實際造價的對比結果,如圖2所示。
由圖2可得,模型所預測的輸變電工程造價基本上與實際工程造價保持一致,誤差小。因而本文所建立的預測模型準確性較高,其能夠準確預測輸變電工程的造價,且對該預算具有一定的參考價值。
3 結 語
由于影響輸變電工程造價的因素較多,且各個因素之間相互聯系,形成一個相互交疊的網絡,從而導致在對輸變電工程的造價進行預測時存在較大難度。為此,本文建立了基于支持向量機的輸變電工程造價預測模型,其以輸變電工程造價影響因素為輸入自變量,預測造價為輸出值,通過支持向量機求解回歸方程,并通過交叉驗證來確定模型的相關參數。最后通過樣本數據來對模型進行訓練,并對模型進行驗證,證明了模型的準確性。
參考文獻
[1] 解晗.基于管控要點動態評價的輸變電工程全面造價管控研究[D].北京:華北電力大學,2015.
XIE Han. Research on total cost management and control of transmission and transformation project based on the dynamic evaluation of control points [D]. Beijing: North China Electric Power University, 2015.
[2] 周昊,錢亦雯,王閏瑤.基于工程量清單計價模式的輸變電工程造價風險評估模型研究[J].現代電子技術,2017,40(18):23?25.
ZHOU Hao, QIAN Yiwen, WANG Runyao. Research on cost risk assessment model of power transmission and transformation project based on bill of quantity valuation mode [J]. Modern electronics technique, 2017, 40(18): 23?25.
[3] 王佼,丁莉.500 kV架空輸電線路工程造價主要影響因素分析[J].東北電力大學學報,2012,32(5):9?11.
WANG Jiao, DING Li. Analysising the main impact factors on the build price of the 500 kV power line road engineering [J]. Journal of Northeast Electric Power University, 2012, 32(5): 9?11.
[4] 雷雨.變電站建設工程造價影響因素分析及控制策略研究[D].北京:華北電力大學,2015.
LEI Yu. Analysis of the influence factors of construction cost of substation and control strategy [D]. Beijing: North China Electric Power University, 2015.
[5] 位小記,謝紅,郭慧.基于支持向量機的數字調制識別算法[J].電子設計工程,2011,19(6):89?91.
WEI Xiaoji, XIE Hong, GUO Hui. Digital modulation recognition algorithm based on support vector machine [J]. Electronic design engineering, 2011, 19(6): 89?91.endprint
[6] 張東東.基于遺傳算法的支持向量機分類算法[J].電子科技,2015,28(12):32?35.
ZHANG Dongdong. Support vector machine classification algorithm based on genetic algorithms [J]. Electronic science and technology, 2015, 28(12): 32?35.
[7] 廖龍飛,王晶.面向多輸出系統的啟發式支持向量機回歸[J].北京化工大學學報(自然科學版),2011,38(2):118?123.
LIAO Longfei, WANG Jing. Heuristic support vector machine regression for multi output system [J]. Journal of Beijing University of Chemical Technology (Natural science edition), 2011, 38(2): 118?123.
[8] 李杰.改進粒子群算法優化支持向量機的工程造價預測[J].計算機系統應用,2016,25(6):202?206.
LI Jie. Project cost forecasting based on improved particle swarm algorithm optimizing support vector machine [J]. Computer systems & applications, 2016, 25(6): 202?206.
[9] 戴棟,黃筱婷,代洲,等.基于支持向量機的輸電線路覆冰回歸模型[J].高電壓技術,2013,39(11):2822?2828.
DAI Dong, HUANG Xiaoting, DAI Zhou, et al. Regression model for transmission lines icing based on support vector machine [J]. High voltage engineering, 2013, 39(11): 2822?2828.
[10] 尹世鋒.架空輸電線路覆冰厚度預測的數據融合方法研究[D].昆明:昆明理工大學,2013.
YIN Shifeng. Research on data fusion method of icing thickness prediction for overhead transmission lines [D]. Kunming: Kunming University of Science and Technology, 2013.endprint