徐鑫乾,何宏杰,張 華,張可抒
(1.國網(wǎng)江蘇省電力有限公司,江蘇南京 210024;2.國網(wǎng)江蘇省電力有限公司經(jīng)濟(jì)技術(shù)研究院,江蘇南京 210008;3.常州常供電力設(shè)計(jì)院有限公司,江蘇常州 213001)
隨著電力行業(yè)的高速發(fā)展,發(fā)輸配變等各環(huán)節(jié)的電力工程投資日益增加,電網(wǎng)公司對其工程投資效益的管控也日趨嚴(yán)格[1-2]。而在電力工程項(xiàng)目管理過程中,產(chǎn)生了海量的工程數(shù)據(jù)。如何結(jié)合物聯(lián)網(wǎng)(Internet of Things,IoT)、人工智能(Artificial Intelligence,AI)等技術(shù)深度挖掘此類數(shù)據(jù)的潛在價(jià)值,實(shí)現(xiàn)電力工程項(xiàng)目的精準(zhǔn)投資與智能管控仍是有待研究的問題。目前,人工智能技術(shù)在電力領(lǐng)域的應(yīng)用主要集中于負(fù)荷預(yù)測、電網(wǎng)故障識別及智能運(yùn)維等方面[3-6]。而針對造價(jià)預(yù)測的應(yīng)用卻較少,且預(yù)測準(zhǔn)確度也有待提高[7-8]。
為此,文中利用導(dǎo)線截面、桿塔基數(shù)和地形系數(shù)等數(shù)據(jù),再結(jié)合機(jī)器學(xué)習(xí)(Machine Learning,ML)算法實(shí)現(xiàn)電力工程項(xiàng)目造價(jià)的精準(zhǔn)預(yù)測,進(jìn)而為智能化管控提供輔助。
灰色關(guān)聯(lián)度分析(Grey Relation Analysis,GRA)采用不同的影響因子來表征發(fā)展態(tài)勢的相似程度,再通過判斷因子之間的關(guān)聯(lián)性大小,實(shí)現(xiàn)對數(shù)據(jù)的精準(zhǔn)分析[9-10]。基于上述特點(diǎn),該文使用GRA 實(shí)現(xiàn)電力工程特征數(shù)據(jù)的提取。
假設(shè)電力工程靜態(tài)造價(jià)數(shù)據(jù)序列為Y={y(k)|k=1,2,…,n},且其可能存在關(guān)聯(lián)的影響因子共有M個(gè),而第m個(gè)影響因子數(shù)據(jù)序列為Xm={xm(k)|k=1,2,…,n},m=1,2,…,M。則GRA 包括的步驟如下:
1)數(shù)據(jù)標(biāo)準(zhǔn)化
為消除不同影響因子取值單位對計(jì)算結(jié)果的影響,以每個(gè)數(shù)據(jù)序列中的第一個(gè)數(shù)據(jù)為基礎(chǔ),對數(shù)據(jù)序列進(jìn)行標(biāo)準(zhǔn)化處理,即:
2)計(jì)算灰色關(guān)聯(lián)系數(shù)
將電力工程靜態(tài)造價(jià)序列Y與M個(gè)影響因子序列進(jìn)行對比,并計(jì)算其在每個(gè)數(shù)據(jù)點(diǎn)的灰色關(guān)聯(lián)系數(shù)。具體計(jì)算方式如下:
式中,|y(k)-xm(k) |為電力工程靜態(tài)造價(jià)序列Y與第m個(gè)影響因子序列,在第k個(gè)數(shù)據(jù)點(diǎn)的絕對值。ρ為極大值平滑系數(shù)。
3)計(jì)算灰色關(guān)聯(lián)度
將在各個(gè)數(shù)據(jù)點(diǎn)上的灰色關(guān)聯(lián)系數(shù)求算術(shù)平均值,得到電力工程靜態(tài)造價(jià)序列Y與第m個(gè)影響因子序列的關(guān)聯(lián)度,計(jì)算方式為:
4)灰色關(guān)聯(lián)度排序
式中,ro為灰色關(guān)聯(lián)度閾值。
針對海量電力工程數(shù)據(jù)的特征識別與價(jià)值挖掘,提出了基于GRA-PSO-SVM 的電力工程數(shù)據(jù)識別與處理算法,實(shí)現(xiàn)對電力工程靜態(tài)造價(jià)的精準(zhǔn)預(yù)測。算法模型如圖1 所示。

圖1 GRA-PSO-SVM算法模型
首先,利用GRA從電力工程靜態(tài)造價(jià)可能相關(guān)的眾多影響因子中,篩選出主要影響因子,以降低后續(xù)數(shù)據(jù)處理與特征識別的維數(shù),并提高算法的計(jì)算效率;其次,由于懲罰因子(Penalty Term)與核函數(shù)(Kernel Function)因子對支持向量機(jī)(Support Vector Machine,SVM)算法的性能影響較大,因此采用粒子群優(yōu)化(Particle Swarm Optimization,PSO)算法對這兩個(gè)關(guān)鍵參數(shù)進(jìn)行優(yōu)化;最后,通過SVM 算法實(shí)現(xiàn)電力工程數(shù)據(jù)特征識別,從而獲得電力工程靜態(tài)造價(jià)結(jié)果。
SVM 算法是一種基于機(jī)器學(xué)習(xí)的線性二分類器[11],其通過將低維度非線性數(shù)據(jù)映射到高維度空間,從而實(shí)現(xiàn)非線性優(yōu)化問題的線性轉(zhuǎn)化[12]。該算法求解難度與樣本空間維數(shù)無關(guān),且適用于高維度數(shù)據(jù)樣本,并具有優(yōu)秀的泛化能力。
SVM 算法的核心思想是決策一個(gè)具有最大邊距的超平面,進(jìn)而將數(shù)據(jù)樣本劃分為正類與負(fù)類。算法原理如圖2 所示。其中實(shí)心數(shù)據(jù)點(diǎn)屬于正類,而空心數(shù)據(jù)點(diǎn)屬于負(fù)類,正處于決策邊界線上的數(shù)據(jù)點(diǎn)則稱為支持向量。

圖2 SVM算法原理
尋找的超平面可表述為:
式中,φ(x)為實(shí)現(xiàn)數(shù)據(jù)空間x到高維空間H的映射函數(shù)。w為超平面的法向量,b為超平面的截距。此外為了避免內(nèi)積計(jì)算(Inner Product),φ(x)通常取為核函數(shù)。
通過引入松弛變量法(Relaxation Variable)來尋找最優(yōu)超平面的決策問題,其可轉(zhuǎn)化為以下優(yōu)化模型:
式中,λ為可調(diào)節(jié)大小的懲罰因子;γi為引入的松弛變量;N為數(shù)據(jù)點(diǎn)的個(gè)數(shù)。
為求解式(6)的優(yōu)化問題,建立Lagrange 函數(shù),從而將其轉(zhuǎn)換為:
式中,μi和νi為Lagrange 因子。
將式(7)左右兩邊同時(shí)對變量w、b、γi求偏導(dǎo)數(shù),并分別令其值等于0,可得到以下計(jì)算公式:
結(jié)合式(7)-(8),利用原對偶理論可求解該優(yōu)化問題,得到?jīng)Q策函數(shù)為:
為了方便計(jì)算,φ(xi)通常為核函數(shù),其計(jì)算方式為:
式中,σ為核函數(shù)因子。
SVM 算法中,核函數(shù)因子σ和懲罰因子λ均與算法的收斂速度、求解精度等性能相關(guān)。設(shè)置固定的因子取值,會導(dǎo)致算法出現(xiàn)過學(xué)習(xí)或欠學(xué)習(xí)現(xiàn)象,從而削弱算法的泛化能力。因此,為了提高SVM 算法對電力工程靜態(tài)造價(jià)問題的適應(yīng)能力,采用PSO算法對SVM 算法的核函數(shù)因子σ和懲罰因子λ進(jìn)行合理優(yōu)化,以提高算法的準(zhǔn)確性及穩(wěn)定性[13]。
PSO 算法是一種模擬鳥群飛行機(jī)制的智能仿生算法[14-16]。假設(shè)優(yōu)化問題共有M維變量,粒子種群大小則為N,且每個(gè)粒子均具有當(dāng)前位置x和飛行速度v兩個(gè)特征。
當(dāng)前位置x與飛行速度v的更新方法如下:
式中,x(t+1)和v(t+1)分別為粒子下一時(shí)刻的位置和飛行速度;q(t)為該粒子經(jīng)過的最優(yōu)位置,b(t)為粒子種群經(jīng)過的最優(yōu)位置;α1和α2為加速度參數(shù);r1和r2為區(qū)間(0,1)范圍內(nèi)的隨機(jī)數(shù);w為慣性參數(shù)。
q(t)的更新方法如下:
式中,q(t+1)為下一時(shí)刻粒子的最優(yōu)位置;f(·)為適應(yīng)值計(jì)算函數(shù)。
b(t)的更新方法如下:
引入慣性參數(shù)w是為了讓算法能夠避開局部最優(yōu)解,進(jìn)而使得其具有良好的局部與全局尋優(yōu)能力。該參數(shù)更新機(jī)制如下:
其中,wmax與wmin分別為慣性參數(shù)的上下限;g為種群代數(shù),G為最大種群迭代。
為了驗(yàn)證文中所提算法的有效性與正確性,從某省電網(wǎng)電力工程管理系統(tǒng)中篩選出了近5 年共220 條歷史數(shù)據(jù)作為數(shù)據(jù)樣本。同時(shí)將訓(xùn)練樣本及測試樣本按10∶1 的比例分配,并進(jìn)行仿真測算。
每條數(shù)據(jù)均包含圖1 中的X1~X8共8 個(gè)影響因子及電力工程靜態(tài)造價(jià)Y。對220 條歷史數(shù)據(jù)進(jìn)行灰色關(guān)聯(lián)分析,且將關(guān)聯(lián)度閾值設(shè)置為0.7,所得到的結(jié)果如表1 所示。

表1 GRA計(jì)算結(jié)果
由表可知,影響因子與靜態(tài)造價(jià)間的灰色關(guān)聯(lián)度排序?yàn)閄4>X3>X6>X5>X8>X7>X2>X1。其中,X4、X3、X6、X5和X8的關(guān)聯(lián)度均大于閾值0.7。說明這些影響因子與電力工程靜態(tài)造價(jià)存在較強(qiáng)的關(guān)聯(lián)關(guān)系,因此將其作為主要的影響因子。
經(jīng)過PSO 算法優(yōu)化后,SVM 算法中懲罰因子λ與核函數(shù)因子σ的最優(yōu)值分別為36.12 和0.016。
利用20 組測試數(shù)據(jù)對所提GRA-PSO-SVM 算法進(jìn)行測試,并將其與PSO-SVM 算法、SVM 算法進(jìn)行對比,結(jié)果如圖3 所示。

圖3 算法對比結(jié)果
從圖中可看出,所提算法的預(yù)測精度顯著優(yōu)于PSO-SVM 及SVM 算法。通過解析計(jì)算可得,其預(yù)測平均誤差僅為4.77%,而其他兩種算法分別為7.96%和11.33%。
此外,通過對比還可看出,PSO-SVM 相比SVM的預(yù)測準(zhǔn)確度更高。這是由于其利用PSO 算法對SVM 算法的關(guān)鍵參數(shù)λ與σ進(jìn)行了優(yōu)化,由此提高了算法預(yù)測的精確度。
而對比該文所提算法與PSO-SVM 算法可知,該文算法準(zhǔn)確度更高。原因在于GRA 算法篩選出了電力工程靜態(tài)造價(jià)的主要影響因子,降低了次要影響因子對預(yù)測結(jié)果的干擾。
將該文算法應(yīng)用到10 個(gè)實(shí)際電力工程項(xiàng)目中,項(xiàng)目靜態(tài)造價(jià)預(yù)測值與真實(shí)值的對比如表2 所示。由表可知,所提算法最大預(yù)測誤差僅為7.20%,而平均預(yù)測誤差則為4.62%,具有較好的預(yù)測精度,能夠指導(dǎo)電力工程項(xiàng)目的成本管控。

表2 電力工程靜態(tài)造價(jià)預(yù)測結(jié)果
該文利用電力工程項(xiàng)目數(shù)據(jù),結(jié)合人工智能算法實(shí)現(xiàn)電力工程靜態(tài)造價(jià)的預(yù)測。通過仿真分析表明,GRA 算法能夠準(zhǔn)確篩選出電力工程靜態(tài)造價(jià)的主要影響因子。而所提算法相比于PSO-SVM 算法及SVM 算法在電力工程靜態(tài)造價(jià)預(yù)測上具有更高的準(zhǔn)確度。且在10 個(gè)實(shí)際的電力工程項(xiàng)目應(yīng)用中,所提算法的平均預(yù)測誤差僅為4.62%,具有較為理想的預(yù)測效果。但該算法僅能獲得電力工程靜態(tài)造價(jià)的預(yù)測結(jié)果,至于如何利用數(shù)據(jù)識別與處理技術(shù)來實(shí)現(xiàn)電力工程動態(tài)造價(jià)預(yù)測,將在未來的研究中開展。