薛禮月,劉鑫,黃亦章,闞竟生
(國網上海市電力公司經濟技術研究院,上海 200002)
隨著電網輸變電工程尤其是變電工程的建設標準和數量不斷提升,對其建設過程數字化程度的要求也越來越高[1-3]。基于人工智能算法的變電站工程造價計算,已經成為電網工程技術經濟測算的輔助手段之一[4-6]。傳統的計算造價方式為:電氣專業向技經專業人員提供材料清冊,技經人員手動錄入物資并套取相應定額,工作量較大。通過利用電氣三維設計模型,結合人工智能數據挖掘算法,能夠有效減少識別錄入資源的工作量。并將設備及材料實體清楚地展現、量化,能夠有效提升三維設計造價的工作效率和準確性[7-10]。
基于統計學的變電站工程數據預測方法通常需要大量的歷史數據用來訓練,才可以得出相對準確的結果[11]。但考慮到不同電網工程項目存在不確定性,其所處位置、施工條件、設計技術要求等差異較大。單純根據歷史造價數據進行預測的準確度較低,易受高海拔、極端氣候條件或其他因素的影響造成變電站工程造價較高[12]。
文中基于三維Revit 軟件平臺的變電站工程相關數據,以電壓等級為分界,通過粒子群算法優化支持向量機(Support Vector Machine,SVM)的輸入權重和隱層閾值[13],對變電站工程造價數據進行分析并產生結果。最終通過將預測結果與變電站工程概算對比,驗證了文中方法在輔助變電站工程造價測算方面的有效性。
三維造價是提升變電站工程技經工作質量的重要舉措。其能夠實現自動化的造價編制,有助于提升工程造價中工程量計算的準確性以及工程計價的統一正確性。三維造價編制過程中能夠形成結構化的工程造價數據,可以進一步輔助造價評審工作。同時基于Revit的變電站工程三維造價研究是建設“數字上海”的環節之一,是構建全業務數據鏈的重要環節,符合工程設計數據信息“一次錄入、共享共用”思路。依托Revit 實現設計、技經階段數據協同共享,有助于提高公司信息化水平[14]。
變電站工程的造價計算通常需要在前期洽談階段為業主提供一個初步的估算,且單一的造價計算手段較為繁瑣,可能會出現較大的差異或錯誤。三維造價輔助測算可作為傳統三維造價算量的參考和校對,避免由于軟件BUG 或人為疏忽造成的缺量、材料冗余等問題[15-16]。
變電站工程數據由于所處環境不同,造價差異較大,有時甚至不在一個數量級,可能存在或大或小的誤差。因此,對變電站工程數據的預處理尤為重要[17]。
假設{Xt}是變電站工程各項設備數據異常的時間序列,則{Xt}利用ARIMA 模型的表示如下:

式中,α(B)是光滑算子,β(B)是可逆算子,?是α1,α2,…,αq的縮寫,B為延遲算子,α1,α2,…,αq代表α(B)的相應參數,β1,β2,…,βq代表β(B)的相應參數,是滿足正態分布的噪音序列。變電站工程數據的異常類型通常為獨立異常值模型。
粒子群算法是一種仿生優化算法,其主要原理可用鳥群覓食行為闡述,對應關系如圖1 所示。

圖1 粒子群算法與鳥群覓食行為對應關系
粒子用i表示,其速度和位置更新方程如下:

其中,ω為慣性權重,c1、c2為加速系數,其取值區間為[0,2]。random為隨機數,取值區間為[0,1]。
為避免最優解的出現,各粒子的權重系數用αi表示,i=1,2,3,…,m,j=1,2,…,n,則:

文中通過計算各個粒子的適應值和權重系數,使全局粒子均能得到兼顧,保證全局尋優的能力。
支持向量機以風險最小化為目標和原則,對樣本數量要求較低,可在小樣本情況下得到相對較準確的結果。
文中利用支持向量機算法進行預測,以變電站工程的歷史需求數據作為輸入;以各項子工程數據為輸出結果。
支持向量機的分類精準度仍受隱藏層激活函數g(x)的影響,激活函數主要包括二值激活函數、線性激活函數、Sigmoid 函數(也稱為S 型激活函數)及徑向基函數,常用的激活函數如下:
1)二值激活函數。其是指通過某種變化將樣本數據二值化的一種函數,其表達式如下:

其中,U(xi)為階躍函數。
2)線性激活函數:

3)Sigmoid 函數:

4)徑向基函數:

結合粒子群智能優化算法,對極限學習機的兩個參數進行最優選擇。
支持向量機輸入層的功能是將接收到的模型之外的傳入變量轉到隱含層中;隱含層作為輸入層與輸出層之間的橋梁,不直接承擔輸入與輸出的任務,其作用是對輸入的數據進行計算、分類、識別等;輸出層則是用于輸出結果的一個工作階段。總體算法原理如圖2 所示。

圖2 支持向量機算法原理
假設輸入層與隱含層之間的連接權值矩陣為w,則w如下式:

w的含義是輸入層與隱含層之間的連接函數,通常稱為輸入權值函數。
初始化單個個體初始值如下式:

其中,r為一組測量值與期望值間的偏差,每次迭代中首先比較測量值Fi與期望值pbest的數值。若Fi<pbest,則由Fi代替pbest成為最新的pbest;否則,維持現狀。然后比較Fi與gbest的數值,若Fi<gbest,則Fi取代gbest作為當次的最優解;否則,維持gbest取值不變。
以變電站工程歷史數據為基礎樣本,按變電站的電壓等級進行區分。為保持輔助預測的統一性,樣本均采用雙主變且容量相等的工程,流程如圖3所示。

圖3 基于SVM的變電站工程預測主要流程
具體步驟如下:
1)收集提取35 kV、110 kV 及220 kV 變電站工程的歷史數據,主要是變電站的各分項工程造價;
2)根據2.1 節所述內容進行數據預處理,剔除掉異常數據或錯誤數據;
3)選擇合適的核函數,文中所述方法采用混合核函數;
4)基于粒子群算法對支持向量機的輸出權值和隱層閾值等相關參數進行優化;
5)根據步驟4)所得結果,訓練生成SVM 預測函數,并輸入樣本進行測試。然后判斷所得結果的精度是否滿足要求:若滿足,則輸出該預測函數;若不滿足,則再次選擇核函數,重復步驟1)~4);
6)輸出預測結果。
文中通過收集各個電壓等級的數據樣本,以變電站工程項目所在的電壓等級、海拔高度、地質條件(A、B、C)等作為輸入。結合第4 節的步驟產生預測函數,并將輸出結果與各個電壓等級工程的數據信息平均值進行對比,以此凸顯文中通過改進支持向量機的預測模型的有效性。
為了選出最合適的隱藏層激活函數,實現最高的診斷準確率,文中采取試探對比的方法進行。選取233 組樣本進行對比,其中150 組作為訓練樣本,另外73 組作為測試樣本。保持隱藏層神經元個數相同,均為32 個。對激活函數進行性能對比,仿真結果如表1 所示。

表1 激活函數性能對比
文中選擇Sigmoid 函數和徑向基函數的混合作為激活函數。

圖4 神經元個數與分類精度的關系曲線
為了驗證文中所提方法的有效性和正確性,將SVM 預測方法與各個電壓等級平均值比較,結果對比如表2 所示。在35 kV 電壓等級,由于變電站工程數據相對較小、各種費用相對較低,其平均值和文中SVM 預測值準確度差異較小。但隨著電壓等級的提升,110 kV 和220 kV 電壓等級的準確度差別逐漸增大,表明了文中算法的有效性,能夠在變電站工程開展的前期階段預測各項工程數據,為變電站工程項目的決策提供參考。

表2 計算結果對比
文中將變電站工程中的歷史數據作為數據來源,基于數據挖掘技術,采用粒子群算法設計改進的支持向量機,優化支持向量機算法的拓撲結構、激活函數、隱層閾值和輸出權值,并取得了較好的效果,能夠在變電站工程開始的前期準備階段迅速得出相對準確的變電站工程數據預測結果,模型計算結果驗證了文中方法的有效性。但考慮到變電站工程所處環境的復雜性,同時隨著數據挖掘計算的不斷進步,這類預測算法仍有進一步優化的潛力,例如:1)根據變電站所處地理環境進一步增加輸入歷史數據的維度,將能夠更加準確地預估變電站的各項數據;2)時刻跟蹤新型人工智能數據挖掘算法,提升變電站工程數據預測的準確性與效率。