董 禎,王艷芹,王 勇,趙 賢,容春艷,聶 婧
(1.國網河北省電力有限公司,石家莊 050021;2.國網河北省電力有限公司經濟技術研究院,石家莊 050021)
目前,國內外對電網工程的造價預測研究主要集中在新建電網工程造價的預測[1-2],新建電網工程的工程造價指數估算電力造價靈敏度分析[3],以及一些造價體系、指標的研究[4];文獻[5]研究了通過相關項目實例,對建筑工程的整體造價進行預測。而在工民建、甚至是電廠的造價預測研究相對較多,文獻[6]采用回歸分析、神經網絡等預測方法對工民建行業進行了預測與對比,文獻[7]通過資金時間價值的理念對火電廠工程造價的控制方法進行了研究。
以上的大多數研究主要側重點是在指標構建和算法更新上,對數據的處理方法還未有相關研究,針對電網技術改造項目的造價預測更是國內研究空白。本文提出更符合實際的數據預處理和預測方法,即基于數據包絡分析(Data Envelopment Analysis,DEA)和經過遺傳算法(Genetic Algorithm GA)優化后的BP神經網絡的電網工程技術改造項目的造價預測。
目前電網技術改造項目主要包括交流變電工程、變電站全站綜合自動化改造工程、交流繼電保護工程、交流輸電工程、通信設備工程、通信光纜工程和調度自動化系統工程7項。造價管理作為技術改造項目建設管理的重要環節,直接影響企業的經濟效益和社會效益。技術改造項目種類繁多,分類復雜。因此,合理的指標體系,精確的預測模型都是目前電網生產技術改造項目造價預測亟需解決的問題。根據電力工程定額編制要求中的平均先進水平,通過DEA將存在投入冗余或者產出不足的數據剔除,將這些可能存在較大人為原因導致項目成本過高的數據剔除后,再對遺傳BP神經網絡進行訓練,用以精確預測模型。
2.1.1 決策單元
任何經濟系統或生產過程都可以被看作是某個單位(或部門)在一定可能范圍內,通過投入不同數量的生產要素同時產出不同數量的產品的活動。每一個需要對投入到產出進行決策的單位(或部門)被稱為決策單元(Decision Making U-nits,DMU)。因此,可以認為,每個DMU(第i個DMU常記作DMU i)都代表或表現出一定的經濟意義,其基本特點是具有一定的輸入和輸出,并且再配比投入的轉化成產出的過程中,努力實現自身的決策目標——利潤最大化。
生產活動可以表示為:

式中:x為DMU中的輸入向量;y為輸出向量??梢杂?1)式來表示這個DMU的整個生產活動。
2.1.2 生產等可能集
以上說的配比,是DEA的一個假設,即生產等可能集T={(x,y)y能用x生產出來},同時滿足以下假設:
凸性:對任意(x,y)∈T和[(x',y')∈T]及u∈[0,1]有u(x,y)+(1-u)(x',y')∈T。
錐性:若(x,y)∈T及k≥0,則k(x,y)=(kx,ky)∈T 。
無效性:設(x,y)∈T,及x'≥x,則(x',y)∈T;若y'≤y,則(x,y')∈T。
2.1.3 BCC模型
文中選擇BCC模型來篩選電網生產技術改造項目的數據樣本。DEA方法構造一條非參數的包絡前沿線,有效點位于生產前沿線上,無效點位于前沿線下方。CCR模型見公式(4)、(5),BCC模型見公式(6)、(7)。關于DEA松弛變量的計算規則以及效率的分析方法見參考文獻[6-9]。

式中:λj是權重向量。
本文對所有樣本數據根據技術改造項目來分類。以靜態投資費為輸入,以主變壓器電壓等級:智能化、改造臺數、單臺容量、單臺價格為輸出(以更換主變壓器為例),分別進行DEA分析,將純技術效率最低的5%、對神經網絡訓練會產生噪聲的樣本剔除。
本文用遺傳算法優化BP神經網絡的權值和閾值。具體步驟如下。
2.2.1 初始化種群
產生一個種隨機群Xm×n,每個個體X1×n代表神經網絡初始權值分布,單個基因值作為一個鏈接權值和閾值,即個體長度等于神經網絡權值加閾值的個數。見公式(7)

式中:n為個體的長度;r為輸入層神經元數;s1為隱含層神經元數;s2為輸出層神經元數。本文選擇浮點數編碼方式對權值和閾值進行編碼。
2.2.2 適應度函數
依據適應度函數值對個體進行評價,對所有個體解碼得到BP神經網絡輸入樣本,計算輸出誤差值En,適應度函數f如下:

其中,適應度最大的個體將直接進入下一代種群。
2.2.3 選擇算子與交叉算子
本文采用輪盤賭法選擇算子。設第i個個體的適應度為fi,則被選中的概率為:

式中:m為種群規模,一般設50~100。
本文的交叉算子選擇算術交叉法,交叉概率為pc,交叉算子見式(10):

式中:Xi(k)和Xi+1(k)分別為第i個和第i+1個個體在第k位子上的基因;α、β∈[0,1]。
2.2.4 變異算子
本文選擇均勻變異算子,對全部基因值以變異率pm在基因域內作隨機替換。

式中:q為第P+1個基因值對應的閾值寬度。
2.2.5 判別輸出
計算適應度函數f,判斷是否滿足精度或達到最大遺傳次數,并確定輸出最優個體或者返回第2步。
文獻[10]利用改進的BP神經網絡對光伏發電功率進行了組合預測。
神經網絡的基本單元是神經元,通常情況是多個輸入、單個輸出的非線性閾值器件。其最基本的McCulloch-Pitts模型結構如圖1所示。

圖1 McCulloch-Pitts模型結構
傳入et層第j個神經元的信號強度為Net,j,其信號強度遵守公式(12)。

式中:wij為第i個神經元作用于第j個神經元的權值。xi是輸入信號,或者是上一層神經元對該神經元的輸出信息。
θ對于神經元起閾值作用,若Net,j大于θ,則該神經元才能被激活。由此可得出McCulloch-Pitts模型的數學表達公式為

為了對非線性信號傳輸模擬地更加準確。本文所用的BP神經網絡的函數f為S型轉換函數(Sigmoid轉換函數)。
隱含層神經元數由經驗公式獲得。

式中:n為輸入神經元數量;l為輸出神經元數量;a為常數,起調節作用,a∈[1,10]。
本文使用正切的S型函數,見(10)式。

遺傳算法的全局搜索能力強,而BP神經網絡在求解局部最優的時候作用突出。文中通過DEA篩選和優化樣本數據,再通過遺傳算法優化神經網絡的權值和閾值,最后通過神經網絡對電網生產技術改造項目的工程造價進行了預測,文中算法簡稱DEA-GA-BPNN算法,其技術路線見圖2。

圖2 技術路線
文中以技術改造交流變電工程中的更換變壓器子項為例,設置遺傳BP神經網絡的最初輸入變量(主變壓器電壓等級,改造臺數,單臺容量,單臺價格,戶址類型)和最初輸出變量(靜態投資)。在DEA分析的過程中,對調神經網絡中的輸入變量與輸出變量。通過引入松弛變量的DEA模型,將綜合效率最低的5%的樣本剔除。剔除樣本后,探究松弛變量均值以優化神經網絡輸入指標,刪去松弛變量過大的指標(在本例中為戶址類型)。DEA樣本效率分析結果見表1。

表1 DEA效率分析
在剔除后的數據矩陣中,將DEA的輸出變量作為神經網絡的輸入層神經元,將靜態投資作為神經網絡輸出層的神經元進行訓練。GA-BPNN算法主要參數設置見表2。經過反復試驗,進化次數在少于100次的情況下,已經能足夠搜索到全局最優了,因此本文進化次數選擇100。種群規模一般取50~100,種群規模越大,個別的最優解就越不容易主導全體解的進化方向,但是計算時間較長。種群規模越小,找到最優解的速度就越慢。并且有局部優化的問題,本文取80。
在利用遺傳算法優化的過程中,權值和閾值的平均適應度函數見圖3。由圖3可以看出,適應度在進化100次以后已經達到了1.52。獲得了較好的初始權值和閾值,可以認定從全局里找到了近似最優解,剩下的可以交給神經網絡進一步獲得局部最優解。

表2 GA-BPNN算法主要參數

圖3 平均適應度曲線
經過遺傳算法優化的神經網絡的訓練的均方誤差(Mean Squared Error,MSU)見圖4。由圖4可知,在第3次訓練以后,下降梯度銳減,開始進入局部最優尋解的過程。在第76~87次的迭代過程中,驗證集MSU上升,訓練集在出現過擬合的情況,因此神經網絡跳出計算,判定第75次訓練獲得了最優解。

圖4 均方誤差(MSU)
在運行了75次以后開始呈近乎線性的趨勢出現神經網絡訓練失敗的情況,在單次訓練失敗次數超過12次的時候,跳出訓練循環,認為已經獲得了最優解。
不同訓練集、驗證集、測試集和全集的技術改造項目工程造價預測與實際數據回歸情況見圖5。以及技術改造項目預測系統輸出結果見圖6。發現DEA-GA-BPNN算法的精度非常高,訓練集、測試集和驗證集的回歸檢驗的相關性都能達到0.968以上。

圖5 不同集合的預測數據與實際數據的回歸情況

圖6 技術改造項目預測系統輸出結果
本文提出的預測方法能夠進行電網工程技術改造項目的造價預測,預測曲線基本上與實測曲線變化規律一致,預測結果的均方根誤差為8.30,對比文獻[11-12],本文的均方根誤差值屬于較小的范疇。
本文將DEA和遺傳神經網絡模型組合,并將其用于電網生產技術改造項目的造價預測,準確性較高,填補了技術改造工程的工程造價預測的研究空白。以技術改造交流變電工程中的更換變壓器子項為例,所構建的DEA GA-BPNN模型能夠優選輸入指標和樣本數據,并進行組合預測。合理運用模型中遺傳算法和神經網絡的部分參數,能夠滿足廣義工程造價預測建模和工程實際仿真需要,對電網生產技術改造項目乃至電網工程的造價預測具有一定的參考價值。