毛 華,房向陽,王 斌,孫 岳
(國網天津市電力公司,天津 300010)
隨著我國新型電力系統建設的推進,眾多電力建設工程正在廣泛地開展,而電網企業對工程建設投資及精益化運營管理的要求也越來越高。
數據挖掘(Data Mining,DM)是利用大數據、人工智能等先進技術實現海量數據分析及潛在價值提取的過程[1-2]。目前電網企業通過不同的信息化系統,實現了電力工程數據的采集與共享,且積累了海量的數據。然而其卻并未將這類數據轉化為有效信息,因此無法為企業的運營決策提供輔助指導[3-4]。
與電力工程建設相關的技術經濟工作貫穿于工程建設的各個環節,對于保障工程的質量、進度和安全均具有重要意義。目前技經工作仍依賴于人工作業,費時且耗力[5-6]。現階段已有研究利用回歸分析(Regression Analysis)、支持向量機(Support Vector Machine,SVM)與極限 學習機(Extreme Learning Machine,ELM)等[7-9]機 器學習(Machine Learning,ML)算法來實現對電力工程費用的預測。但受算法模型限制,其特征提取較為復雜,故預測精度有限。
針對此,文中結合雙向長短期記憶(Bi-directional Long Short-Term Memory,BiLSTM)和Attention 機制等先進算法,實現電力工程費用的智能計算,從而解決技經算量工作靈活性差、效率偏低及強度較大等問題。
電力工程數據智能分析系統總體結構如圖1所示。

圖1 系統總體結構
其包括表現層、業務層、數據層與物理層共四層結構,各層具體功能描述如下:
1)表現層:獲取用戶輸入的相關信息,同時將其所需的信息通過友好型界面進行展示,從而實現人機互動。該層的載體通常包括可視化大屏、瀏覽器和客戶端等。
2)業務層:利用表現層用戶提交的信息及數據層采集的不同電力工程項目信息,實現內部業務邏輯的處理。
3)數據層:實現對用戶數據、工程數據和造價數據等的存儲與檢索。該層的各類數據通常包括數據庫及數據對象兩個模塊,前者實現了對數據的分類以及分布式儲存;后者則通過面向對象技術(Object-Oriented Technology),建立與數據庫之間的映射關系,進而便于操作使用。
4)物理層:完成發、輸、配、變等電力工程數據的采集和獲取,且數據采集可通過智能傳感器自動采集上傳或從業務系統進行調取。
為了對電力工程多源數據進行智能融合分析,實現項目工程量及造價的精準預測。文中從相關數據中篩選出主要影響因素,并構建了電力工程智能數據處理分析體系。如圖2 所示,該體系共包括技術指標、工程量指標及費用指標三類共19 個指標。

圖2 電力工程數據分析指標體系
在上述電力工程智能數據分析指標體系的基礎上,文中提出了基于Attention 機制與BiLSTM 的電力工程造價預測算法,結構如圖3 所示。其將電力工程技術指標、工程量指標和費用指標等數據輸入由Attention 機制優化后的BiLSTM 模型,最終實現電力工程造價的精準預測。

圖3 該文所提算法結構
循環神經網絡(Recurrent Neural Network,RNN)是研究者們在處理長時間序列數據時提出的一種改進神經網絡[10-12]。該網絡通過循環體n實現模型參數的共享以及時序特征的關聯,其結構如圖4 所示。

圖4 RNN網絡結構
RNN 網絡的輸出為:
輸出值與真實值之間的誤差為:
因此RNN 網絡訓練的損失函數為:
該網絡采用梯度下降法進行模型訓練,則損失函數對于模型參數的偏導數為:
由式(4)可知,隨著RNN 網絡層次的增加或者當損失函數選取不恰當時,容易出現偏導數接近零或無窮大的問題,即梯度消失或爆炸。
而LSTM 是一種具有特殊結構的RNN,由于其能較好地解決梯度消失、爆炸的問題,得到了廣泛的應用。
LSTM[13-14]循環單位的結構,如圖5 所示。其最為關鍵的結構為三個“門”,且不同“門”實現的功能描述如下:

圖5 LSTM單元結構
1)遺忘門:控制t時刻LSTM 單元需過濾掉的、從t-1 時刻傳遞過來的部分狀態信息。
2)輸入門:控制t時刻LSTM 單元從t時刻輸入數據xt中新添加的信息內容。
3)輸出門:控制t時刻LSTM 單元輸出數據。
將三個關鍵“門”實現的功能用表達式進行描述,則有:
式中,σ(·)為激活函數;xt為t時刻的輸入數據;yt-1為t-1 時刻的輸出數據;ft、it和ot分別是三個“門”的輸出,其取值在區間(0,1)范圍內;而Wf、Wi與Wo分別為三個“門”的權重矩陣;bf、bi和bo則分別是三個“門”的偏置向量。
由圖5 可知,t時刻LSTM 單元的狀態為:
式中,WC和bC為輸入門的權重矩陣和偏置向量。
由于LSTM 模型僅適用于過去輸入數據對未來輸出存在影響的場景,而無法描述未來時刻輸入數據對當前時刻輸出的影響。所以在此背景下,BiLSTM 模型便應運而生。該模型通過在正向LSTM網絡基礎上疊加一層反向LSTM 網絡,從而增強模型的泛化能力。
此外,考慮到不同數據對電力工程造價預測的重要程度也有所不同。故在BiLSTM 層之后,引入了模擬人類大腦信息處理模式的Attention 機制。進而實現有選擇性的信息處理,并進一步提高電力工程造價預測的準確度。由此得到基于BiLSTM與Attention 機制的聯合模型[15-16],其具體結構如圖6所示。

圖6 BiLSTM與Attention聯合模型
BiLSTM 模型的計算過程如下:
Attention 機制的計算過程如下:
式中,Z為BiLSTM 層輸出向量;D為中間向量;a為注意力權重向量;Y為BiLSTM 與Attention 聯合模型的最終輸出向量。
為驗證文中所提BiLSTM 與Attention 聯合模型的準確性,從某省電網公司2016—2021 年中選取了120 條架空線路工程相關數據作為數據集。其中訓練數據有100 條,測試數據則為20 條。
利用測試數據集分析對比所提聯合模型與LSTM、BiLSTM 算法在電力工程費用預測方面的準確性。以桿塔工程費用預測為例,擬合曲線如圖7所示。從圖中可以看出,與LSTM、BiLSTM 模型相比,文中所提聯合模型的桿塔工程費用預測準確性較高,且平均預測誤差僅為3.6%。而BiLSTM 模型為6.3%,LSTM 模型則超過了10%。由此表明,該方法的擬合效果良好,能夠滿足精度要求。

圖7 桿塔工程單位造價預測結果對比
對架空線路的架線、基礎等其他五部分工程費用的預測結果進行對比,如表1 所示。可以看到,對于架空線路的不同工程,所提算法的平均預測誤差更低,且均小于5%。

表1 不同算法費用預測誤差結果對比
進一步將該文算法應用于三個實際電力工程費用的預測分析中,不同工程的費用預測結果及占比如表2 與圖8 所示。

表2 不同工程單位費用預測

圖8 3個不同架空線路工程費用占比
可以看到,桿塔、架線和基礎這三個部分的工程費用占比較高,均大于10%。尤其是桿塔工程,占總費用的30%~40%,且三個部分的工程累計占比約為85%。而附件、接地和輔助這三部分的工程費用所占比例較低,均小于10%。由此說明,桿塔、架線和基礎這些部分工程對總體項目費用影響較大,故在架空線路工程建設過程中要加強對其的監管。
針對電力工程費用計算的難點和重點,并結合深度學習技術,該文設計了電力工程費用的精準預測算法。仿真算例結果表明,所提算法的平均預測誤差小于5%,而LSTM 算法接近10%,BiLSTM 則約為6.5%。在實際電力工程中,桿塔、架線和基礎工程費用的占比較高,因此需加強對這類分項工程的管控。然而該算法僅實現了靜態工程費用的預測,無法結合工程實際推進情況進行動態費用評估,這將在后續工作中開展。