胡 憲,張彩友,馮毅萍,顧天雄,潘 戈,富銀芳
(1.浙江大學工業控制技術國家重點實驗室,杭州 310027;2.國網浙江省電力有限公司,杭州 310007)
隨著工業化的持續推進,社會用電需求量日益增加。在電力生產過程中,設備穩定運行是電網穩定生產的重要保障,故障預警通過預測設備在未來時間段內的潛在故障,協助運維人員提前定位系統不穩定因素并加以干預,成為設備主動運維的重要方法[1]。
特高壓換流站是國家智能電網建設的重要節點,承擔了遠距離輸電項目中交直流轉化的任務[2]。電力設備在換流站內按照其功能分布在不同的場區,同一類型的設備聚集在一起,為整個系統提供特定的服務。這種按場區聚集分布的特點有助于設備的管理和維護,分布在場區內部的檢測計算機專門負責其下管理的各個設備,為各類監控系統和預警系統的設計和部署創造了條件。典型特高壓換流站通常包括交流場、直流場等場區,及閥廳、換流變壓器、交流斷路器、平波電抗器、濾波器等設備,如圖1 所示。

圖1 國內某換流站場區分布
設備故障預測通過對設備運行過程中的工況數據進行時序預測,對比預測結果和參數指標來判斷設備的當前運行狀態[3]。設備狀態預測利用傳感器采集的現場數據按照設備規模的不同,可以分為單設備預測及多設備預測。秦超等針對單一設備提出了一種基于隱半馬科夫模型的老化因子,用于預測識別設備的健康因子和設備剩余壽命等信息[4]。王德文等針對多設備預測,將所有傳感器數據上傳至中央服務器進行模型的訓練和預測[5]。王佳梓等提出了一種以云端服務器為中心的設備維護架構方案,并具體分析了其關鍵技術[6]。
隨著數據規模的增大,集中式云端計算架構逐漸暴露出不足,邊緣計算的概念被提出并得到推廣[7]。楊駿等提出了一種基于邊緣計算的電量預測模型,在邊緣服務器端利用梯度提升樹實現了電量預測的在線學習模型[8];趙海濤等利用邊緣服務器處理各個車輛節點的數據,利用基于卷積神經網絡的深度學習方法預測車輛的風險[9]。上述方法利用邊緣計算資源實現了更加實時、輕量的參數預測,但是仍不能有效解決實際應用中由于邊緣節點獲取數據不充分、不均衡而導致的預測模型訓練數據不足的問題。
本文提出了一種基于邊緣側自編碼器壓縮的分布式設備故障預測方法,有效解決了邊緣節點數據共享的問題。
假設某場區A 有m 個設備,A 表示場區設備集合,Ai表示場區內第i 個設備,i=1,…,m;Ai設備共有n 個可監測工況參數,表示設 備的第k 個參數在t 時刻的取值,k=1,…,n。
以換流站換流變場區為例,共有12 個設備,其中第1 號設備站用變的監測參數包括油色譜油溫、繞組溫度等8 個,如表1 所示。此時,m=12,Ai表示站用變設備,表示站用變設備第1個參數油色譜油溫在t 時刻的數據。

表1 站用變設備監控參數
此時,針對站用變設備油色譜油溫參數的預測模型,根據輸入數據集的不同,可分為單參數時序數據及多參數時序數據。分別表示為:

式中:Mα,Mβ分別表示2 類預測方法的預測模型;N 表示預測采用的滑動時間窗口大小。其預測模型結構如圖2、圖3 所示。

圖2 單一設備狀態參數預測
上述結構是設備預測常用方法[10-11],其不足之處在于未從換流站整體生產運行狀態角度考慮不同場區設備之間存在的上下游關聯關系。為此,本文提出了一種基于邊緣側自編碼器壓縮的換流站設備預測模型結構,在圖3 多設備狀態參數預測結構的基礎上,擴大數據輸入范圍,綜合考慮多場區設備狀態參數以獲得更準確的時序預測結果。

圖3 同場區多設備狀態參數預測
其簡化的系統架構如圖4 所示,包括節點邊緣設備、邊緣服務器、工業網絡、云端服務器。首先,邊緣服務器接收來自本節點內的傳感器數據,在對數據進行預處理后通過自編碼器提取表征該節點實時狀態的關鍵信息,并通過網絡與其它邊緣節點共享數據,從而獲取比單節點更多的數據信息量,有助于做出更準確的預測。其次,利用本節點邊緣服務器部署的時序預測模型完成該節點設備的狀態預測。然后,各邊緣服務器將預測結果發送至云端服務器為后續的運維工作提供信息。

圖4 邊緣側設備狀態預測系統架構示意
在邊緣節點共享數據過程中,本文采用基于令牌環網的發送者-接收者模型[14],以保證快速穩定的信息傳輸;在信息傳遞之前,采用自編碼器壓縮的方式提取邊緣節點的關鍵信息,另外考慮到網絡阻塞的極端情況,用二次編碼的方式進一步降低網絡數據傳輸量。對于邊緣側預測模型,采用特征工程的方法構建時序預測模型的輸入數據,用于模型的訓練和預測。預測模型的整體工作原理如圖5 所示。

圖5 設備故障預測模型原理
邊緣節點之間的信息溝通基于分布式發送者-接收者網絡模型,如圖6 所示。在該模型中,場區被抽象成節點,場區內部的傳感器采集的數據被抽象為節點的屬性。節點之間能通過現場總線網絡進行通信。節點工作在接收模式或發送模式下,在某一時刻,整個網絡中至多只有一個節點為接收節點,其余節點發送數據至接收節點。當某節點需要其余節點信息時,只需要向全局發送廣播,同時將自身設置為接收模式,則能獲取發送節點的信息。接收節點通過分析自身數據以及來自其它節點的數據,能夠實現對全局信息的綜合考量。

圖6 發送者-接收者網絡模型
該模型通過信息共享來利用不同節點間生產過程中的設備關聯信息,增加了傳感器不足區域的數據支持。
自編碼器是一種特殊的前向傳播人工神經網絡,它由編碼器和解碼器兩部分組成。該模型將輸入作為輸出的目標,輸入數據經過編碼器的編碼過程獲得中間變量,再將中間變量作為解碼器的輸入,通過解碼器的前向傳播,獲得解碼器的輸出。利用輸出與原始輸入計算誤差,并用反向傳播算法來更新權值。
自編碼器的特點決定了其可以被用作數據的壓縮與降維。在編碼器的傳播過程中,隨著層數的增加,每個隱層的神經元節點個數呈遞減分布,反之,在解碼器的傳播過程中,各個隱層神經元節點個數隨著層數增加而增加。將編碼器的輸出,即解碼器的輸入作為自編碼器的中間值,可以獲得小于原始輸入數據維度的數值,該部分數值則為自編碼器的編碼,以X 代表場區內設備狀態參數集合,Xcode代表經自編碼器壓縮后的編碼信息,則其之間的關系為:

本文中,自編碼器被用于現場數據壓縮與關鍵信息提取。針對電力設備,在每個節點上部署自編碼器。
首先,設定結構的輸入和輸出神經元數量與節點的參數數目相同,并且根據訓練時間與訓練精度的關系,確定隱藏層的數量和各隱藏層中神經元數目。其次,將節點歷史記錄中的所有數據組織為訓練集用于自編碼器的訓練。保持自編碼器的輸入和輸出統一。
在訓練過程中,自編碼器將數據前向傳播,由于編碼器的隱層神經元逐層遞減,數據將被非線性壓縮。編碼器的輸出作為解碼器的輸入,其本身也是壓縮后的值,代表了原始數據中關鍵的信息,被稱為編碼。這部分信息雖沒有明確的物理意義,但能夠通過解碼器盡可能恢復成原始數據,是非線性壓縮后的結果,能夠在很大程度上保留數據的完整性。利用工業現場網絡傳輸自編碼器獲取的編碼信息,可以在較少的網絡數據傳輸量下讓其它節點獲取當前節點的整體關鍵信息。
編碼被用于接收節點的預測。編碼的長度由自編碼器的結構確定,也對應于接收節點端模型輸入的長度。在接收節點端,直接整合編碼信息到預測模型的輸入中進行預測,整體流程如圖7(b)所示。

圖7 自編碼器結構及編碼原理
雖然該方法能降低網絡的傳輸量,但實際生產中可能還會遇到網絡擁堵的極端情況。針對該問題,本文在自編碼器壓縮的基礎上提出二次編碼模型。二次編碼模型基于自編碼器獲取的編碼,對已有的編碼利用小型的自編碼器結構進行進一步壓縮。壓縮的方式不變,以初次編碼獲取的編碼信息作為輸入和目標輸出,設定小型自編碼器內部的節點數小于編碼信息的長度,對自編碼器進行訓練。以此可以獲得用以獲取更少維度的二次自編碼器。
在接收端,由于預測模型的輸入長度固定,并不能直接使用二次編碼進行數據預測,所以,接收端還須針對該二次編碼部署相應的解碼器,該解碼器為發送端訓練得到的小型自編碼器的解碼器部分的副本,能夠將二次編碼重新恢復成編碼信息,再進行數據預測。以Xcode-shortened代表場區的二次自編碼,則其關系為:

式中:EncX為場區X 的二次自編碼器的編碼器部分;DecX為場區X 的二次自編碼器解碼器部分。
二次自編碼器的結構與自編碼器結構相同,如圖7(a)所示,基于二次編碼的數據共享流程如圖7(c)所示,具體工作原理如圖5 中發送者和接收者節點所示。
二次編碼方案的使用需要結合工業現場總線網絡的實時情況,在網絡傳輸量小的情況下作為冗余的方案,不進行使用。但當網絡擁塞情況嚴重時,可自動切換為二次編碼的方案。該方案能夠在盡可能保證原有編碼信息量的情況下完成數據的精簡。
對于判斷網絡傳輸量是否過大,可以采用多種方法。例如,計算當前接收節點接收來自所有發送節點的信息所耗費的時間,或統計當前網絡中出現的信息錯誤的比例等。
LSTM(長短期記憶網絡)是一種RNN(循環神經網絡)的改進形式,專門被設計用于處理時間序列數據。由于其良好的預測效果,被作為本文邊緣節點端的時序預測模型。
LSTM 模型擁有3 個額外的門結構以及內部的元胞狀態來實現對以往數據的記憶工作。3 個門分別為輸入門、輸出門、遺忘門,這些門控制進出元胞的信息流,用于記錄重點信息和遺忘無價值信息。輸入門、輸出門、遺忘門有相似的機構,其原理為:

式中:W,b 分別對應各個層的權重以及各個門的偏置輸入。元胞狀態的當前值由式(8)計算:

該元胞數值與上一時間點元胞狀態數值按式(9)進行結合:

最終,LSTM 模型的輸出為:

由于良好的預測性能和精簡的模型結構,LSTM 模型被廣泛用于時間序列預測的問題。
邊緣節點LSTM 預測模型的輸入數據來源包括待預測參數的歷史數據、邊緣節點本地的其它參數當前數據、其余邊緣節點傳輸的編碼信息。
針對待預測參數的歷史數據,事先設置好一個固定的時間窗口,該窗口能包含該參數N 個時間節點的歷史數據。針對該部分的歷史數據,時序預測模型可以自動擬合其與未來數據的關系。
同一生產區域內部設備往往會有較多的耦合關系,所以模型將當前邊緣節點下的其余參數信息加以考慮,為了避免模型過于復雜,在此僅利用其余參數信息的當前時刻值,預測模型能自動擬合其余參數與待預測目標參數的關系。
最后一部分數據是來自其它邊緣節點的編碼信息。這些編碼按照邊緣節點編號順序排列,被整合進時序預測模型的輸入中。
綜上,該模型的預測公式為:


圖8 時序預測模型結構
為將本文所提出的設備故障預測模型應用于換流站電力生產現場,需要對模型進行訓練并部署上線。下文從該模型在生產現場的訓練和預測2 個角度,分別介紹了不同階段模型的工作流程。
邊緣節點預測模型的訓練采用節點的歷史數據,詳細流程如圖9 所示。訓練過程可分為3 步,詳細步驟如下。

圖9 系統訓練過程
Step1:本地主編碼器、二次編碼器訓練。為了對邊緣節點的關鍵參數進行提取,本文提出利用自編碼器在各個邊緣側節點處并行實現編碼、二次編碼的生成,具體生成過程在2.2 節中詳細介紹。
Step2:節點編碼傳輸。同一時刻,網絡中有一個節點成為接收節點,獲取來自其余發送節點的編碼信息并加以存儲。重復上述行為,直到所有節點均接收到其它節點的編碼。
Step3:本地預測模型訓練。獲取其它節點的編碼信息后,各個節點在本地進行預測模型的訓練。訓練過程可在邊緣節點內并行進行,達到分布式的訓練效果。
具有一定知識積累和技術經驗的人才,是提高食品藥品檢驗檢測能力的必要條件[8-9]。就目前而言,廣西地市級食品藥品檢驗檢測機構專業技術人員學歷較低,主要以本科及大專以下學歷為主,研究生及以上學歷人員很少。因此,應注重引進一些高學歷技術人員[10],提高研究生、博士生比例。以需求為導向,公開向社會招聘經驗豐富、高學歷的專業技術人才;以此為基礎,帶動檢測機構自身人才的成長,力爭培養更多的學科帶頭人[11-12]。
訓練后的邊緣節點模型可用于現場狀態的預測。預測步驟如圖10 所示。

圖10 系統預測過程
在每一個采樣時間點,對所有節點循環。接收節點接收來自發送節點的編碼或二次編碼。算法具體步驟如下。
Step1:發送節點根據網絡的實時質量,將當前時刻該節點的實時參數信息通過自編碼器和二次編碼器提取當前時刻的編碼或二次編碼,發送至接收節點。
Step2:接收節點接收編碼或二次編碼,若為二次編碼則通過部署在本地的對應節點二次編碼的解碼器恢復編碼信息。通過對二次編碼進行復原,能夠獲得可描述原始節點的直接編碼信息,所有編碼信息按照節點的順序進行拼接,共同組合成其他節點的編碼信息部分,作為預測模型的一部分輸入。最后,組合待預測參數的歷史數據、其它參數的當前數據、其它節點的編碼信息構成預測模型的輸入。預測模型將預測出下一時刻點待預測參數的數值。
以國內某特高壓換流站為例,該換流站內部按直流電到交流電的轉化順序分別有直流場區、換流器、GIS 以及交流濾波器。各個區域內部含有大量電力設備,其設備數據類型如表2 所列。采集上述傳感器數據,截取時間跨度為2018 年7月1 日到2019 年1 月1 日、采樣間隔為30 min的傳感器數據進行實驗。實驗對比分析了僅采用單變量為輸入的LSTM 模型、采用同一節點內多變量的LSTM 模型、本文所提出的多節點數據共享的LSTM 模型之間的效果。

表2 換流站場區及部分數據類型
獲取數據后,首先需要進行數據的預處理。對已有數據中的NaN 點進行平均值填充,即求取所有有效的參數值的平均值,將該平均值填入到NaN 數據點中。接著,考慮到換流站現場運檢任務“日比對、周分析、月總結”的特點,將數據以12 h 為間隔進行采樣,獲得采用后的時間序列。
為驗證本文所提出模型的預測效果,設置以下3 組實驗,不失一般性,以換流器場區內“站用變511B.油中溶解氣體.氧氣(μL/L)”為待預測的參數進行實驗。
2 號組:多變量組,輸入數據為待預測參數和同一場區內傳感器參數的歷史數據,各參數窗口大小均為N,模擬邊緣側服務器僅考慮其管轄范圍內的多個參數。
3 號組:數據共享組,本文提出的預測模型,綜合考慮待預測參數、同節點其余參數當前值、其它節點編碼信息作為輸入,模擬多個邊緣節點共享實時數據進行預測。
訓練之前,將所有數據以7∶3 的比例分成訓練集和測試集。為減少實驗偶然性,實驗共進行100 次獨立訓練與測試,并將100 次實驗中每次實驗獲得最好的結果求取平均值作為該組的最終成績。誤差計算方式采用RMSE(均方根誤差)。實驗中參數設置如表3、表4 所示。表3 展示了3組LSTM 模型的結構和訓練參數,由于1 組和2組不涉及節點間數據共享,不涉及自編碼器使用,所以其編碼長度為空,此外,設定LSTM 模型門結構激活函數為sigmoid 函數、輸出節點的激活函數為tanh 函數,輸出為未來一個時間步的預測值,并以均方誤差為損失函數進行訓練;表4 說明了第三組實驗中部署在各個場區內部的自編碼器結構參數,其輸入長度為對應場區每個設備的采集點數量乘以設備數,設備的采集點詳細參數如表2 所示。

表3 實驗參數-訓練參數設置

表4 實驗參數-編碼器結構設置
表5 展示了3 組方法結果最終測試誤差平均值和誤差序列對應的標準差,其中,誤差序列是選取某一次獨立訓練得到的LSTM 模型參數對測試集數據進行預測得到的預測值與真實值之間的誤差序列。可以發現,本文提出算法在測試誤差方面能夠較其余2 種方法有較好表現,其預測值與實際值的均方根誤差在3 組內保持最小,達到了RMSE 在0.018 0 的水平,相較于僅考慮待預測參數的傳統單變量模型降低了28.3%的誤差,相較于普通的邊緣側計算模型降低了12.6%的誤差,分析其原因,是由于該方法較其它2 種方法在預測過程中考慮了更多的設備信息,使LSTM模型能夠挖掘整個換流站各區域間的耦合關系,對設備狀態預測提供了有力的支持;同時,預測結果的誤差序列標準差也處于3 組中最小水平,表明誤差波動幅度小,預測更加“穩定”。

表5 實驗結果數據
圖11 展示了3 組方法在100 次實驗內某次獨立實驗中測試誤差隨訓練輪數增加的變化曲線。結果顯示,本文所提出的分布式預測模型能有更快的學習速度,并能取得更準確的預測值。

圖11 模型誤差對比
圖12 展示了100 次實驗中某次獨立實驗中,3 組方法局部的預測效果。從圖中可以比較,3 號組的預測結果能夠更好地擬合真實的數據:在前半部分(實線方框)的預測中,總體上預測曲線(虛線)比其余兩組更加貼合真實值曲線(實線);即使在預測偏離真實值后(虛線方框),也能在下一個時間節點調整預測結果,更好地擬合數據發展趨勢,有更少的時間滯后。

圖12 局部預測效果對比
實驗案例結果表明,本文所提出的基于邊緣側自編碼器壓縮的LSTM 預測模型能夠通過節點間信息共享的方式充分考慮其它節點的當前狀態,實現更準確的預測,從而為運維人員發現電力設備潛在故障提供了有效參考,與此同時,模型的訓練和預測任務從云端服務器被分散到各個生產區域的邊緣側服務器上,從而大量減輕云端服務器的運算壓力,充分利用邊緣側的計算資源。
在預測實時性方面,由于涉及多邊緣節點通信,模型預測的實時性相較單節點的預測模型會有滯后,但考慮到目前生產任務中“日比對、周分析、月總結”的要求,換流站的運維任務對實時性要求并不苛刻,所以本文提出模型可以被有效應用于生產中。
未來,本文所提出的方法仍有2 個方面值得進一步研究。一方面,在利用自編碼器獲取邊緣節點編碼時需確定合適的編碼長度,這決定了精度與效率的平衡,本文為降低實驗復雜性統一選取固定的編碼長度進行仿真,進一步工作可針對編碼長度的選擇方法加以分析。另一方面,目前是基于網絡正常工作的假設進行的,對于網絡不穩定情況下導致的設備離線場景還要有更完備的設計,這也是增強運維系統魯棒性的要求。