深圳供電局有限公司 林志賢
由于電網調用業務操作具有多樣化特征,以單一的標準對其進行判斷會影響批卷結果的可靠性,為此,設計了一種基于機器學習的電網調度業務自動批卷系統,將具有強大計算能力的AMD Zen4處理器和數據轉化能力的SZ11-CBOX云盒作為硬件,利用AMD Zen4的Raphael搭建BP神經網絡,對業務操作的特征進行學習,通過K-means聚類過濾干擾,SZ11-CBOX將業務數據分類后,匹配待批卷數據與各分類特征之間的一致性,實現最終的評分。測試結果表明,系統的批卷結果與實際結果的擬合度可以達到99.0%以上。
為了確保電網調度業務操作的正確性,對實施的調度業務進行合理的評價分析是十分必要的。但是考慮到電網調度業務數據規模龐大,通過人工的方式逐一進行評判不僅會帶來大量的人力成本和時間成本,執行效率也難以滿足實際工作需求。基于此,本文設計了一種基于機器學習的電網調度業務自動批卷系統,分別對系統的硬件和軟件進行了設計,并通過實驗測試驗證了系統批卷結果的可靠性。通過本文的研究,以期為提高電網調度業務評價工作的執行效果提供幫助。
自動批卷系統的運行是建立在對數據特征學習的基礎之上的,因此要求處理器能夠實現對海量數據的高效計算,為此,本文選用AMD最新推出的3D V-Cache增強版Zen4處理器,其集成了128MB緩存,因此可以同時實現對更多數據的處理需求,現階段的主要應用途徑是搭載12代酷睿Alder Lake對大規模數據的集中處理。AMD Zen4處理器的搭載系統為Genoa,適配于桌面版的Raphael操作要求。從構架上看,Zen4架構采用分布式的構架方式搭建了更加扁平化的數據管理機制,全新研發的操作模式支持DDR5、PCI-E 5.0的協同操作,與Zen3相比,Zen4升級后新的平臺不再受服務器的版本限制,以AMD的EPYC服務器為基礎的產品線都可以與之建立適配關系。自帶的12組CCD可以滿足更大規模數據處理需求,每組8個核心,這種多核心的構建模式使其對不同類型數據的處理更加靈活,對應的192個線程增加了應用系統的荷載能力。不僅如此,Zen4在功耗方面也表現出了更高的先進性,頂級Zen4的TDP默認功率為320W,高壓下功率最高可達到400W,極致狀態下1ms的瞬間功率可以達到700W,持續時間為5s,這樣的處理效率決定了當系統出現負載沖擊時,可以通過對Zen4狀態進行調節緩解這種壓力,確保系統的穩定運行。
為了提高自動批卷系統應用范圍的覆蓋性,本文在系統中搭載了云盒裝置,采用的具體設備為順舟SZ11-CBOX。為了確保系統中數據的安全性,SZ11-CBOX的防浪涌系統可以將小規模的負載沖擊進行解耦處理,將其轉化為更加均勻的數據流,通過這樣的方式確保系統可以在更大范圍內實現可靠運行??紤]到實際的系統應用環境存在一定差異,復雜的電源環境可以會引起系統的異常波動,SZ11-CBOX自帶的電源轉換模塊可以實現交流/直流電源的有效控制,通過采集模塊和計量模塊的聯合作用,對系統的網絡路由和交換關系進行實時調控。不僅如此,SZ11-CBOX的設計充分考慮了其在多功能性和穩定性方面的應用需求,將物聯網技術作為云盒設計的基本架構,以此為基礎,系統在業務數據收集和批卷過程中,可以實現多源同時進行,自帶擴展屬性可以適應不同硬件設備的接入需求。SZ11-CBOX支持Wi-Fi,4G,網口,光口入網方式,并允許多網同時在線,光口的二層組網能力使之具有更高的靈活性,在環型、鏈型組網場景都可以有效運行。嵌入式交換通信模塊可以滿足系統增加或刪減網絡配置的需求,支持有線、無線相互備份,為數據的正常穩定傳輸提供可靠基礎,斷網條件下的數據備份切換不受影響,支持AP,STA,Repeater多種模式的無線擴展請求,在LoRaWAN協議下可以實現數據的透明傳輸,MODBUS RTU轉TCP、MQTT功能的實現都是以LoRa、ZigBee為基礎完成的,因此可以幫助用戶更加便捷地了解SCADA Modbus指令攜帶的信息。
對業務的批卷處理首先要建立業務的正確標準,以人工方式進行批卷主要是以實際的操作經驗為基礎進行的,但系統作為一個單獨的個體,其對特征和規律的積累主要是建立在數據積累的基礎之上的,因此,為了獲取可靠的批卷標準,本文利用機器學習的方式提取電網調度業務的操作特征。
首先在系統的AMD Zen4處理器中導入電網調度的歷史數據X,由于不同業務的操縱存在明顯的差異性,這也將直接導致對應的操作特征存在不同。為此,本文首先利用Raphael將數據X按照業務類型進行劃分,劃分后的調度業務數據可以表示為:

x
表示具體的分類結果。以此為基礎,利用機器學習的方式對不同分組的特征進行提取,本文構建了三層的BP神經網絡實現該過程。其中,輸入層的輸出結果和隱藏層的輸出結果分別作為隱藏層每一個神經元輸入和輸出層的輸入值,隱含層的主要是對數據中相同操作的提取,考慮到相同業務的操作存在不唯一性,因此本文搭建的隱藏層為2層,隱含層的計算方式為:

其中,B表示關于x分類的業務操作特征,p表示i操作出現的頻率。此時的提取結果是整體數據的特征,存在部分異常數據的干擾,以此作為批卷的標準會影響結果的可靠性。為此,在隱含層的第二層,對提取的特征值進行聚類處理,以此過濾干擾作用。利用K-means聚類的方式如圖1所示。

圖1 特征聚類方式Fig.1 Feature clustering method
如圖1所示,將第一隱含層的計算結果表現出的規律性作為聚類依據,聚類中心的計算是以規律的重疊位置為基礎設定的。通過這樣的方式確定最終的判定依據,將其在神經網絡中反向輸入測試提取結果的可靠性,最后將結果存儲到處理器中。
在得到不同業務數據的操作特征后,為了提高判卷的效率,對業務進行分類。
上文已經提到,單一業務的操作是多樣化的,從操作特征角度對數據進行分類難度較大。因此,本文利用SZ11-CBOX的數據轉換模塊,將業務轉化為統一的形式,對業務進行分類,分類的過程如圖2所示。

圖2 業務分類過程Fig.2 Business classification process
如圖2所示,SZ11-CBOX首先將業務數據統一化處理,并刪除數據中的變異值,這里的變異值是指樣本數據中業務操作存在錯誤的數值。最后再根據上文提取的特征結果構建分類樹,這樣的分類方式可以在不破壞數據關聯性的基礎上,實現數據的精細化分類。將分類后的數據保存在處理器的計算單元。
利用分類結果,就可以實現對電網調度業務的批卷處理。
在上述基礎上,系統對電網調度業務的批卷處理流程如圖3所示。

圖3 系統自動批卷流程Fig.3 Automatic marking process of the system
系統接收到待批卷業務數據后,首先對其進行初始化處理,該階段主要是利用SZ11-CBOX將數據轉化為與系統內基礎信息一致的形式,通過分析轉化后數據的特征,將其與處理器計算單元的分類建立匹配關系,確定其所在的分類,以此為基礎,具體對比操作步驟,確定最終的評分結果。以此完成對電網調度業務的自動批卷。
將本文設計的自動批卷系統應用到實際的電網調度業務分子中,測試系統功能是否能夠實現對業務辦理流程正確性的準確判斷,以此檢驗系統功能的有效性。
本文將同一批工作人員的業務操作樣本作為測試對象,比較系統判卷結果與實際操作結果的一致性,并通過逐個對比的方式,對系統批卷結果的可靠性進行分析。其中,實驗采集的數據為1000個操作樣本數據,樣本中覆蓋的業務類型為10類,分別面好1-10,每類100個業務。在實驗測試前,首先通過人工的方式對業務操作的每個步驟進行判卷,并對結果進行標記,將其作為系統的期望判卷結果,存儲于數據庫中Sample表中,再使用系統對業務操作進行判卷處理,最后對比系統批卷結果與期望結果之間的差異。
為了簡化對判卷結果分析的難度,本文以契合度作為分析指標,其計算方式為:

其中,e表示系統判卷結果與實際結果的契合度,i表示對應的業務分類,p表示系統批卷結果,P表示期望批卷結果。
以此為基礎,對系統的批卷效果進行評價。
在上述基礎上,統計了本文設計系統對10個分類業務的批卷效果,具體如表1所示。

表1 系統判卷結果統計表Tab.1 Statistics of system grading results
從表1中可以看出,系統對業務的批卷結果與實際結果之間的擬合度始終保持著較高的水平,最高契合度可以達到100%,最小契合度也可達到99.0%。在評分結果上,最小誤差為0,最大誤差也僅為0.8,未出現明顯的誤差,表明本文設計的自動批卷系統可以實現對電網調度業務執行情況的準確判斷,具有一定的實際應用價值。
隨著電力資源應用需求的不斷提高,對于電網資源的調度業務操作提出了更高的要求,不僅要實現高精度的資源分配,同時也要對調度的合理性作出更加精細化的管理。本文提出基于機器學習的電網調度業務自動批卷系統,利用機器學習的優勢,對以往調度業務操作的特征進行分析,并以此作為判斷業務操作效果的依據,實現自動化的電網調度業務評價。通過本文的研究,以期為縮短業務批卷時間,為提高電網調度業務優化效率提供有價值的參考。