汪 江,溫 煒
(1.國網寧夏電力有限公司培訓中心,寧夏 銀川 750001;2.華中科技大學計算機與科學技術學院,湖北 武漢 430074)
由復雜電網和交直流混聯系統構成的電力系統[1-2],作為橫跨我國全部省會的實時在線系統,能夠通過逐時段潮流的方式為各受端系統提供能源支持。電力感知數據作為能源供應鏈中的龐大數據集,在展示電網調度性能方面起到重要的作用。然而,電力系統的傳輸特性決定了電力感知數據的冗余度。為了從海量電力感知數據中檢索可用信息,可以通過頻繁挖掘的方式,發現某些電力感知數據在給定時間范圍內出現的頻率較高。這些數據可能具有關聯性或重要性。因此,研究電力感知數據頻繁項查詢方法具有重要意義。
文凱[3]等通過頻繁項挖掘算法創立候選項數據集,將數據分流后持續壓縮數據集內頻繁項進位時段,從而在實現電力感知數據頻繁項查詢的同時減少了時間開銷。但該算法的系統負載較大。劉衛明[4]等通過計算大數據環境下負載不均衡的節點冗余度,確定頻繁項集中能夠有效避免冗余搜索的合并節點,并在忽略合并節點的前提下提出超集等價剪枝策略,以實現電力感知數據頻繁項查詢。但該策略的計算過程較復雜。
為了解決上述方法存在的問題,本文提出基于時域特征的電力感知數據頻繁項查詢方法。該方法通過分析電力系統的拓撲結構和運行狀態,挖掘其中的電力感知數據,以提高查詢效率;根據數據的頻域和時域特征,通過貝葉斯分類算法計算特征值出現頻次,以縮短計算過程、完成電力感知數據頻繁項查詢。
截至目前,評估電力系統狀態仍需要電力感知數據的參與。想要獲取更加精確的電網走勢情況,挖掘電力感知數據是必不可少的操作步驟。通常情況下,我國各省市電網的主要數據來源隸屬于國家電網安全總局的能量管理系統。這意味著電力系統供電途中產生的電力感知數據也會作為量測數據存儲于能量管理系統中。挖掘電力感知數據,即從能量管理系統中采集廠站轉發的量測數據。其具體操作過程包括估計電力系統運行狀態和挖掘系統內部電力感知數據這2個步驟。能量管理系統的拓撲結構如圖1所示。

圖1 能量管理系統的拓撲結構
由圖1可知,能量管理系統主要由人機交流、數據分析、預測和決策優化這4個部分組成。人機交流部分用于獲取能量管理系統的實時數據。數據分析部分用于獲取歷史數據和預測數據。預測部分用于負荷預測、發電預測和電價預測。決策優化部分用于制定調度計劃。接口用于接收能量管理系統的狀態,以便實時調整。
在無外界因素干擾的正常情況下,電力系統運行狀態滿足自適應代理模型[5],即電網數據的時變特性圍繞非線性自回歸滑動平均(autoregressive moving average,ARMA)模型回歸線展開。以電力工業生產環節的實際工況為例,一次電網運輸過程可能受到隔離開關位置信息、電力變壓器、母線電壓等多種不良因素的影響,出現電力感知數據邏輯判斷失誤等問題。因此,在采集電力感知數據前粗略預測電力系統的大致運行狀態,能夠起到規避電力電量失衡的作用。自適應代理模型為:
(1)
式中:d為電壓相角,(°);γ為電力系統供電開始時刻;θ為電力系統供電終止時刻;i為功率上下限值。
不良因素檢測計算式為:
(2)
式中:λ為電線傳輸功率,kW;G為斷面裕度;r為線路平均損耗;π為網損分布。
電力系統運行狀態的估算式為:
(3)
式中:w為凈注入有功功率,kW;di為電壓幅值,V;x2為交流輸電線路阻抗;x1為交流輸電線路零序參數。
在成功預測電力系統運行狀態的基礎上,本文約束交直流混聯電網在發電、變電、輸電、用電這4個方面的恒電流與恒電壓,使電力系統恒壓輸出。此時,能量管理系統內參與辨識和修正的電力感知數據處于鋸齒狀波動的活躍階段。根據電網的縱向連續性和橫向連續性,可知相鄰日期的所有耗電元件均受日負荷與次日負荷的反饋控制,呈現出電量乘積與總發電量比值小于單位碳排放量的標準趨勢。因此,根據標準趨勢定向采集傳輸活躍的電力感知數據,即可實現系統內部電力感知數據的挖掘。恒電流在交直流混聯電網發電、變電、輸電、用電這4個方面的約束式為:
(4)

恒電壓在交直流混聯電網發電、變電、輸電、用電這4個方面的約束式為:
(5)
式中:Δs為線路末端電壓,V;α為用電量;b為年度負荷;q為斷面潮流限值;m1為發電機組出力上限;m2為發電機組出力下限;μ為發電量,kW·h;tR為發電頻率,Hz;v為風電場風速;δ為變電量;y1為變電站母線規格;c為輸電量,kW·h;y2為線路首段電壓,V。
日負荷與次日負荷的反饋控制式為:
(6)

為實現電力感知數據頻繁項的查詢,需要對電力感知數據進行貝葉斯分類算法處理,使對應的頻繁項可以被聚類在一起。查詢電力感知數據頻繁項流程為:首先,挖掘出電力感知數據中的頻繁項;然后,提取其時域特征,并將時域特征輸入貝葉斯分類算法中進行處理。通過這一分類算法,可以進一步深入了解電力系統運行的狀況,并識別出異常情況。
從宏觀角度看,時域特征是由頻域[6]和時域共同組成的活動性特征。由于存在加速度變化,時域特征常用于描述信號、輸入向量或實時性統計信息隨級數增長而逐步劇烈的擾動情況。在實際生活中,單獨提取時域特征能夠起到推測數據集角加速度[7]、合理分配單位采樣時間內多組相關數據的作用。相較于邏輯疏密性優良的其他數據,電力感知數據由于存在不容忽視的電壓暫升、暫降、瞬時中斷等問題,其邏輯疏密性不僅較差,還具有明顯的波動與閃變[8]。這種由諧波震顫效應導致的邏輯疏密性下降問題屬于不可修正的負積分問題,因此無法通過更改樣本數據的輸出權值,從而達到訂正邏輯疏密性的目的。
由諧波震顫效應導致的電壓暫升、暫降、瞬時中斷如圖2所示。

圖2 電壓暫升、暫降、瞬時中斷示意圖
考慮到過電壓[9]與欠電壓[10]的持續時間一般不超過電力系統實時活動信息的2個滑動周期,因此本文在提取電力感知數據的時域特征時,需要將注意力集中于三軸加速度相同的2個滑動窗口[11]。諧波震顫效應為:
H=z(e)+gs+fst′(ls-ls+1)
(7)
式中:z為正弦交流分量;e為波動頻率,Hz;gs為基波頻率整數倍的正弦交流分量;fs為振蕩暫態;t′為單相電壓信號;ls為諧波衰減常數;ls+1過電壓與欠電壓持續時間為:
D=?sin(ηrm+3Ψ)+cos(hm-1)+f′
(8)
式中:?為過電壓質量,%;η為欠電壓質量,%;rm為低通濾波;Ψ為基波角頻率,Hz;hm為正弦電壓初相角,(°);f′為過電壓與欠電壓的出現時間,ms。
本文以三軸加速度相同的2個滑動窗口為目標區域,提取電力感知數據的時域特征。時域特征提取式如下。
(9)
式中:βb為可調參數;im為波速經驗值;c′為回波部分具有的周期性特征。
貝葉斯分類算法是以貝葉斯分類器[12-13]為元件的給定樣本分類算法。本文將提取成功的時域特征作為樣本數據輸入貝葉斯分類算法。算法根據單位時間內特征出現頻次,將電力感知數據劃分為多組后驗概率差異顯著的類別區間。通過鎖定頻次占比較大的類別區間,可實現電力感知數據頻繁項查詢。
根據貝葉斯分類算法實現的電力感知數據頻繁項查詢的具體步驟如下。
①設a為待分類項集合Z中的特征屬性,則Z={a1,a2,…,an};將待分類項集合Z作為訓練樣本集。
②設C為有類別集合,則C={o1,o2,…,on}。其中,o為有類別集合中的特征屬性。
③獲取各類別特征屬性的概率估計為:P(a1|o1),P(a2|o1),…,P(an|o1);P(a1|o2),P(a2|o2),…,P(an|o2);P(a1|on),P(a2|on),…,P(an|on)。
④在各類別特征屬性獨立的前提下,根據貝葉斯定理推導特征屬性的概率為:
(10)
⑤步驟④中最大值即為最終查詢結果。
為了驗證基于時域特征的電力感知數據頻繁項查詢方法的整體有效性,本文對其進行測試。試驗操作系統為Windows10,64位。系統內存為16 GB。中央處理器(central processing unit,CPU)負載采樣間隔為5 ms。本文采集某市電廠中的1 000個電力感知數據,以其作為試驗數據進行以下試驗。
為了測試基于時域特征的電力感知數據頻繁項查詢方法的性能,本文將本文方法與文獻[3]方法和文獻[4]方法進行對比測試。
查全率可以計算電力感知數據中數據頻繁項的比率。查全率越高,則挖掘范圍越廣、查詢性能越好。不同方法對電力感知數據頻繁項的查詢性能對比如圖3所示。

圖3 不同方法對電力感知數據頻繁項的查詢性能對比
由圖3可知,采用本文方法對電力感知數據中頻繁項進行查詢時,查全率維持在97%以上;而采用文獻[3]方法和文獻[4]方法查詢電力感知數據的頻繁項時,其查全率范圍分別為94%~97%和%89~93%,查全率較低。該結果證明,本文方法的查詢性能更好、對頻繁項的挖掘范圍更大,可以有效挖掘電力感知數據中的數據頻繁項。
測試將電力感知數據分為5組,平均每組200個電力感知數據,利用3種方法對電力感知數據的頻繁項進行查詢。查詢的電力感知數據數量越多,證明所使用方法的查詢能力越好。不同方法對電力感知數據頻繁項的查詢能力對比如圖4所示。

圖4 不同方法對電力感知數據頻繁項的查詢能力對比
由圖4可知,在5組試驗中,本文方法查詢到的電力感知數據的數量始終在180個以上,而文獻[3]方法和文獻[4]方法查詢到的電力感知數據分別在160個、130個左右。該結果證明本文方法的電力感知數據頻繁項查詢能力更好。
為了進一步驗證所提方法的實用性,測試分別采用本文方法、文獻[3]方法和文獻[4]方法查詢電力感知數據的頻繁項,并記錄不同方法的時間開銷和內存開銷。通過對比測試,可以判斷不同方法的查詢效率和計算復雜度。不同方法的時間開銷和內存開銷如表1所示。

表1 不同方法的時間開銷和內存開銷
由表1可知:采用本文方法查詢三組電力感知數據的頻繁項,其時間開銷和內存開銷均低于采用文獻[3]方法和文獻[4]方法。這可能是由于本文方法在提取電力感知數據的時域特征時,考慮了三軸加速度相同的2個滑動窗口,在一定程度上提高了查詢效率。結果證明本文方法的查詢效率高、計算復雜度低,進一步驗證了本文方法的實用性。
在電力系統中,電力感知數據的應用越來越廣泛,各種電力電子設備均與電力感知數據有著密不可分的關系。為了實時監測電力系統運行狀態,相關學者試圖通過提高電力感知數據頻繁項查詢率,以達到協調電能市場分配關系、避免電力系統用電損耗日益嚴重的目的。為了提高數據頻繁項查詢的效率,本文提出了基于時域特征的電力感知數據頻繁項查詢方法。該方法通過挖掘電力感知數據、提取時域特征,結合貝葉斯分類算法鎖定類別區間,從而完成數據頻繁項查詢。試驗結果表明,本文方法具有較好的查詢性能,可有效提高電力系統的查詢效率、降低內存開銷。