馬一寧,余少鋒,鐘建栩,席凌之,廖崇陽
(1.南方電網能源發展研究院有限責任公司,廣東廣州 510000;2.南方電網調峰調頻發電有限公司信息通信分公司,廣東 廣州 510000)
時間序列模型也叫動態數列模型,是指能夠將同一統計指標數值按照發生時間的先后順序進行排列的數據處理模型。在實際應用過程中,時間序列預測注重分析已有數據的歷史變化趨勢,并可在綜合下級統計變量的同時,推測數值指標的后續變化形式[1-2]。在時間序列模型的作用下,待選取數據的排列行為始終滿足隨機變量原則,即為使變量指標之間的映射連接關系不受影響,默認時間序列模型認知下,有且僅有一個數據變量能夠完全滿足另一個數據變量的預測計算需求。
電力異常大數據是一種非常規的電信號數據參量,能夠與常規電信號數據融合在一起,但前者的連續性負荷特征較為明顯,會導致電信號負荷曲線出現過度波動的表現形式[3]。為準確預測包含電力異常大數據的信號負荷曲線的變化規律,傳統改進分段式檢測方法通過確定異常值坐標的方式,計算明顯波動特征在連續負荷曲線中所占比重,再聯合標準預測模型,實現對電量異常大數據的檢測與處理[4]。然而在異常大數據節點數量相對較多的情況下,此方法對于信號負荷曲線變化規律的預測準確性則相對有限,這就使得電網主機對連續性電量信號的精準檢測能力受到了較大影響。為解決上述問題,提出基于時間序列預測的新型電力異常大數據檢測算法。
在時間序列預測模型的作用下,電力異常數據修正包含降維預測系數計算、離散化修正權限確定等多個執行步驟,具體研究方法如下。
對于電力網絡環境而言,時間序列模型中的所有指標數值都具有可加性,且序列組織中每一個指標數值的大小都與其所反映預測周期的表現時長有直接映射關系。因此在實際應用過程中,為使所有電力異常大數據都得到準確標注與記錄,應使時間序列模型中所有變量數據之間的數值映射關系都保持穩定存在的狀態[5-6]。設r、i表示兩個不同的電力異常大數據編碼系數,f表示基于時間序列的電量信號預測指標,αr表示編碼系數為r時的數據序列參量,αi表示編碼系數為i時的數據序列參量。聯立上述物理量,可將電力異常大數據的時間序列模型表示為:
式中,wr表示編碼系數為r時的電力異常大數據預測權限,wi表示編碼系數為i時的電力異常大數據預測權限。為使電力異常數據修正結果具有真實參考價值,在建立時間序列模型時,應選取大量的大數據信息作為變量指標。
在時間序列模型中,降維預測系數決定了電力異常大數據變量的實際分布情況。一般來說,降維預測系數的物理取值越大,就表示電力異常大數據變量之間的間隔距離越大;反之,降維預測系數的物理取值越小,就表示電力異常大數據變量之間的間隔距離越小[7-8]。假定d1、d2表示兩個隨機選取的電力異常大數據標度參量,且d1≠d2的不等式條件恒成立。設a表示最小的電力異常大數據降維系數,φ表示常規電量數據的預測權限值,βa表示電力異常大數據的預測權限值。在上述物理量的支持下,聯立式(1),可將降維預測系數計算表達式定義為:
在時間序列預測模型中,降維預測系數能夠影響電力異常大數據與常規電量數據之間的分布配比關系。
如果將常規電量數據看作核心預測變量、將電力異常大數據看作干擾預測變量,則可認為只有在已知離散化修正權限條件的基礎上,才可以得到較為準確的數據指標檢測處理結果[9-10]。規定表示一個已定義的常規電量數據,且指標的取值始終屬于[1,e)的物理區間。表示電力主機在單位時間內所能記錄的常規電量數據均值,c0表示電力異常大數據離散化分布系數的初始取值,A表示一個已定義的電力異常大數據,l表示基于時間序列預測模型的電量數據修正配比系數,μ表示既定的電量數據修正定標特征。在上述物理量的支持下,聯立式(2),可將基于時間序列預測的電力異常大數據離散化修正權限表達式定義為:
對于電力異常大數據來說,只有在離散化修正權限取值結果保持為恒定物理數值的情況下,才可以實現對常規電量數據傳輸行為的準確預測。
根據時間序列預測模型的定義條件,建立完整的Hadoop 預測平臺,再按照電力大數據異常特征值計算、并行檢測強度確定的執行流程,實現基于時間序列預測的電力異常大數據檢測算法的設計與應用。
Hadoop 平臺負責對電力異常大數據進行實時檢測,并可以在時間序列預測模型的作用下,干擾常規電量數據、電力異常大數據之間的分布配比關系,從而使得電力主機能夠準確分辨出異常節點處的電信號的輸入與輸出行為能力,進而最大化避免異常數據指標對常規數據指標的影響[11-12]。具體的Hadoop 預測平臺連接結構如圖1 所示。

圖1 Hadoop預測平臺連接結構
在Hadoop 預測平臺中,Hbase、Hlive、Sqoop 結構同時存在于應用集群內部,可以將已輸入的常規電量數據與電力異常大數據分離開來,從而節省電網主機檢測電信號負荷曲線變化規律所需的消耗時長。
電力大數據的異常特征值決定了電網主機對于電力異常大數據指標的檢測與判別能力,在時間序列預測模型的影響下,該項物理指標的取值結果會在(-∞,+∞)的物理區間內不斷波動,直到其數值水平在一個既定數值兩端的波動幅度完全相等。一般來說,為避免大量運算步驟對電力異常大數據信號負荷曲線變化規律造成影響,規定該穩定系數項為電力大數據異常特征值的近似取值結果[13-14]。設λ表示電力大數據的異常行為系數,表示異常電量指標的穩定波動頻率,ΔT表示電量信號的單位波動周期。聯立上述物理量,可將基于時間序列預測模型的電力大數據異常特征值計算表達式定義為:
受到時間序列預測模型的影響,規定電力大數據異常特征值指標的實際取值越大,異常電力信號與常規電量信號之間的表現差異性也就越強。
并行檢測強度計算是電力異常大數據檢測算法設計的關鍵執行環節,能夠在異常特征值指標的基礎上,對常規電量信號與異常電力信號進行準確區分。一般來說,并行檢測強度參量的物理取值越大,就表示時間序列預測模型對于電力異常大數據的區分準確性越高,此時電網主機所得到的電信號檢測結果也就越符合實際應用需求[15-16]。設θc表示異常特征為c時的電力信號傳輸向量,ξ表示既定的電力異常大數據標記系數,v1、v2、…、vn表示n個不同的電力異常大數據并行傳輸權限,n表示時間序列條件下的電力大數據最大預測權限,x表示既定的電力信號檢測標度參量。在上述物理量的支持下,聯立式(4),可將并行檢測強度表達式定義為:
至此,完成對各項指標參量的計算與處理,在保障時間序列模型作用權限的前提下,實現新型電力異常大數據檢測算法的順利應用。
在應用電網中,常規電力數據信號負荷曲線的變化趨勢相對較為平緩,其區域性極大值與區域性極小值之間的物理差值水平相對較低。如果常規電力數據與電力異常大數據混合在一起,異常信號節點處的信號負荷曲線則會出現明顯波動的變化情況,此時整條電力數據信號負荷曲線的變化趨勢都會受到影響。
電網主機對于包含電力異常大數據的信號負荷曲線的預測準確性,反映了主機元件對于連續性電量信號的精準檢測能力,通常情況下,電網主機所預測出的包含電力異常大數據的信號負荷曲線越貼合給定曲線的變化規律,則表示主機元件對于連續性電量信號的精準檢測能力越強。
圖2 給出了一組標準的包含電力異常大數據的信號負荷曲線。

圖2 標準信號負荷曲線
分析圖2 可知,在標準曲線中,信號負荷值的明顯波動狀態存在于第40-60 min 與第80-100 min 的實驗區段之內,前者的極限負荷差值為2 249 MW,后者的極限負荷差值為2 765 MW,即在80-100 min的實驗區段內,電力異常大數據對于常規電力數據的影響能力相對較強。
選取基于時間序列預測的電力異常大數據檢測算法、改進分段式檢測算法作為實驗組、對照組的檢測應用技術。分別利用實驗組、對照組的應用方法對電力信號進行檢測,在對實驗組、對照組檢測信號進行簡單區分后,將其與給定的包含電力異常大數據的信號負荷曲線進行對比,如圖3 所示。

圖3 信號負荷值的實驗曲線
實驗組:實驗組信號負荷曲線的變化規律始終與標準信號負荷曲線保持一致,在第40~60 min 的實驗區段內,實驗組信號負荷的極限差值為2 200 MW,略小于理想極限負荷差值;在第80~100min 的實驗區段內,實驗組信號負荷的極限差值為3 000 MW,大于理想極限負荷差值。
對照組:對照組信號負荷曲線的變化規律則并不能與標準信號負荷曲線保持一致,在電力異常大數據的影響下,在第40~60 min 的實驗區段內,對照組信號負荷的極限差值為1 300 MW,遠小于理想極限負荷差值;在第80~100 min 的實驗區段內,對照組信號負荷的極限差值為2 400 MW,小于理想極限負荷差值。
在基于時間序列預測的電力異常大數據檢測方法的作用下,電網主機所預測出的包含電力異常大數據的信號負荷曲線能夠較好貼合給定曲線的變化規律,符合精準檢測連續性電量信號的實際應用需求。
新型電力異常大數據檢測電力異常大數據檢測方法在時間序列預測模型的基礎上,對離散化修正權限的作用能力進行約束,再借助Hadoop 平臺,確定電力大數據異常特征值的具體計算結果,從而使得并行檢測強度的物理數值更貼近實際應用需求。實用結果顯示,與改進分段式檢測方法相比,在時間序列預測模型的作用下,電網主機所預測出的包含電力異常大數據的信號負荷曲線能夠更好貼合給定曲線的變化規律,對于連續性電量信號的精準檢測確實起到了促進性影響作用。