楊 杉,譚 博,郭靜波
(清華大學 電機工程與應用電子技術系,北京 100084)
隨著傳感器技術、通信技術、大數據處理技術的發展,形成了信息系統與能源系統深度融合的新一代能源互聯網[1]。新一代能源互聯網以各環節狀態的全面感知為基礎,其終端產生了體量大、類型多的實時監控數據[2]~[4]。監控數據的實時、有效、準確,關乎信息流和能量流的同步性,以及能源互聯網的安全穩定運行。由于新一代能源互聯網信息能源數據種類和數量的增加,常用的數據采集方法已不適用。一方面,海量的終端監控數據受限于通信系統的數據傳輸能力,導致數據的實時性受到影響;另一方面,多種不同時間尺度和特征域的數據類型,導致數據采集的同步性受到影響[2]。這些都影響了數據的有效、準確和全面采集,并進一步影響新一代能源互聯網基于數據信息的相關運行控制策略的實施。
為了解決能源互聯網數據采集的同步性和實時性問題,學者們進行了大量研究。文獻[5]~[7]從數據分析和處理的角度出發,利用邊緣計算的方式,采用數據匯聚、融合和優化等技術,對來自終端的數據進行處理。文獻[8]~[10]從數據通信方式的角度,結合并改進已有的有線和無線通信方式,同時引進新興的性能優異的通信方式(5G通信)。然而,現有解決方案都是在數據樣本已完成采樣的情況下,對采樣數據及傳輸條件進行改進,并未從數據采樣的角度出發。
本文從壓縮感知(Compressed Sensing,CS)與數據采集結合的全新角度,提出一種基于壓縮感知的新一代能源互聯網的數據采集方法。首先,針對新一代能源互聯網,說明將壓縮感知原理應用于數據采集所具有的優勢;然后,基于壓縮感知的基本原理,采用K-SVD字典學習算法,完成采集方法的數據稀疏化處理以及數據傳輸處理,形成了系統化的基于壓縮感知的新一代能源互聯網的數據采集方法;最后,通過一個微電網算例對本文所提方法的正確性和有效性進行驗證,其優秀的數據傳輸量和重構精度完全滿足新一代能源互聯網數據采集的要求。
信息能源深度融合的新一代能源互聯網的監控數據包括電氣量、狀態量、物理量、環境量、空間量、行為量等[2],其收集過程主要有感知設備獲取、通信網絡傳輸、數據中心管理。
傳統的數據采集過程是通過對監控數據進行整體采樣并傳輸,其過程如圖1所示。對于新一代能源互聯網,面對海量終端體量大、類型多的監控數據的實時且同步的采集需求,傳統的數據采集過程已不再是最優選擇。

圖1 傳統的數據采集過程Fig.1 Traditional data collection procedure
本文采用基于壓縮感知原理的數據采集過程,如圖2所示。

圖2 基于壓縮感知的數據采集過程Fig.2 Data collection procedure based on CS
與傳統數據采集過程不同,基于同域采樣和壓縮感知數據采集過程,增加了同域觀測環節和信號恢復環節。在同域觀測環節,同域觀測的采樣值并非監控量本身,而是監控量在同域觀測空間的壓縮投影值,即把“信號采樣”轉化為“信息采樣”;在信號恢復環節,利用監控量的特征信息的采樣值進行重構,恢復原始監控數據。此時,通信數據不再是所有完整的監控數據,而是監控數據在同域觀測空間壓縮后的特征信息。
針對新一代能源互聯網體量大,且類型多的監控終端所導致的數據采集的同步性和實時性問題,有必要突破傳統的數據采集方式,研究一種從同域采樣和壓縮采樣出發、基于壓縮感知的數據采集新方法。其先進性體現在以下3個方面:①所提同域采樣的研究角度,保證了監控數據采集的固有同步性;②基于同域采樣思想和壓縮感知理論的采樣方法,減少了監控數據的傳輸數據量;③“信號采樣”轉化為“信息采樣”提高了數據傳輸的安全性。因此,研究基于壓縮感知原理的新一代能源互聯網數據采集方法有重大意義及實際需求。
為滿足新一代能源互聯網的實際應用需求,基于壓縮感知原理的數據采集方法核心目標是同時保證數據的高恢復精度和低傳輸量。因此,應當在分析壓縮感知核心理論的基礎上,結合新一代能源互聯網監控數據的具體特征,研究實際可行的、滿足需求的數據采集方法。
壓縮感知是一種感知時域可壓縮信號的新方法。對于任意一個長度為N的可壓縮的離散實值信號,通過信號的稀疏表示、壓縮測量和恢復重構3個步驟實現壓縮感知[11],[12]。

壓縮測量不再采用先測量信號x本身,后進行壓縮的方式,而是用一個測量矩陣Φ∈RM×N直接對信號x進行壓縮測量,將信號采樣轉化為測量矩陣Φ上的M個投影的采樣。
對于信號的恢復重構,也就是從向量y中恢復出原始信號x的過程。該過程中,式(1)帶入式(2)后的測量向量y表示為[13]

對于一個含有n個監控節點的新一代能源互聯網,一個采樣周期內包含了不同數據類型的監控數據s,其表達式為

壓縮感知流程如圖3所示。

圖3 監控數據s的壓縮感知流程Fig.3 CS flow of monitoring data s
監控數據采集的快速性和正確性對于新一代能源互聯網的安全運行至關重要。基于壓縮感知原理的數據采集方法包含了稀疏表示、壓縮測量和恢復重構3個流程。雖然,其利用了監控量的特征信息恢復原始監控數據時會引入一定的誤差,但是,由于采用的壓縮感知理論保證數據壓縮而信息不壓縮,因此恢復出的數據保留實際終端監控的全部完整信息,可以全面反應各終端的實際運行情況,不會導致數據采樣的失真;另外,通過對采集方法每一個流程進行研究和改進,可以進一步提高數據采集的精度。
本文的出發點是新一代能源互聯網數據的同域采樣,其研究重點為數據的稀疏表示(同域采樣的支撐理論)。根據圖2,3可知:①提高信號的稀疏程度,可以提高數據采集方法的準確程度,減少利用監控量的特征信息恢復原始監控數據時引入的誤差;②信號恢復需要已知通信信道另一端的壓縮測量采樣值y以及稀疏基矩陣Ψ,兩端之間傳輸y和Ψ的數據量決定了數據采集方法的快速性。
2.2.1 基于K-SVD字典學習算法的新一代能源互聯網數據稀疏表示
新一代能源互聯網作為一個整體,每個節點的運行狀態會相互關聯、相互影響,這說明每個節點的數據之間必然存在強相關性[15],而強相關性的數據一定存在大量的冗余,且含有冗余的數據可從另一個角度由簡單的信息(非數據)進行表達。新一代能源互聯網數量大、種類多的數據必定可以在某一個空間(變換域)中由相對簡單的信息進行表達,即在該空間(變換域)中表現出稀疏性。這種將數據采樣(信號采樣)轉變成信息采樣的處理方式正是壓縮感知的核心思想之一。因此,新一代能源互聯網的采集數據可利用壓縮感知原理進行壓縮處理。
壓縮感知中,K-SVD字典學習算法是一種自適應的數據稀疏方法[16],[17]。由于新一代能源互聯網采集數據一定能在某一個未知空間中進行稀疏表示,而K-SVD字典優秀的自適應特性,可使其通過字典學習算法對新一代能源互聯網的采集數據進行自適應。從而有效的找到適用于新一代能源互聯網數據的稀疏空間,實現新一代能源互聯網采集數據的稀疏表示。
K-SVD字典學習算法的數學模型為

②稀疏編碼。在字典D固定不變的條件下,采用正交匹配追蹤算法(Orthogonal Matching Pursuit,OMP)對式(6)的優化模型進行求解,得到信號s的稀疏系數θ′。③字典更新。對字典進行逐列更新,當更新字典的第k列dk時,令Ek為去掉dk后信號所產生的誤差,即:

式中:θT為θ的第j行。再對誤差進行奇異值分解獲得更新后的dk和θ。
④重復稀疏編碼和字典更新。若達到終止條件,輸出信號s基于K-SVD字典學習算法的自適應稀疏字典D。
在新一代能源互聯網數據采集的應用問題中,基于K-SVD字典學習算法,信號s的最優字典D的每一個原子是完全相同的,且在該字典上分解得到的系數向量θ為1-稀疏的,保證了信號s的高稀疏性。說明K-SVD字典學習算法應用于監控數據稀疏表示的可行性和先進性。
2.2.2 基于K-SVD字典學習算法的新一代能源互聯網數據傳輸處理
基于字典學習方法的信號s的稀疏表示會隨著每一次監控數據的變化生成不同的自適應字典D,導致數據傳輸量較大。為減少數據傳輸量,本文利用K-SVD算法生成字典的每一個原子完全相同的特點,處理傳輸數據。
新一代能源互聯網的數據采樣周期非常短,導致每個周期K-SVD算法訓練得到的字典D處于緩慢變化狀態,即dt≈dt-1。基于此,在滿足誤差需求的情況下,僅傳輸變化較大的原子元素可減少數據的傳輸量。傳輸數據的處理方法如下。
(1)原子變化量計算

經過以上處理,不必在每一時刻都對完整的字典原子進行傳輸,減少了數據的傳輸量。由于每個時刻所需傳輸的數據量會發生動態變化,NT次數據傳輸的平均數據傳輸量為

基于壓縮感知的新一代能源互聯網的數據采集方法,具體的流程如圖4所示。

圖4 新一代能源互聯網的數據采集方法流程圖Fig.4 Flow chart of data collection method of new generation energy internet
圖中:監控數據s的壓縮測量選擇高斯分布的隨機矩陣作為測量矩陣Φ,根據式(2)求出測量向量y;監控數據s的恢復重構,采用OMP算法求出式(4)優化模型的解θ^,根據s^=Dθ^求出原始信號。
本文算例為19節點微電網系統,其線路和負荷的原始參數參見文獻[18]。在此基礎上,接入1個電動汽車充電站(EVS)和多種類型的分布式電源,系統包括1個燃料電池(FC)、1個異步風力發電機(WT)、2個蓄電池組(BAT1,BAT2)和2個光伏電池組(PV1,PV2)。具體的線路結構以及各設備的接入位置如圖5所示。

圖5 19節點微電網系統結構示意圖Fig.5 Schematic diagram of the 19-bus micro-grid
本算例基于大量的監控數據樣本,從以下方面驗證所提采集方法的正確性和有效性。其中,采集方法的測量矩陣Φ為高斯分布的隨機矩陣,壓縮采樣個數M為5,比較定值Vd為10-6。
設本算例需要采集的類型多樣的監控數據共119個。由于該微電網系統的原始負荷數據較少,本算例24 h負荷數據根據參考的有功測量數據的變化趨勢生成。EVS和WT的24 h測量數據分別根據其負荷模型生成[19],[20]。本算例24 h溫度和濕度量測數據樣本根據參考的溫度和濕度數據生成。本文采樣間隔為1 min,24 h共119×1 440個監控數據樣本。本文以標幺化后19節點WT的節點電壓(A相)、支路電流(A相)、溫度和濕度的監控數據為例,其變化趨勢如圖6所示。

圖6 節點19的監控數據Fig.6 Monitoring data of bus 19
為了驗證本文所提數據采集方法數據傳輸量的優勢,將所提采集方法和傳統數據采集方法的數據傳輸量進行對比。其中,傳統數據采集方法是對每次采樣的數據進行完整采樣并傳輸,其平均數據傳輸量為119個。
根據本文所提的數據采集方法,在不同誤差消除周期Te條件下,根據式(11)得到1 440次數據傳輸的平均數據傳輸量n_,如表1所示。

表1 不同Te條件下的平均數據傳輸量Table 1 Average amount of data transferred under different Te
由表1可以看出,在不同的誤差消除周期Te條件下,本文所提的數據采集方法的平均數據傳輸量都小于傳統方法(平均數據傳輸量為119個),且小于傳統方法數據傳輸量的50%,說明本文所提采集方法具有數據傳輸量的優勢。此外,不同Te的平均數據傳輸量變化不大,且當Te增加到一定程度后,平均數據傳輸量已不發生變化,說明Te對平均數據傳輸量的影響不大,可以以較大的間隔周期Te對誤差進行消除。
對于數據的重構效果,由于電力系統對數據精度的要求很高,不能以數據整體的重構效果作為衡量標準而忽略每一個監控數據的重構效果。因此,為了衡量數據采集方法的重構效果,本算例以重構數據的每一個分量與原始數據之間的相對誤差作為重構精度的評判指標。
3.3.1 不同字典條件下的重構效果
分別采用K-SVD字典算法與經典的正交基字典算法(DCT字典算法和FFT字典算法)對系統同一采樣時刻的119個監控數據(電壓、電流、溫度和濕度)進行稀疏表示,比較3種不同字典算法對同一信號的重構效果。其中,為保證基于正交基字典算法的數據傳輸量與基于K-SVD字典算法的基本相同,其壓縮采樣個數M取值為43。每個監控數據的重構結果如圖7所示。

圖7 不同字典條件下監控數據的重構結果Fig.7 Reconstruction results of monitoring data under different dictionaries
由圖7可知,基于K-SVD字典算法的數據重構結果與原始數據基本一致,而基于FFT字典算法和DCT字典算法的數據重構結果與原始數據有很大的差異。FFT字典算法、DCT字典算法和K-SVD字典算法,重構監控數據每一個分量最大相對誤差分別為6 543.8%,3 399.4%和2.8%。基于K-SVD字典算法的重構精度遠優于經典的正交基字典算法,說明K-SVD字典學習算法對新一代能源互聯網多類型監控數據的稀疏表示的正確性。
3.3.2 不同Te條件下的重構效果
分別采用不同Te(與表1相同)對119個監控數據,在1 440次的數據重構中的相對誤差值進行計算本文所提的數據采集方法的重構精度。其中,每次重構監控數據每一個分量的最大相對誤差的計算結果如圖8所示。

圖8 不同Te條件下重構數據的最大相對誤差Fig.8 Maximum relative error of reconstructed data under different Te
由圖8可以看出,由于累積誤差的存在,隨著Te的增加,監控數據重構后的最大相對誤差值會有緩慢的增加。但在不同Te條件下,監控數據重構后的最大相對誤差值的變化并不大,且單點最大的相對誤差值也小于2.8%,說明了本文所提的采集方法具有很好的數據恢復精度。此外,當周期Te增加到一定程度后,最大的相對誤差值基本不發生變化,同樣說明了本文所提采集方法不必頻繁的對誤差進行消除。
以上實驗結果表明,所提方法具有優秀的數據傳輸量和重構精度,完全滿足新一代能源互聯網對數據采集精度和速度的要求。
本文提出了基于壓縮感知的新一代能源互聯網的數據采集方法。通過研究與實驗,可以得出如下結論:所提數據采集方法在數據傳輸量上具有明顯優勢;與傳統數據采集方法相比,所提數據采集方法的數據傳輸量小于傳統方法的50%。本文所提基于K-SVD字典算法的數據重構方法與基于經典的正交基字典算法的重構效果相比,重構誤差降低了3個量級,并且,監控數據重構后的單點最大相對誤差值小于2.8%。