劉 歌,芮國勝,田文飚,田潤瀾,王曉峰
(1.海軍航空大學 信號與信息處理山東省重點實驗室,山東 煙臺 264001;2.空軍航空大學 作戰(zhàn)勤務學院,吉林 長春 130022)
蒸發(fā)波導既能陷獲無線電波,有助于實現(xiàn)超視距傳播,又可能造成頻譜泄露,導致己方目標過早暴露,在海洋電磁空間中發(fā)揮的作用不容小覷。蒸發(fā)波導信息的高效感知有賴于溫度、濕度、壓強、海表溫度以及風速信息的全面準確獲取[1]。由于衛(wèi)星遙感以及雷達等手段獲取的數(shù)據(jù)尺度范圍太大,分辨率過低,因此傳感器網(wǎng)絡成為獲取海洋環(huán)境監(jiān)測數(shù)據(jù)的主要手段[2]。現(xiàn)實場景中,在某一海洋監(jiān)測區(qū)域內(nèi)通過部署多個傳感器構成傳感器網(wǎng)絡,對同一對象進行持續(xù)的感知,獲取多種環(huán)境監(jiān)測數(shù)據(jù)通過某種通信手段傳送到監(jiān)測中心,以支撐不同類型的感知應用[3-5]。與陸地環(huán)境相比,海洋環(huán)境在深度和廣度上都具有優(yōu)勢,但這一優(yōu)勢對海上傳感器網(wǎng)絡的部署提出了更高的要求:一方面海洋范圍過大,導致部署節(jié)點數(shù)量太多,使得建設成本過高;另一方面如何將采集到的大量信息及時有效傳輸也受到節(jié)點能耗以及通信成本的限制。這就決定了傳感器網(wǎng)絡在運行過程中必須找到一種合理的方案解決能源有限與數(shù)據(jù)傳輸之間的矛盾。
壓縮感知(Compressed Sensing,CS)的出現(xiàn)為解決上述問題提供一個新的思路。BAJWA等[6]提出將壓縮感知理論引入到傳感器網(wǎng)絡的高效數(shù)據(jù)采集問題中,自此之后,學者們開始將壓縮感知理論在傳感器網(wǎng)絡中的應用進行大量研究。LUO等[7]提出基于壓縮感知的壓縮數(shù)據(jù)采集(Compressive Data Gathering,CDG)算法。在該算法中,Sink節(jié)點接收到的數(shù)據(jù)為每個節(jié)點數(shù)據(jù)的加權和,有效減少了網(wǎng)絡中總的傳輸次數(shù),減少了通信能耗,其副作用就是使得各節(jié)點的發(fā)送量增多;文獻[8]和文獻[9]對傳感器網(wǎng)絡的觀測矩陣進行了改進并分析;WU等[10]為降低觀測矩陣的稀疏度,每輪數(shù)據(jù)收集時僅有1個節(jié)點參與,每個數(shù)據(jù)收集周期僅有M個節(jié)點發(fā)送數(shù)據(jù),極大地減少了節(jié)點通信能耗開銷。但是上述算法都沒有將傳感器網(wǎng)絡數(shù)據(jù)收集過程中動態(tài)變化產(chǎn)生的相關性考慮在內(nèi)。近年來,動態(tài)壓縮感知(Dynamic Compressed Sensing,DCS)旨在處理信號支撐集隨時間發(fā)生變化的時變稀疏信號[11-14],目前已經(jīng)在研究時間流信號的采集和重構方面取得了很多有價值的研究成果[15-18],但是現(xiàn)有的動態(tài)壓縮感知算法仍是基于時間域上的壓縮觀測,并未涉及其他域壓縮。例如文獻[19]中的漸進式信號重構的順序壓縮感知(Sequential Compressed Sensing with Progressive signal reconstruction,Seq-Prog-CS)算法就是在動態(tài)壓縮感知的思想上提出的;該算法是對傳感器數(shù)據(jù)流的順序壓縮采集和漸進重構,然而在傳感器時間序列數(shù)據(jù)收集過程中,只考慮了時域流信號前后時刻的動態(tài)演化關系,沒有考慮多傳感器之間的空間結(jié)構相關性,重構性能有待提高。事實上,多個傳感器在時間上不斷地進行觀測,相當于是時域流信號的多傳感器擴展。
針對上述問題,筆者對實際海洋監(jiān)測數(shù)據(jù)進行了分析,發(fā)現(xiàn)傳感器數(shù)據(jù)矩陣空間結(jié)構上的低秩性。利用滑動窗口機制,結(jié)合已有歷史數(shù)據(jù),構建低秩矩陣,充分利用矩陣的低秩性,提出基于低秩正則化的序貫壓縮感知重構算法(Sequential Compressed Sensing based on Low rank Regularization,Seq-CS-LR),同時根據(jù)重疊區(qū)域數(shù)據(jù)相等的規(guī)律,增加了重疊區(qū)域誤差校正項。在解決重構優(yōu)化算法過程中設計了一種基于交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)的求解方法。實驗結(jié)果驗證了算法獲得了更高的重構精度。
某時刻N個傳感器獲得的數(shù)據(jù)x=(x1,x2,…,xN)∈RN,通常可以在稀疏表示矩陣Ψ∈RN×N下可以被稀疏表示,即x=Ψs,此時s中若至多存在k個非零元素,則將x稱為可壓縮數(shù)據(jù),k表示稀疏度,s表示數(shù)據(jù)x在稀疏表示矩陣下的稀疏表示系數(shù)向量。
假設觀測矩陣為Φ∈RM×N,根據(jù)壓縮感知理論,測理值y可以被表示為
y=Φx=ΦΨs,
(1)
其中,M?N;A=ΦΨ,表示感知矩陣。
圖1給出了滑動窗口數(shù)據(jù)采集示意圖,從圖中可以看出,隨著時間的推進,在滑動窗口內(nèi),新時刻數(shù)據(jù)進入的同時,舊時刻的數(shù)據(jù)被推出,即相鄰時刻滑動窗口內(nèi)的矩陣之間存在著重疊區(qū)域。每個滑動窗口包含w個時間間隔,但并非所有數(shù)據(jù)窗口都需要在每個時間間隔發(fā)送。首先,用w個時間間隔的歷史數(shù)據(jù)集作為原始數(shù)據(jù)窗內(nèi)的初始化數(shù)據(jù),當下一個時刻的數(shù)據(jù)集合進入時,舊時刻的數(shù)據(jù)集將被推出。因此,在第t個時隙僅發(fā)送具有M(t)/w維度的數(shù)據(jù)集,M(t)表示第t個時隙的觀測數(shù)目。序貫壓縮感知具體的觀測過程見圖2所示。具體可以表示為
(2)
其中,φ(t)∈RM(t)/w×N,表示t時刻的觀測矩陣。
據(jù)圖中的描述,當x(t)進入時,x(t-w)退出,這樣保持了上述公式形式不變,但是實際內(nèi)容在不斷地隨時間的推進而更新,從而實現(xiàn)數(shù)據(jù)的在線采集。可以將式(2)寫成矩陣形式為
Y(t)=Φ(t)v(X(t)) ,
(3)
其中,X(t)∈RN×w,表示窗口內(nèi)的數(shù)據(jù)矩陣;v(·)表示向量堆棧;Φ(t)∈RM×Nw,表示窗口w內(nèi)的塊對角觀測矩陣的集合;Y(t)=[yT(t-w+1)yT(t-w+2)…yT(t)]T∈RM×1,表示窗口w內(nèi)的測量向量的集合;M=∑M(t),表示窗口內(nèi)觀測值的總數(shù)。

圖1 滑動窗口數(shù)據(jù)采集示意圖

圖2 序貫壓縮感知觀測過程示意圖
傳統(tǒng)的序貫壓縮感知觀測模式將滑動窗口內(nèi)的矩陣堆棧為向量進行計算,沒有對滑動窗口內(nèi)矩陣的結(jié)構特性進行研究。事實上,滑動窗口矩陣的列向量是來自相同傳感器在不同時隙內(nèi)的數(shù)據(jù),且海洋環(huán)境監(jiān)測數(shù)據(jù)在大范圍內(nèi)變化緩慢,這就意味著列向量之間存在著大量的冗余,因此考慮加入低秩約束以更好地利用滑動窗口內(nèi)矩陣的低秩性來提高重構性能。
首先,為了檢驗滑動矩陣X(t)∈RN×w是否具有良好的低階近似,采用奇異值分解(Singular Value Decomposition,SVD)的方法,即
X(t)=UΣVT,
(4)
其中,U∈RN×r,表示傳感器源隱含因子矩陣;V∈Rw×r,表示時間序列隱含因子矩陣;Σ∈Rr×r,為對角陣,對角元素是矩陣X(t)奇異值;r表示矩陣X(t)的秩,當矩陣的秩滿足r?min{N,w}時,矩陣為低秩矩陣。定義一個變量η來確定矩陣是否具有良好的低秩近似,η通過計算前k個大奇異值的能量之和占所有奇異值的總能量的比值而來,即
(5)
其中,σi表示矩陣的第i個奇異值。

圖3 前k個奇異值捕獲能量比值的累積分布圖
下面對來自美國國家環(huán)境預報中心(National Center Environment Prediction,NCEP)中的實測數(shù)據(jù)進行分析。限于篇幅,僅對蒸發(fā)波導特性研究所需要的氣溫、風速、海表溫度、壓強、相對濕度5種環(huán)境要素進行分析。NCEP數(shù)據(jù)集的時間分辨率為6 h(一天內(nèi)更新時間為0∶00,6∶00,12∶00,18∶00),空間分辨率為2.50×2.50。圖3中給出了5種氣象要素數(shù)據(jù)的前k個大奇異值能量占總奇異值能量的比重,其中橫坐標為k,縱坐標表示前k個大奇異值之和占奇異值總和的比重。本次數(shù)據(jù)是每個傳感器節(jié)點在感興趣的時間范圍內(nèi)產(chǎn)生的256個采樣點。從圖3的整體來看,5種海洋數(shù)據(jù)的前10個奇異值之和已占奇異值總和的90%以上。對于溫度和海表溫度兩個參數(shù),前10個系數(shù)所捕獲的能量甚至達到96%以上。上述結(jié)果完全可以表明5種海洋環(huán)境監(jiān)測數(shù)據(jù)的矩陣在所研究的場景中具有良好的低秩性。
式(3)中的信號重構是一個病態(tài)的逆問題,常用的重構優(yōu)化算法模型為
(6)
由于t時刻與t-1時刻的時間窗內(nèi)的存在重疊區(qū)域,利用重疊區(qū)域內(nèi)數(shù)據(jù)相等的先驗,增加一個具有數(shù)據(jù)保真作用的正則化項,以進一步提高重構精度,即
(7)
其中,Ψ(w-1)=ΨT(w-1)ΨS,ΨT(w-1)表示取時域基ΨT的前w-1行組成的新矩陣;X0(t-1)表示t-1時刻計算獲得的重疊區(qū)域的估計值;S(t)表示稀疏表示系數(shù)。
根據(jù)前文對滑動窗口內(nèi)數(shù)據(jù)矩陣的低秩先驗分析,為了進一步提高恢復精度,考慮實施一個有效的低秩性懲罰函數(shù),以充分利用數(shù)據(jù)之間的空間結(jié)構相關性。因此,引入多節(jié)點時間序列數(shù)據(jù)的低秩性懲罰項,得到
(8)
其中,λ1和λ2表示正則化參數(shù),‖X‖表示矩陣X的核范數(shù)。
對于式(8),采用交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)將原問題分為多個子問題分別進行解決。首先進行變量替換:
(9)
將上式寫成增廣拉格朗日的形式:
(10)
其中,A和B表示拉格朗日乘子,α和β是罰參數(shù)。通過以下交替方向方法最小化等式(10):
(11)
(12)
(13)
Ak+1=Ak+α(Sk+1(t)-Ψv(Xk+1(t))) ,
(14)
Bk+1=Bk+β(Zk+1(t)-Xk+1(t)) 。
(15)
式(11)可重寫為標準線性最小二乘問題,并應用共軛梯度算法求解:
(16)
上述問題是一個標準的最小二乘問題,其最優(yōu)解可以表示為
(17)
對于式(12)中的子問題,整理得到
(18)
式(18)是標準線性最小二乘問題,Sk+1(t)的求解方法與式(16)相同。
對于式(13)中的子問題,采用奇異值收縮算子法[20]解決:
Zk+1(t)=s(Xk+1(t)-Bk/β,λ2/β) ,
(19)
其中,s(H,τ)是在閾值τ處對矩陣H的奇異值進行軟閾值操作的函數(shù)。
對上述算法進行收斂性分析。由于算法中的每一時隙的數(shù)據(jù)重構主要進行ADMM迭代,因此,證明文中算法收斂只需證明ADMM在求解聯(lián)合約束模型時是收斂的。
為了使證明表述更加簡潔,首先定義了矩陣G和F:
G=Y(t)-Φv(X(t)) ,
(20)
(21)
然后,令矩陣H=[GT,F(xiàn)T,ZT],把式(10)重寫為
(22)
其中,矩陣Q、P和W為
(23)
將式(22)寫成增廣拉格朗日函數(shù)的形式:
(24)
其中,J表示拉格朗日乘子,?為罰參數(shù)。
文獻[21]在Eckstein和Bertsekas定理的基礎上給出了ADMM收斂的條件,即矩陣Q和P滿足列滿秩,f(·)為閉凸函數(shù)。其中式(24)中的矩陣Q和P滿足列滿秩,且函數(shù)f(H)是閉凸函數(shù)(其中1范數(shù)、2范數(shù)以及核范數(shù)都是凸函數(shù))。因此,筆者提出的算法模型在ADMM算法下是收斂的。
以兩種真實數(shù)據(jù)集作為實驗對象,對算法性能進行測試,每次試驗得到的結(jié)果都是100次結(jié)果的平均值。實驗前,對以上數(shù)據(jù)集均進行了預處理,將缺失、錯誤數(shù)據(jù)剔除,構造出完整的數(shù)據(jù)集。正則化參數(shù)λ1和λ2以及罰參數(shù)α和β需要預先設置。根據(jù)以往經(jīng)驗,不同的數(shù)據(jù)集的正則化參數(shù)不同,因此在實際實驗中,根據(jù)輸入數(shù)據(jù)集的特點,需要手動調(diào)整正則化參數(shù)的大小。其中正則化參數(shù)λ控制的是重疊區(qū)域誤差約束正則項,λ控制的是低秩正則項。根據(jù)經(jīng)驗,將正則化參數(shù)λ的范圍定為[0.001,0.010],λ的范圍定為[0.000 1,0.00 1],將罰參數(shù)α的范圍定為[0.000 5,0.005],β的范圍定為[0.000 05,0.000 5],具體數(shù)值根據(jù)實驗數(shù)據(jù)進行具體調(diào)整。
采用歸一化的平均絕對誤差(Normalized Mean Absolute Error,NMAE)來衡量算法的性能:
(25)

參與對比的算法包括:文獻[22]中的克羅內(nèi)克壓縮感知方法(Kronecker Compressed Sensing,KCS),文獻[12]中的正則化修正的壓縮感知(Reg-mod-CS)方法,文獻[19]中的序貫漸近壓縮感知Seq-Prog-CS。實驗中選擇正交傅里葉矩陣作為的變換基Ψ。對于文中算法和Seq-Prog-CS算法,利用離散傅里葉變換和余弦變換構成Kronecker稀疏基,其他算法的參數(shù)設置同原文獻。
實驗1窗口大小的影響。
首先,檢驗窗口的大小對重構精度的影響。圖4中給出了不同窗口長度對應的NMAE曲線。其中實驗數(shù)據(jù)來自海洋監(jiān)測數(shù)據(jù)集中的溫度數(shù)據(jù)集和濕度數(shù)據(jù)集。待重構的時間序列的長度為128,窗口長度選取為4、8、16和32。從圖中曲線的整體變化情況可以看出,隨著觀測數(shù)目的增加,整體的重構誤差在逐漸減小;隨著窗口長度的變長,重構誤差逐漸減小,重構精度逐漸提高。這是因為窗口長度變長,使得更多的相關結(jié)構被納入低秩矩陣中,使得低秩矩陣規(guī)模更大,計算更為準確。由于本實驗僅為說明窗口大小對算法有一定的影響,且在該實驗中5種傳感器數(shù)據(jù)集的結(jié)果大同小異,限于文章篇幅,其他幾種數(shù)據(jù)不再贅述。

(a) 溫度數(shù)據(jù)集

(b) 濕度數(shù)據(jù)集

圖5 低秩先驗對重構性能的影響
實驗2低秩先驗對算法重構性能的影響。
筆者提出的算法將低秩先驗加入到重構過程中,以提高重構精度。在實驗中,為說明低秩先驗的加入對重構性能的提高,以NCEP中的溫度數(shù)據(jù)為例,將未加低秩先驗的文中算法(Seq-CS)與文中算法(Seq-CS-LR)進行對比,圖5中給出了兩種窗口長度(w=4,w=8)的條件下,兩種算法的重構性能對比。其中其他參數(shù)的設置從圖5中的曲線可以看出,低秩先驗的加入對重構性能有明顯的提升,尤其是在采樣率較低的條件下,能夠大幅降低重構誤差,提高重構精度。這是因為在序貫壓縮感知推進重構時,形成的二維矩陣之間存在著時間相關和空間相關性,這一性質(zhì)通過低秩性表現(xiàn)出來,將低秩先驗加入到重構目標函數(shù)中,保證每次重構得到的數(shù)據(jù)矩陣滿足低秩性。
實驗3不同算法的重構性能對比。
將文中算法與其他算法進行重構性能對比。圖6中分別給出了NCEP數(shù)據(jù)集中的濕度數(shù)據(jù)集和溫度數(shù)據(jù)集下的重構性能曲線。其中對濕度數(shù)據(jù)集進行測試時,參數(shù)T=64,N=16,文中算法Seq-CS-LR與Seq-Prog-CS算法中的w=8;對溫度數(shù)據(jù)集進行測試時,參數(shù)T=64,N=25,Seq-CS-LR與Seq-Prog-CS算法中的w=8。從圖6中曲線可以看出,兩種數(shù)據(jù)集下,文中提出的Seq-CS-LR算法的重構誤差最小,從另外一個角度來看,幾種算法達到同樣的重構效果,Seq-CS-LR算法所需要的觀測數(shù)目更少。具體來看,w=16時的Seq-CS-LR算法重構誤差最小,w=8時的Seq-CS-LR算法的重構精度依然小于其他算法的。同時也驗證了實驗一種窗口的長度越長重構效果也好的結(jié)論,這是因為窗口越長,納入低秩矩陣約束的列向量越多,獲取的結(jié)構相關性越多,越有利于精確重構,因此在計算量可以接受的范圍內(nèi),適當?shù)匮娱L滑動窗口的長度可以提高重構精度。

(a) 溫度數(shù)據(jù)集

(b) 濕度數(shù)據(jù)集
筆者研究了海洋環(huán)境監(jiān)測數(shù)據(jù)重構的問題,設計了一種多個傳感器的時間流數(shù)據(jù)組成滑動矩陣的重構方法。該方法在DCS思想的影響下,根據(jù)滑動矩陣的低秩性引入合理的低秩正則化約束,同時利用前后時刻滑動矩陣的重疊區(qū)域數(shù)據(jù)相等的規(guī)律,加入了重疊區(qū)域誤差校正項,有效提升了數(shù)據(jù)的重構質(zhì)量。此外,在最優(yōu)化目標函數(shù)求解過程中,利用成熟的ADMM技術,使得求解過程簡單易操作。實驗分析表明,低秩正則化能夠有效提高重構精度,文中算法能夠?qū)崿F(xiàn)傳感器網(wǎng)絡數(shù)據(jù)的在線重構,在真實的海洋監(jiān)測數(shù)據(jù)集下的重構性能皆優(yōu)于其他幾種傳感器網(wǎng)絡重構算法。由于筆者著重研究的是重構技術,直接采用的是已有性能較高的觀測矩陣和時空相關稀疏基,弱化了稀疏基和觀測矩陣的設計。
后續(xù)將對數(shù)據(jù)的在線采集進行深入研究,以進一步豐富序貫壓縮感知理論。