鄭一力 趙 玥,2 趙燕東,2 謝輝平,3
(1.北京林業(yè)大學(xué)工學(xué)院, 北京 100083; 2.城鄉(xiāng)生態(tài)環(huán)境北京實(shí)驗(yàn)室, 北京 100083;3.林業(yè)裝備與自動(dòng)化國(guó)家林業(yè)局重點(diǎn)實(shí)驗(yàn)室, 北京 100083)
林區(qū)小氣候監(jiān)測(cè)系統(tǒng)能夠及時(shí)準(zhǔn)確對(duì)森林生態(tài)系統(tǒng)進(jìn)行網(wǎng)格化實(shí)時(shí)動(dòng)態(tài)監(jiān)測(cè),依據(jù)行業(yè)標(biāo)準(zhǔn)或大數(shù)據(jù)分析結(jié)果,實(shí)現(xiàn)森林火情預(yù)測(cè)預(yù)警、生態(tài)環(huán)境恢復(fù)評(píng)價(jià)、森林健康評(píng)價(jià)等分析決策功能[1-3]。林區(qū)小氣候監(jiān)測(cè)站多采用太陽(yáng)能板和蓄電池的方式進(jìn)行供電[4-6]。在低溫和連續(xù)陰雨時(shí),監(jiān)測(cè)站存在供電不足的問(wèn)題。大多數(shù)小氣候監(jiān)測(cè)站直接將采集的海量原始數(shù)據(jù)通過(guò)GPRS或北斗衛(wèi)星上傳至云服務(wù)器中,數(shù)據(jù)傳輸功耗較大。如何對(duì)海量原始數(shù)據(jù)進(jìn)行壓縮、保留數(shù)據(jù)的有效成分、降低監(jiān)測(cè)站的數(shù)據(jù)傳輸功耗是林區(qū)小氣候監(jiān)測(cè)需要解決的關(guān)鍵問(wèn)題。
壓縮感知技術(shù)提出,對(duì)稀疏信號(hào)或可壓縮信號(hào)可通過(guò)遠(yuǎn)低于奈奎斯特采樣頻率的方式進(jìn)行采樣,通過(guò)算法實(shí)現(xiàn)原始信號(hào)的精確重構(gòu),達(dá)到數(shù)據(jù)壓縮的效果[7]。壓縮感知技術(shù)主要包括信號(hào)的稀疏表達(dá)、編碼測(cè)量和重構(gòu)算法[8]。找到最合適的稀疏字典對(duì)原始信號(hào)進(jìn)行稀疏表達(dá),是壓縮感知的核心任務(wù)。稀疏字典主要分為固定字典和學(xué)習(xí)字典兩類(lèi)[9]。固定字典如離散傅里葉變換基(DFT)[10]、離散余弦變換基(Discrete cosine transform,DCT)[11]、小波變換基(Wavelet transform,WT)[12]和Curvelet基[13]等,具有一定的普適性,但不能根據(jù)不同原始信號(hào)的特征進(jìn)行分解和稀疏表達(dá)[14]。學(xué)習(xí)字典如K-SVD字典[15]、OLM(Online learning method)算法[16],可通過(guò)訓(xùn)練得到稀疏基,對(duì)符合訓(xùn)練數(shù)據(jù)特征的原始數(shù)據(jù)擁有更好的稀疏表達(dá)能力。文獻(xiàn)[17]采用DCT固定字典對(duì)森林火災(zāi)早期圖像進(jìn)行壓縮;文獻(xiàn)[18]采用DFT固定字典對(duì)植物微環(huán)境及生理參數(shù)監(jiān)測(cè)節(jié)點(diǎn)采集的參數(shù)進(jìn)行壓縮,能夠節(jié)省13.62%的功耗;文獻(xiàn)[19]采用K-SVD學(xué)習(xí)字典,有效壓縮了林區(qū)微環(huán)境監(jiān)測(cè)站數(shù)據(jù)傳輸數(shù)量。上述文獻(xiàn)均使用單一字典對(duì)數(shù)據(jù)進(jìn)行壓縮,無(wú)法根據(jù)數(shù)據(jù)的不同特征選擇最適合的字典進(jìn)行稀疏表達(dá)。針對(duì)上述問(wèn)題,在數(shù)據(jù)壓縮時(shí),可以切換使用多種字典,進(jìn)一步提高數(shù)據(jù)重構(gòu)的精度。
本文提出一種切換字典的數(shù)據(jù)壓縮方法,在對(duì)原始數(shù)據(jù)進(jìn)行特征表征和分類(lèi)的基礎(chǔ)上,合理切換使用DFT或K-SVD兩種字典,對(duì)林區(qū)小氣候監(jiān)測(cè)數(shù)據(jù)進(jìn)行稀疏表達(dá),進(jìn)一步提高數(shù)據(jù)重構(gòu)的精度,降低林區(qū)小氣候監(jiān)測(cè)站的能耗。
課題組自主研制的林區(qū)小氣候監(jiān)測(cè)站連接了大氣、土壤、光照和植物參量傳感器組,通過(guò)太陽(yáng)能板和蓄電池供電[4],見(jiàn)圖1。小氣候監(jiān)測(cè)站自動(dòng)采集各類(lèi)傳感器數(shù)據(jù),經(jīng)存儲(chǔ)和格式變換后,形成GPRS或北斗衛(wèi)星短報(bào)文通訊包,發(fā)送至云服務(wù)器的MySQL數(shù)據(jù)庫(kù)中。系統(tǒng)軟件運(yùn)行在云服務(wù)器上,具備實(shí)時(shí)數(shù)據(jù)查詢(xún)與下載、大數(shù)據(jù)分析與決策、數(shù)據(jù)庫(kù)存儲(chǔ)和管理等功能。多個(gè)小氣候監(jiān)測(cè)站可組網(wǎng)實(shí)現(xiàn)對(duì)森林生態(tài)大數(shù)據(jù)的全方位獲取。

圖1 北京鷲峰國(guó)家森林公園小氣候監(jiān)測(cè)站實(shí)物圖Fig.1 Picture of forest microclimate monitoring stations in Beijing Jiufeng National Forest Park
林區(qū)小氣候監(jiān)測(cè)站的各個(gè)傳感器每5 min自動(dòng)采集一次數(shù)據(jù),并存儲(chǔ)在SD卡中,每個(gè)傳感器每天總共采集288組數(shù)據(jù)。監(jiān)測(cè)站內(nèi)部的數(shù)據(jù)采集器融合了基于壓縮感知的壓縮算法,將傳感器原始數(shù)據(jù)進(jìn)行壓縮,集中發(fā)送到云服務(wù)器,在云服務(wù)器上通過(guò)重構(gòu)算法進(jìn)行解壓縮運(yùn)算。
監(jiān)測(cè)站在長(zhǎng)期運(yùn)行過(guò)程中存在數(shù)據(jù)錯(cuò)誤和丟失的問(wèn)題,錯(cuò)誤數(shù)據(jù)通過(guò)設(shè)置差分閾值直接剔除。單個(gè)數(shù)據(jù)丟失率大于10%的樣本直接舍棄,丟失率小于10%的樣本,采用三次樣條插值法將數(shù)據(jù)補(bǔ)齊[19]。
林區(qū)小氣候監(jiān)測(cè)站采集的各種傳感器的數(shù)據(jù)特征不同。土壤溫度和土壤濕度等參數(shù)波動(dòng)性不大,信號(hào)能量集中在低頻段,采用固定字典作為稀疏基,可以較好地稀疏表達(dá)原始信號(hào),完成對(duì)原始信號(hào)的壓縮傳輸;空氣溫度和空氣濕度等參數(shù)容易受到外界干擾,原始信號(hào)變化趨勢(shì)較大,采用學(xué)習(xí)字典作為稀疏基,可以較好地稀疏表達(dá)細(xì)節(jié)豐富、波動(dòng)性較大的樣本,提高數(shù)據(jù)的壓縮精度。
切換字典方法的流程如圖2所示,首先進(jìn)行樣本的特征表征,判斷樣本的波動(dòng)性,然后根據(jù)切換因子,合理選擇不同的字典作為稀疏基,實(shí)現(xiàn)數(shù)據(jù)有效壓縮。本文固定字典選擇DFT算法,學(xué)習(xí)字典選擇K-SVD算法。

圖2 切換字典流程圖Fig.2 Flow chart of dictionary-toggling
圖3為兩個(gè)歸一化處理后的傳感器樣本數(shù)據(jù),圖3a中的數(shù)據(jù)波動(dòng)性較大,采集的數(shù)據(jù)分布較為散亂,含有豐富的細(xì)節(jié)信息,而圖3b的數(shù)據(jù)較為平滑,波動(dòng)性較小。

圖3 不同類(lèi)型樣本與高斯擬合曲線Fig.3 Two types of samples and Gaussian fitting curves
兩個(gè)樣本數(shù)據(jù)大致符合正態(tài)分布,對(duì)樣本進(jìn)行擬合可采用高斯函數(shù)
(1)
式中A——高斯函數(shù)的幅值
μ——函數(shù)曲線在橫坐標(biāo)軸上的位置
σ——擬合的離散程度
擬合后的曲線如圖3中的虛線。
為實(shí)現(xiàn)樣本的分類(lèi),采用擬合決定系數(shù)R2和均方根誤差(Root mean squared error,RMSE)2個(gè)分類(lèi)標(biāo)準(zhǔn)共同判定。
當(dāng)樣本的波動(dòng)性越大,擬合的決定系數(shù)R2越小,均方根誤差(RMSE)越大,定義切換因子Q為
(2)
式中R0——決定系數(shù)閾值,R0∈[0,1]
E0——擬合標(biāo)準(zhǔn)差閾值,E0∈[0,∞)
定義固定字典為D1,學(xué)習(xí)字典為D2,根據(jù)切換字典策略,可定義切換字典D為
D=(1-Q)D1+QD2
(3)
對(duì)于波動(dòng)性較小的樣本,式(2)計(jì)算得到的切換因子Q等于0,代入式(3)中,可得到稀疏字典D=D1;對(duì)于波動(dòng)性較大的樣本,根據(jù)式(2)計(jì)算得到的切換因子Q等于1,代入式(3)得到稀疏字典D=D2。據(jù)此可根據(jù)不同數(shù)據(jù)特性,選擇不同的稀疏基,達(dá)到切換字典的目的。
為了驗(yàn)證提出的切換字典策略,采用空氣溫度數(shù)據(jù)作為實(shí)驗(yàn)對(duì)象。截止至2019年3月,課題組在全國(guó)范圍內(nèi)采集到的空氣溫度數(shù)據(jù)樣本共7 728個(gè),將所有樣本采用高斯函數(shù)擬合,計(jì)算其擬合決定系數(shù)R2和均方根誤差(RMSE)。
式(2)中的R0和E0取人工優(yōu)化篩選的經(jīng)驗(yàn)值R0=0.8,E0=0.1,得出波動(dòng)性較小的樣本數(shù)為2 740個(gè),占樣本總量的35.46%,波動(dòng)性較大的樣本數(shù)為4 988個(gè),占樣本總量的64.54%。
對(duì)比實(shí)驗(yàn)中,將空氣溫度數(shù)據(jù)分別使用DFT字典、K-SVD字典和切換字典進(jìn)行稀疏表達(dá),采用隨機(jī)高斯矩陣作為觀測(cè)矩陣,使用正交匹配追蹤(Orthogonal matching pursuit,OMP)算法對(duì)信號(hào)進(jìn)行重構(gòu)[20],將相同壓縮率下的重構(gòu)誤差作為性能評(píng)價(jià)的標(biāo)準(zhǔn)進(jìn)行比較。
從波動(dòng)較小的2 740個(gè)樣本中隨機(jī)抽取100個(gè)檢驗(yàn)樣本,剩余的空氣溫度數(shù)據(jù)作為訓(xùn)練樣本得到K-SVD學(xué)習(xí)字典。選取稀疏度K=16,定義DFT字典為Df1,通過(guò)K-SVD算法訓(xùn)練獲取到的K-SVD字典為Dk1,將所有檢驗(yàn)樣本分別在Df1和Dk1上進(jìn)行稀疏表示,經(jīng)觀測(cè)和重構(gòu)后,計(jì)算所有重構(gòu)信號(hào)與原始信號(hào)之間均方差,得到2個(gè)維度為100×1的重構(gòu)誤差集Ef1和Ek1,得到如圖4所示的箱線圖。
首先,在設(shè)計(jì)建筑的外觀時(shí),相關(guān)的設(shè)計(jì)人員可以利用色彩的組合營(yíng)造出新的建筑風(fēng)格,使整個(gè)建筑展現(xiàn)出不同的風(fēng)格,利用色彩的搭配可以有更好的藝術(shù)效果,轉(zhuǎn)變傳統(tǒng)的陳舊風(fēng)格和束縛,來(lái)使整個(gè)建筑變的主次分明,增加整個(gè)建筑的藝術(shù)魅力。除此之外,相關(guān)的設(shè)計(jì)人員可以采用兩種不同顏色疊加搭配的方式來(lái)增強(qiáng)整個(gè)建筑的視覺(jué)效果,因?yàn)樯士梢詭?lái)視覺(jué)上的享受和沖擊,讓人們可以直觀的感受到建筑物的美觀性。

圖4 波動(dòng)性較小的樣本集DFT和K-SVD字典的重構(gòu)誤差對(duì)比Fig.4 Comparison of reconstruction errors of DFT and K-SVD dictionaries for samples with low volatility
在圖4中,基于DFT字典壓縮的整體重構(gòu)誤差、極小值均小于K-SVD字典壓縮的重構(gòu)誤差;誤差集Ef1的箱體中位線在誤差集Ek1的中位線的下方;Ef1的箱體1/4 和3/4分界線均低于Ek1。經(jīng)統(tǒng)計(jì),共有81個(gè)樣本經(jīng)過(guò)DFT字典壓縮的重構(gòu)誤差小于K-SVD字典。
同理,從波動(dòng)較大的4 988個(gè)樣本中隨機(jī)抽取100個(gè)檢驗(yàn)樣本,剩余的空氣溫度數(shù)據(jù)作為訓(xùn)練樣本得到K-SVD學(xué)習(xí)字典。選取稀疏度K=16,定義DFT字典為Df2,通過(guò)K-SVD算法訓(xùn)練獲取到的K-SVD字典為Dk2,將所有檢驗(yàn)樣本分別在Df2和Dk2上進(jìn)行稀疏表示,經(jīng)觀測(cè)和重構(gòu)后,計(jì)算所有重構(gòu)信號(hào)與原始信號(hào)之間的均方差,得到2個(gè)維度為100×1的重構(gòu)誤差集Ef2和Ek2,得到如圖5所示的箱線圖。

圖5 波動(dòng)性較大的樣本集DFT和K-SVD字典的重構(gòu)誤差對(duì)比Fig.5 Comparison of reconstruction errors of DFT and K-SVD dictionaries for samples with high volatility
從圖5中可看出:基于K-SVD字典壓縮的整體重構(gòu)誤差、極大誤差均小于DFT字典壓縮的重構(gòu)誤差,誤差集Ek2的箱體3/4分界線與Ef2的箱體1/4分界線基本持平,且Ek2的箱體中位線遠(yuǎn)遠(yuǎn)低于Ef2的箱體1/4分界線。經(jīng)統(tǒng)計(jì),共有83個(gè)樣本經(jīng)過(guò)K-SVD字典壓縮的重構(gòu)誤差小于DFT字典。
對(duì)于不同波動(dòng)性樣本集的重構(gòu)誤差對(duì)比如表1所示。
對(duì)比表1的重構(gòu)誤差統(tǒng)計(jì)結(jié)果,對(duì)于波動(dòng)性較大的樣本,宜采用K-SVD字典進(jìn)行壓縮,對(duì)于波動(dòng)性較小的樣本,宜采用DFT字典進(jìn)行壓縮,這就為切換字典策略的提出提供了數(shù)據(jù)支撐。
從所有7 728個(gè)樣本中隨機(jī)抽取100個(gè)檢驗(yàn)樣本,剩余的空氣溫度數(shù)據(jù)作為訓(xùn)練樣本得到K-SVD學(xué)習(xí)字典。選取稀疏度K=16,定義DFT字典為Df3,通過(guò)K-SVD算法訓(xùn)練獲取到的K-SVD字典為Dk3,經(jīng)式(2)、(3)計(jì)算得到切換字典Dt3。

表1 DFT、K-SVD字典的重構(gòu)誤差對(duì)比Tab.1 Comparison of reconstruction error of DFT and K-SVD dictionaries %
將所有檢驗(yàn)樣本分別在Df3、Dk3和Dt3上進(jìn)行稀疏表達(dá),經(jīng)觀測(cè)和重構(gòu)后,計(jì)算所有重構(gòu)信號(hào)與原始信號(hào)之間的均方差,得到3個(gè)維度為100×1的重構(gòu)誤差集Ef3、Ek3和Et3,得到如圖6所示的箱線圖。

圖6 DFT、K-SVD和切換字典的重構(gòu)誤差對(duì)比Fig.6 Comparison of reconstruction errors of DFT, K-SVD and toggling dictionaries
圖6中,使用切換字典壓縮的最大重構(gòu)誤差基本與K-SVD字典的最大重構(gòu)誤差持平,說(shuō)明對(duì)于波動(dòng)性較大的樣本采用了K-SVD字典進(jìn)行壓縮;使用切換字典的最小重構(gòu)誤差與DFT字典的最小重構(gòu)誤差基本持平,說(shuō)明對(duì)波動(dòng)性較小的樣本采用了DFT字典進(jìn)行壓縮。

表2 DFT、K-SVD和切換字典的重構(gòu)誤差對(duì)比Tab.2 Comparison of reconstruction error of DFT, K-SVD and toggling dictionaries %
與K-SVD字典的最大重構(gòu)誤差基本一致,并且基于切換字典的最小重構(gòu)誤差為1.09%,與DFT字典的最小重構(gòu)誤差基本一致。
對(duì)比表2的重構(gòu)誤差統(tǒng)計(jì)結(jié)果,采用切換字典的壓縮方法,綜合了DFT和K-SVD字典的優(yōu)勢(shì),能夠判斷全部樣本數(shù)據(jù)的波動(dòng)性,自動(dòng)進(jìn)行K-SVD和DFT字典的切換,比使用DFT或K-SVD單一字典的重構(gòu)誤差小。
采用DFT、K-SVD和切換字典對(duì)林區(qū)小氣候監(jiān)測(cè)站采集的空氣溫度、空氣濕度、土壤溫度和土壤濕度4個(gè)參數(shù)進(jìn)行壓縮,計(jì)算稀疏誤差和重構(gòu)誤差,如表3所示。

表3 不同稀疏度下DFT字典、K-SVD字典和切換字典的壓縮性能Tab.3 Compression performance of DFT, K-SVD and toggling dictionaries with different sparsities
表3中,當(dāng)稀疏度K逐步從8增加至32時(shí),基于單一字典和切換字典的稀疏誤差和重構(gòu)誤差均逐漸降低,壓縮比也逐漸降低;使用切換字典進(jìn)行稀疏表達(dá)的稀疏誤差和重構(gòu)誤差均優(yōu)于DFT或K-SVD單一字典。
為驗(yàn)證切換字典策略對(duì)降低林區(qū)小氣候監(jiān)測(cè)站功耗的效果,在北京市海淀區(qū)八家村北京林業(yè)大學(xué)實(shí)驗(yàn)基地開(kāi)展測(cè)試。小氣候監(jiān)測(cè)站的傳感器和GPRS通信模塊由數(shù)據(jù)采集器供電。數(shù)據(jù)采集器中的處理器采用ATMEL公司的ATMEGA2560單片機(jī),實(shí)現(xiàn)數(shù)據(jù)的采集、壓縮和傳輸。
小氣候監(jiān)測(cè)站的總耗能采用PM9817D型電參數(shù)測(cè)量?jī)x進(jìn)行測(cè)量,見(jiàn)圖7。電參數(shù)測(cè)量?jī)x的量程為0~999 999 W·h,精度為±0.1%。在測(cè)試中,PM9817D型電參數(shù)測(cè)量?jī)x連接小氣候監(jiān)測(cè)站數(shù)據(jù)采集器的總供電輸入,對(duì)總耗能進(jìn)行連續(xù)測(cè)量。

圖7 功耗測(cè)試Fig.7 Power consumption experiment1.PM9817D型電參數(shù)測(cè)量?jī)x 2.數(shù)據(jù)采集器 3.太陽(yáng)能板 4.蓄電池箱
測(cè)試中數(shù)據(jù)采集器接收和傳輸空氣溫度、空氣濕度、土壤溫度、土壤濕度4個(gè)傳感器的數(shù)據(jù),每5 min采集1次,全天采集288次,共1 152個(gè)數(shù)據(jù),選取稀疏度K=16,分別使用DFT字典、K-SVD和切換字典對(duì)原始數(shù)據(jù)進(jìn)行壓縮,發(fā)送給云服務(wù)器。經(jīng)連續(xù)5 d測(cè)試,未壓縮和經(jīng)過(guò)DFT、K-SVD、切換字典壓縮后每天平均能量消耗分別為20.73、17.25、17.52、17.34 W·h。
相對(duì)于未作數(shù)據(jù)壓縮的監(jiān)測(cè)站功耗,采用DFT字典、K-SVD字典和切換字典壓縮后,監(jiān)測(cè)站每天平均功耗分別降低了16.79%、15.48%和16.35%。使用切換字典的耗能介于DFT字典和K-SVD字典之間。結(jié)合表3,采用切換字典的壓縮方式,在減小重構(gòu)誤差的前提下,有效降低了林區(qū)小氣候監(jiān)測(cè)站的系統(tǒng)功耗。
(1)提出了基于切換字典的林區(qū)小氣候監(jiān)測(cè)數(shù)據(jù)壓縮感知策略,切換選擇最適合的字典對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行壓縮,達(dá)到減小重構(gòu)誤差和降低系統(tǒng)能耗的目的。
(2)根據(jù)監(jiān)測(cè)數(shù)據(jù)的不同特性,定義了切換因子,對(duì)樣本進(jìn)行分類(lèi),合理切換使用DFT固定字典或K-SVD學(xué)習(xí)字典,對(duì)樣本數(shù)據(jù)進(jìn)行稀疏表達(dá)和數(shù)據(jù)壓縮。
(3)實(shí)驗(yàn)結(jié)果表明,結(jié)合兩種字典的優(yōu)勢(shì),采用切換字典對(duì)數(shù)據(jù)進(jìn)行壓縮,比采用單一字典進(jìn)行壓縮的重構(gòu)誤差小,林區(qū)微環(huán)境監(jiān)測(cè)站功耗降低了16.35%,可有效提高林區(qū)小氣候監(jiān)測(cè)站的待機(jī)時(shí)間,保證低功耗運(yùn)行和數(shù)據(jù)可靠傳輸。