基于WT-BiLSTM-ARMA模型的PM2.5濃度預測研究＊

2023-01-30 04:08:12程妍菲張明輝王寶珠

計算機時代 2023年1期

關鍵詞：模型

程妍菲，張明輝，王寶珠

(河北工業大學電子信息工程學院，天津 300401)

0 引言

近年來，隨著工業化進程的不斷加快，我國的能源消耗量也在持續增加，導致PM2.5(測量直徑為2.5微米或更小的顆粒物)等空氣污染物大量聚積[1]。研究表明，長期暴露在含有高濃度污染物的環境中，會給人類的身體健康帶來極大危害。不僅如此，空氣污染問題也給我國的交通運輸、社會經濟等帶來了重大損失[2]。高效且精準的預報不僅能夠為環保部門及時了解未來的空氣質量變化趨勢提供一定的參考，而且對生態環境的管理和保護有重大意義[3]。

目前已知的預測方法可分為兩類：通過機理模型預測和通過統計模型預測。機理模型的本質是根據對大氣污染物的產生、轉換、擴散的物理化學過程來建模，從而進行后續預測分析[4]。比較典型的有美國的WRF-Chem 模型[5]、CMAQ 模型[6]等，但考慮到預測過程較為復雜、建模難度較大、預測精度不足且難以提升等問題，機理模型并沒有得到廣泛應用。相較于機理模型，統計模型不用考慮復雜的物理化學過程，建模過程較為簡單且預測精度易于優化，因而被廣泛使用[7-9]。隨著人工智能技術的逐步推廣，越來越多的研究人員也致力于將機器學習與該領域相結合的研究，采用基于統計模型的機器學習模型進行空氣質量的預測[10-12]。例如，白鶴鳴等人在北京市空氣質量數據的基礎上建立了BP神經網絡模型，得到了較好的預測效果[13]。L 等人將HW(霍爾特-溫特斯)與ANN 進行結合應用于里約熱內盧的空氣質量預測，得到了足夠準確的預測結果[14]。Wang 等人采用了Convnet 和基于Densebase 的雙向選通循環單元，結合了Convnet、Dense 和Bi-GRU，也獲得了較好的預測效果[15]。

隨著機器學習研究的不斷深入，人工神經網絡也在不斷豐富和發展[16]。1997 年，Honchreater 和Schmidhuber 兩人共同提出長短期記憶神經網絡(Long Short Term Memory，LSTM)并于2001年提出了進一步的改進[17]。由于LSTM 神經網絡自帶循環記憶單元，所以在具有前后依賴關系的時間序列的處理問題上具有自身獨特的優勢并且能夠處理具有較長時滯的序列，廣泛應用于各個領域的預測問題上[18,19]。

本文在LSTM 神經網絡的基礎上，建立了基于雙向長短期記憶神經網絡(Bi-directional Long Short Term Memory,BiLSTM)的預測模型，相較于傳統的LSTM模型，BiLSTM模型的預測效果更為準確。

1 理論支持

1.1 小波分解

小波變換最早由Mallat 提出，Mallat 在Burt 和Adelson的塔形圖像分解和重構算法的啟發下，提出了小波變換的Mallat 快速算法[20,21]。本文采用小波分解技術對原始的PM2.5 時間序列數據進行處理，將具有高頻細節特征的高頻信號分離出來，從而獲得了更多的數據特征[22]。分解過程表達如下：

其中，H代表低通濾波器，G代表高通濾波器，Aj代表由低通濾波器得到的低頻分量，Dj代表由高通濾波器得到的高頻分量。而小波變換過程中的分解信號的每一層都是預分解信號的一半，因此我們需要進行兩次插值重建來恢復信號長度，重建公式表示如下：

其中，H2和H相對應，G2和G相對應。

本文采用小波分解算法進行四層分解和重構，以獲得D1，D2，D3，D4四個高頻細節分量和A一個低頻近似分量[23]。

1.2 CEEMDAN

自適應噪聲完備集合經驗模態分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise,CEEMDAN) 在經驗模式分解(Empirical Mode Decomposition,EMD)的基礎上，疊加了集成經驗模式分解(Ensemble Empirical Mode Decomposition,EEMD)中的加入高斯噪聲和通過多次疊加并平均來抵消噪聲的思想。信號分解能力更強，更有利于特征的提取[24]。

1.3 BiLSTM

本文在LSTM 的基礎上對高頻分量進行預測[25]。LSTM 是長短期神經網絡，與RNN 模型的功能相類似，用于表示時間序列數據的動態時間行為。不同的是，LSTM 中的隱藏層被一個長短期記憶單元所取代。因此，相較于傳統的RNN 模型，LSTM 模型可以解決長期依賴性和消失梯度的問題。然而，LSTM 的隱藏層只能獲取過去的特征。因此本文采用BiLSTM 模型，從而可以更好地理解過去和未來兩個方向的時間序列數據，進行更加準確的預測。BiLSTM 層結構如圖1所示。

圖1 BiLSTM結構

圖1 中，一個LSTM 單元由一個輸入門、一個輸出門和一個忘記門組成，且LSTM 有兩個重要屬性，一個是隨著時間而變化的隱藏層ht,另一個是維持長期記憶的細胞Ct。Ct由此時的輸入門it、遺忘門ft和前一時刻的隱藏層ht-1和記憶細胞Ct-1決定，而隱藏層ht則由記憶細胞Ct和此時的輸入數據確定，表示為：

其中，W和B分別表示通過模型訓練獲得的權重矩陣和偏差向量。σ表示sigmoid 激活函數，“·”表示元素對元素的乘積。

1.4 ARMA

自回歸滑動平均模型(Autoregressive Moving Average Model,ARMA)由自回歸模型(Autoregressive Model,AR)與移動平均模型(Moving Average Model,MA)混合得到。它通過對擾動項進行模型分析來將過去值、當前值和誤差結合起來，是研究平穩時間序列的一種重要方法[26]。本文采用ARMA 模型對小波分解所得的低頻近似分量進行預測。數學模型如下：

其中，A表示輸入數據，φ表示自回歸模型系數，φ0是一個定值，θ表示滑動平均模型系數，εt表示白噪聲過程。p和q表示ARMA 模型的兩個系數，其中pp 表示延遲算子，q表示滑動平均窗口的大小。

2 模型建立

2.1 數據來源

本文研究數據來源于北京市生態環境監測中心，包括2017 年1 月-2020 年1 月北京市6 個國控站點測得的PM2.5濃度數據，如表1所示。

表1 北京市六個大氣污染國控站點坐標

2.2 WT-BiLSTM-ARMA模型

WT-BiLSTM-ARMA 模型預測流程如圖4 所示。以下具體描述建模步驟，其中步驟四和步驟五為模型創新點。

圖4 預測流程

步驟一對原始數據進行歸一化處理：

其中，xi表示原始序列，n表示序列長度，yi表示歸一化結果。

步驟二對數據進行四階小波分解，得到四個高頻信號D1，D2，D3，D4和一個低頻信號A。將分解結果按3:1 的比例分為訓練集和測試集。此處以天壇監測站的PM2.5 數據集為例，得到結果如圖2 和圖3 所示。其中圖2為分解得到的低頻序列，可以看出低頻序列A具有明顯的趨勢性和一定的周期性。而圖3中的高頻序列D1-D4則明顯反映了原始時間序列趨勢的隨機波動變化。

圖2 小波分解得低頻序列

圖3 小波分解得高頻序列

步驟三將小波分解得到的四個高頻信號進行數據處理，從而獲得BiLSTM 模型和ARMA 模型對應的輸入特征。

步驟四將步驟三的結果輸入BiLSTM 模型進行訓練并將小波分解得到的低頻信號A 輸入ARMA 模型進行訓練。

步驟五將測試集數據輸入訓練后的BiLSTM 和ARMA 模型，獲得各自的預測結果，并通過對各個預測結果進行小波重構得到最終預測值。

2.3 預測效果評價指標

本文采用平均絕對誤差MAE、均方根誤差RMSE和方差R2作為指標來對預測結果進行評價。

MAE 表示所有單個預測值與算術平均值的偏差的絕對值的平均，反映了預測值誤差的真實情況，模型越完美，該值越小。

RMSE 又稱標準誤差，是預測值與真實值偏差的平方值與觀測次數n比值的平方。模型的精度越高，該值越小。

R2為擬合優度的統計度量，其值越接近1，表示模型擬合越好。

三項指標表示如下：

其中，y為數據實際值，ypredict為模型得到的預測值，n表示數據集的長度。

2.4 預測結果

預測結果如表2和圖5～圖10所示。

表2 各監測點預測結果

圖5 東四監測站預測結果

圖6 天壇監測站預測結果

圖7 萬柳監測站預測結果

圖8 懷柔監測站預測結果

圖9 昌平監測站預測結果

圖10 奧體中心監測站預測結果

表2 記錄了WT-BiLSTM-ARMA 模型在六個監測點的PM2.5 濃度數據的基礎上得到的預測結果。圖5-圖10 為WT-BiLSTM-ARMA 模型在六個監測點的數據的測試集的基礎上得到的預測值與真實值的對比結果。

3 對比分析

3.1 模型對比

為了驗證本文提出的預測模型的精確度和有效性，本文將所提出模型與其余幾種預測模型進行了對比分析，包括單一模型LSTM、BiLSTM、ARMA 以及混合模型WT-BiLSTM 模型和CEEMDAN-BiLSTM模型[27]。如圖11 所示，WT-BiLSTM 模型將小波分解得到的所有序列送入BiLSTM 模型進行預測，而CEEMDAN-BiLSTM 模型是采用CEEMDAN 分解方法對原始數據進行分解。

圖11 模型對比

3.2 結果對比

本文將六個監測點的數據輸入各個模型并求得結果的平均值，比對結果如表3所示。

由表3 可得，單一預測模型ARMA、LSTM 和BiLSTM 均取得了較好的預測效果，但多次試驗所得數據證明BiLSTM 的預測效果要好于LSTM 和ARMA。但由于PM2.5 數據本身存在自相關性，所以單一模型的預測結果存在一定的滯后問題。

與單一模型相比，CEEMDAN-BiLSTM 模型的預測精度有所提高，但是存在總體預測值小于實際值的問題，且模型運行時間過長。因此，WT-BiLSTM 模型和WT-BiLSTM-ARMA 模型的預測結果更為精確且實用性更強。由于ARMA 更適用于低頻數據的預測，所以我們將低頻分量A輸入ARMA 模型時所得到的結果更為精確。

通過對預測結果評價指標的全面分析，本文提出的WT-BiLSTM-ARMA 模型與單一模型BiLSTM 相比，RMSE 降低了66.8%，MAE 降低了64%，R2提高了5.03%；與混合模型WT-BiLSTM 相比，RMSE 降低了40.5%，MAE 降低了50.2%，R2提高了1.15%，具有更高的預測精度。

4 結束語

隨著全球范圍內空氣質量的不斷惡化，精準的空氣質量預測對生態治理和環境保護工作都具有重大意義。本文提出的WT-BiLSTM-ARMA 模型可以通過小波分解算法在大量原始數據中提取出周期特征和隨機特征，得到了較高的預測精度，具有良好的推廣性。本文將所述模型與單一模型LSTM、BiLSTM、ARMA 以及混合模型CEEMDAN-BiLSTM 和WTBiLSTM 進行了對比。實驗結果表明，該模型更適合于PM2.5的預測。

本文的研究不足之處在于僅以時間的維度作為自變量進行分析，忽略了空間維度的影響。未來可以結合其他時間序列分析模型、空間分析模型以及數據分解方法進行改進，以獲得更好的預測結果。本模型也可按需應用于燃氣負荷，短期網絡流量以及短期人流量等預測問題。