999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于WT-BiLSTM-ARMA模型的PM2.5濃度預測研究*

2023-01-30 04:08:12程妍菲張明輝王寶珠
計算機時代 2023年1期
關鍵詞:模型

程妍菲,張明輝,王寶珠

(河北工業大學電子信息工程學院,天津 300401)

0 引言

近年來,隨著工業化進程的不斷加快,我國的能源消耗量也在持續增加,導致PM2.5(測量直徑為2.5微米或更小的顆粒物)等空氣污染物大量聚積[1]。研究表明,長期暴露在含有高濃度污染物的環境中,會給人類的身體健康帶來極大危害。不僅如此,空氣污染問題也給我國的交通運輸、社會經濟等帶來了重大損失[2]。高效且精準的預報不僅能夠為環保部門及時了解未來的空氣質量變化趨勢提供一定的參考,而且對生態環境的管理和保護有重大意義[3]。

目前已知的預測方法可分為兩類:通過機理模型預測和通過統計模型預測。機理模型的本質是根據對大氣污染物的產生、轉換、擴散的物理化學過程來建模,從而進行后續預測分析[4]。比較典型的有美國的WRF-Chem 模型[5]、CMAQ 模型[6]等,但考慮到預測過程較為復雜、建模難度較大、預測精度不足且難以提升等問題,機理模型并沒有得到廣泛應用。相較于機理模型,統計模型不用考慮復雜的物理化學過程,建模過程較為簡單且預測精度易于優化,因而被廣泛使用[7-9]。隨著人工智能技術的逐步推廣,越來越多的研究人員也致力于將機器學習與該領域相結合的研究,采用基于統計模型的機器學習模型進行空氣質量的預測[10-12]。例如,白鶴鳴等人在北京市空氣質量數據的基礎上建立了BP神經網絡模型,得到了較好的預測效果[13]。L 等人將HW(霍爾特-溫特斯)與ANN 進行結合應用于里約熱內盧的空氣質量預測,得到了足夠準確的預測結果[14]。Wang 等人采用了Convnet 和基于Densebase 的雙向選通循環單元,結合了Convnet、Dense 和Bi-GRU,也獲得了較好的預測效果[15]。

隨著機器學習研究的不斷深入,人工神經網絡也在不斷豐富和發展[16]。1997 年,Honchreater 和Schmidhuber 兩人共同提出長短期記憶神經網絡(Long Short Term Memory,LSTM)并于2001年提出了進一步的改進[17]。由于LSTM 神經網絡自帶循環記憶單元,所以在具有前后依賴關系的時間序列的處理問題上具有自身獨特的優勢并且能夠處理具有較長時滯的序列,廣泛應用于各個領域的預測問題上[18,19]。

本文在LSTM 神經網絡的基礎上,建立了基于雙向長短期記憶神經網絡(Bi-directional Long Short Term Memory,BiLSTM)的預測模型,相較于傳統的LSTM模型,BiLSTM模型的預測效果更為準確。

1 理論支持

1.1 小波分解

小波變換最早由Mallat 提出,Mallat 在Burt 和Adelson的塔形圖像分解和重構算法的啟發下,提出了小波變換的Mallat 快速算法[20,21]。本文采用小波分解技術對原始的PM2.5 時間序列數據進行處理,將具有高頻細節特征的高頻信號分離出來,從而獲得了更多的數據特征[22]。分解過程表達如下:

其中,H代表低通濾波器,G代表高通濾波器,Aj代表由低通濾波器得到的低頻分量,Dj代表由高通濾波器得到的高頻分量。而小波變換過程中的分解信號的每一層都是預分解信號的一半,因此我們需要進行兩次插值重建來恢復信號長度,重建公式表示如下:

其中,H2和H相對應,G2和G相對應。

本文采用小波分解算法進行四層分解和重構,以獲得D1,D2,D3,D4四個高頻細節分量和A一個低頻近似分量[23]。

1.2 CEEMDAN

自適應噪聲完備集合經驗模態分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise,CEEMDAN) 在經驗模式分解(Empirical Mode Decomposition,EMD)的基礎上,疊加了集成經驗模式分解(Ensemble Empirical Mode Decomposition,EEMD)中的加入高斯噪聲和通過多次疊加并平均來抵消噪聲的思想。信號分解能力更強,更有利于特征的提取[24]。

1.3 BiLSTM

本文在LSTM 的基礎上對高頻分量進行預測[25]。LSTM 是長短期神經網絡,與RNN 模型的功能相類似,用于表示時間序列數據的動態時間行為。不同的是,LSTM 中的隱藏層被一個長短期記憶單元所取代。因此,相較于傳統的RNN 模型,LSTM 模型可以解決長期依賴性和消失梯度的問題。然而,LSTM 的隱藏層只能獲取過去的特征。因此本文采用BiLSTM 模型,從而可以更好地理解過去和未來兩個方向的時間序列數據,進行更加準確的預測。BiLSTM 層結構如圖1所示。

圖1 BiLSTM結構

圖1 中,一個LSTM 單元由一個輸入門、一個輸出門和一個忘記門組成,且LSTM 有兩個重要屬性,一個是隨著時間而變化的隱藏層ht,另一個是維持長期記憶的細胞Ct。Ct由此時的輸入門it、遺忘門ft和前一時刻的隱藏層ht-1和記憶細胞Ct-1決定,而隱藏層ht則由記憶細胞Ct和此時的輸入數據確定,表示為:

其中,W和B分別表示通過模型訓練獲得的權重矩陣和偏差向量。σ表示sigmoid 激活函數,“·”表示元素對元素的乘積。

1.4 ARMA

自回歸滑動平均模型(Autoregressive Moving Average Model,ARMA)由自回歸模型(Autoregressive Model,AR)與移動平均模型(Moving Average Model,MA)混合得到。它通過對擾動項進行模型分析來將過去值、當前值和誤差結合起來,是研究平穩時間序列的一種重要方法[26]。本文采用ARMA 模型對小波分解所得的低頻近似分量進行預測。數學模型如下:

其中,A表示輸入數據,φ表示自回歸模型系數,φ0是一個定值,θ表示滑動平均模型系數,εt表示白噪聲過程。p和q表示ARMA 模型的兩個系數,其中pp 表示延遲算子,q表示滑動平均窗口的大小。

2 模型建立

2.1 數據來源

本文研究數據來源于北京市生態環境監測中心,包括2017 年1 月-2020 年1 月北京市6 個國控站點測得的PM2.5濃度數據,如表1所示。

表1 北京市六個大氣污染國控站點坐標

2.2 WT-BiLSTM-ARMA模型

WT-BiLSTM-ARMA 模型預測流程如圖4 所示。以下具體描述建模步驟,其中步驟四和步驟五為模型創新點。

圖4 預測流程

步驟一對原始數據進行歸一化處理:

其中,xi表示原始序列,n表示序列長度,yi表示歸一化結果。

步驟二對數據進行四階小波分解,得到四個高頻信號D1,D2,D3,D4和一個低頻信號A。將分解結果按3:1 的比例分為訓練集和測試集。此處以天壇監測站的PM2.5 數據集為例,得到結果如圖2 和圖3 所示。其中圖2為分解得到的低頻序列,可以看出低頻序列A具有明顯的趨勢性和一定的周期性。而圖3中的高頻序列D1-D4則明顯反映了原始時間序列趨勢的隨機波動變化。

圖2 小波分解得低頻序列

圖3 小波分解得高頻序列

步驟三將小波分解得到的四個高頻信號進行數據處理,從而獲得BiLSTM 模型和ARMA 模型對應的輸入特征。

步驟四將步驟三的結果輸入BiLSTM 模型進行訓練并將小波分解得到的低頻信號A 輸入ARMA 模型進行訓練。

步驟五將測試集數據輸入訓練后的BiLSTM 和ARMA 模型,獲得各自的預測結果,并通過對各個預測結果進行小波重構得到最終預測值。

2.3 預測效果評價指標

本文采用平均絕對誤差MAE、均方根誤差RMSE和方差R2作為指標來對預測結果進行評價。

MAE 表示所有單個預測值與算術平均值的偏差的絕對值的平均,反映了預測值誤差的真實情況,模型越完美,該值越小。

RMSE 又稱標準誤差,是預測值與真實值偏差的平方值與觀測次數n比值的平方。模型的精度越高,該值越小。

R2為擬合優度的統計度量,其值越接近1,表示模型擬合越好。

三項指標表示如下:

其中,y為數據實際值,ypredict為模型得到的預測值,n表示數據集的長度。

2.4 預測結果

預測結果如表2和圖5~圖10所示。

表2 各監測點預測結果

圖5 東四監測站預測結果

圖6 天壇監測站預測結果

圖7 萬柳監測站預測結果

圖8 懷柔監測站預測結果

圖9 昌平監測站預測結果

圖10 奧體中心監測站預測結果

表2 記錄了WT-BiLSTM-ARMA 模型在六個監測點的PM2.5 濃度數據的基礎上得到的預測結果。圖5-圖10 為WT-BiLSTM-ARMA 模型在六個監測點的數據的測試集的基礎上得到的預測值與真實值的對比結果。

3 對比分析

3.1 模型對比

為了驗證本文提出的預測模型的精確度和有效性,本文將所提出模型與其余幾種預測模型進行了對比分析,包括單一模型LSTM、BiLSTM、ARMA 以及混合模型WT-BiLSTM 模型和CEEMDAN-BiLSTM模型[27]。如圖11 所示,WT-BiLSTM 模型將小波分解得到的所有序列送入BiLSTM 模型進行預測,而CEEMDAN-BiLSTM 模型是采用CEEMDAN 分解方法對原始數據進行分解。

圖11 模型對比

3.2 結果對比

本文將六個監測點的數據輸入各個模型并求得結果的平均值,比對結果如表3所示。

由表3 可得,單一預測模型ARMA、LSTM 和BiLSTM 均取得了較好的預測效果,但多次試驗所得數據證明BiLSTM 的預測效果要好于LSTM 和ARMA。但由于PM2.5 數據本身存在自相關性,所以單一模型的預測結果存在一定的滯后問題。

與單一模型相比,CEEMDAN-BiLSTM 模型的預測精度有所提高,但是存在總體預測值小于實際值的問題,且模型運行時間過長。因此,WT-BiLSTM 模型和WT-BiLSTM-ARMA 模型的預測結果更為精確且實用性更強。由于ARMA 更適用于低頻數據的預測,所以我們將低頻分量A輸入ARMA 模型時所得到的結果更為精確。

通過對預測結果評價指標的全面分析,本文提出的WT-BiLSTM-ARMA 模型與單一模型BiLSTM 相比,RMSE 降低了66.8%,MAE 降低了64%,R2提高了5.03%;與混合模型WT-BiLSTM 相比,RMSE 降低了40.5%,MAE 降低了50.2%,R2提高了1.15%,具有更高的預測精度。

4 結束語

隨著全球范圍內空氣質量的不斷惡化,精準的空氣質量預測對生態治理和環境保護工作都具有重大意義。本文提出的WT-BiLSTM-ARMA 模型可以通過小波分解算法在大量原始數據中提取出周期特征和隨機特征,得到了較高的預測精度,具有良好的推廣性。本文將所述模型與單一模型LSTM、BiLSTM、ARMA 以及混合模型CEEMDAN-BiLSTM 和WTBiLSTM 進行了對比。實驗結果表明,該模型更適合于PM2.5的預測。

本文的研究不足之處在于僅以時間的維度作為自變量進行分析,忽略了空間維度的影響。未來可以結合其他時間序列分析模型、空間分析模型以及數據分解方法進行改進,以獲得更好的預測結果。本模型也可按需應用于燃氣負荷,短期網絡流量以及短期人流量等預測問題。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 亚洲色无码专线精品观看| 国产精品亚洲综合久久小说| 精品人妻无码区在线视频| 永久在线精品免费视频观看| 99久久性生片| 亚洲国产成人精品一二区 | 日本午夜在线视频| 国产一级二级在线观看| 永久天堂网Av| 精品免费在线视频| 色综合天天娱乐综合网| 高清无码一本到东京热| 国产97视频在线观看| 国产欧美视频在线观看| 亚洲V日韩V无码一区二区| 中文字幕 91| 久久综合九九亚洲一区| 在线播放精品一区二区啪视频| 91小视频在线播放| 久久国产精品77777| 国产成人亚洲综合a∨婷婷| 国产欧美日韩另类精彩视频| 国产乱人视频免费观看| 精品一区二区三区视频免费观看| 91欧洲国产日韩在线人成| 日韩欧美91| 日韩精品一区二区深田咏美| 特级欧美视频aaaaaa| 日韩中文精品亚洲第三区| 又污又黄又无遮挡网站| 中文字幕人成人乱码亚洲电影| 日本久久久久久免费网络| 四虎免费视频网站| 欧美一级爱操视频| 亚洲婷婷丁香| 日韩欧美网址| 国产三区二区| 国产毛片不卡| 国产AV无码专区亚洲精品网站| 国产精品自在自线免费观看| 天天婬欲婬香婬色婬视频播放| 国产极品粉嫩小泬免费看| 中文字幕2区| 亚洲最新网址| 亚洲无码精品在线播放 | 人人澡人人爽欧美一区| 欧美乱妇高清无乱码免费| 国产精品久久国产精麻豆99网站| 国产va免费精品观看| 91国语视频| 亚洲一区网站| 亚洲AV无码乱码在线观看代蜜桃 | 香蕉色综合| 国产福利在线观看精品| 久久综合伊人77777| 国产成人一区| 欧美精品黑人粗大| 全午夜免费一级毛片| 国产精品人莉莉成在线播放| 国产精品va免费视频| 国产无遮挡猛进猛出免费软件| 搞黄网站免费观看| 一级香蕉视频在线观看| 国产成人精品男人的天堂| 免费xxxxx在线观看网站| 中文字幕天无码久久精品视频免费| 全免费a级毛片免费看不卡| 无码一区二区三区视频在线播放| 国产av无码日韩av无码网站| 中文字幕色在线| 日韩大乳视频中文字幕| 国产不卡网| 91在线国内在线播放老师 | 亚洲an第二区国产精品| 最新无码专区超级碰碰碰| 99re视频在线| 欧美一区二区精品久久久| 国产美女丝袜高潮| 天堂亚洲网| 国产成人亚洲毛片| 国产精品久久久久鬼色| 91丝袜乱伦|