999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

融合深度神經網絡特征的ARIMAX霧霾PM2.5預測

2023-03-04 06:43:06張鈺潔楊杏麗
計算機技術與發展 2023年2期
關鍵詞:特征模型

張鈺潔,王 鈺,楊杏麗

(1.山西大學 數學科學學院,山西 太原 030006;2.山西大學 現代教育技術學院,山西 太原 030006)

0 引 言

霧霾天氣是一種大氣污染狀態,霧霾是對大氣中各種懸浮顆粒物含量超標的籠統表述。霧霾的主要成分包括PM2.5顆粒物、PM10顆粒物、臭氧、二氧化氮、二氧化硫和一氧化碳等,尤其是由有毒物質如重金屬和致癌物質等組成的有機化合物PM2.5(空氣動力學當量直徑小于等于2.5微米的顆粒物)被認為是造成霧霾天氣的“元兇”[1-2]。

PM2.5對人類健康的危害極大,會導致心血管和心肺部疾病、呼吸系統問題,增加癌癥的發病幾率,也可能會造成嬰兒的畸形發育等[3-4]。另外,PM2.5霧霾污染對氣候變化和生態環境也有很大影響,PM2.5濃度的增加可能是極端天氣和氣候事件增加的主要原因之一,如引起城市大氣酸雨、光化學煙霧現象,導致大氣能見度下降,極大阻礙空中、水面和陸面交通的正常運行。

因此,準確監測霧霾變化,獲取霧霾相關信息,尤其是及時準確預報霧霾污染物的濃度,對于大氣科學、大氣環境監測、氣候分析、氣象預報、環境保護、國民經濟和軍事等諸多方面均具有重要意義[5-6]。

目前,文獻中已經提出了多種霧霾污染濃度的預測模型和技術,如差分自回歸滑動平均(Autoregressive Integrated Moving Average,ARIMA)模型[7]、多元線性回歸模型[8]、季節性差分自回歸滑動平均(Seasonal Autoregressive Integrated Moving Average,SARIMA)模型[9]、向量自回歸模型[10]、支持向量機(Support Vector Machine,SVM)模型[11]、決策樹[12]、隨機森林[13-14]、長短期記憶網絡(Long and Short-Term Memory,LSTM)[15-17]等。進一步,朱旭輝等[18]針對單個SVM方法的不魯棒問題,通過使用多數投票算法對多個SVM模型進行選擇性集成,給出了一種集成的霧霾天氣預測方法,實驗結果表明集成后的SVM方法具有更高的精度和魯棒性。劉夢煬等[19]構建了一種基于LSTM和全連接神經網絡的混合神經網絡模型,并提出了數據桶劃分的訓練方式來解決由于訓練數據與預測數據存在較長時間間隔導致精度下降的問題,進而實現PM2.5濃度的精確預測。然而,上述方法都僅僅使用了霧霾數據本身的信息,但實際上溫度、壓力、相對濕度等氣象因子對于霧霾的預測都有顯著的影響。為此,該文考慮融合溫度、壓力、相對濕度的氣象數據和霧霾數據給出更為準確的霧霾預測結果。

然而發現,簡單融合三個常用氣象因子的ARIMAX霧霾預測模型并不能得到滿意的預測結果。這是因為霧霾的形成和發展過程是非常復雜的,這些模型可能無法充分有效地模擬復雜的霧霾過程,從而無法捕獲重要的深度語義特征,造成預測結果不準確。

特別地,深度神經網絡模型由于其強大的特征表示能力得到了極大的關注,為此,該文考慮將深度卷積神經網絡模型提取的深度語義特征融入到ARIMAX模型,給出一種新的霧霾序列預測框架。首先,由于卷積神經網絡[20]能夠自動準確地學習圖像空間相關性等深度語義信息,將數值氣象因子數據轉化為圖像數據;然后,基于具有優越性能的ResNet-50 (Residual Network-50)卷積神經網絡模型[21]提取氣象因子圖像序列中的深層特征,進一步采用主成分分析(Principal Component Analysis,PCA)技術處理高維特征,得到最佳深度語義特征組合;最后,用簡單有效的ARIMAX模型建模捕獲霧霾的時間序列相關信息。

1 提出的霧霾預測框架

1.1 ARIMAX模型

ARIMAX模型是指帶回歸項的ARIMA模型,又稱擴展的ARIMA模型,通過回歸項的引入進一步提高模型的預測效果。此模型把輸出序列表示為隨機波動的過去值和預測因子序列的過去值的結合,即:

其中,Yt表示輸出序列,{X1t},{X2t},…,{Xkt}表示輸入變量序列,{εt}為回歸殘差序列,{at}為零均值白噪聲序列,B為滯后操作算子,Θi(B)為第i個輸入變量的自回歸系數多項式,Φi(B)為第i個輸入變量的滑動平均系數多項式,li為第i個輸入變量的滯后階數,且:

Φ(B)=1-φ1B-…-φpBp

Θ(B)=1-θ1B-…-θqBq

1.2 ResNet-50神經網絡模型

ResNet-50模型是目前深度學習中的主流卷積神經網絡模型,其內部的殘差塊使用了跳躍連接,極大地緩解了梯度消失問題,克服了由于網絡深度加深而產生的學習效率變低與準確率無法有效提升的問題。因此,該文使用ResNet-50模型提取深度語義圖像特征。具體地,ResNet-50模型的網絡結構如表1所列,它包含了49個卷積層、1個全連接層,總共由16個殘差塊組成,如圖1所示,每個殘差塊包含3個卷積層、1個跳轉連接和激活函數。經過前五部分的卷積計算,輸出7×7×2 048的特征圖,然后池化層將其轉化成一個2 048維特征向量。

表1 RestNet-50結構

圖1 殘差塊網絡結構

1.3 提出方法

提出的預測框架如圖2所示。

圖2 預測框架

首先,將三因素氣象因子數值型數據轉化為三通道氣象因子圖像,即根據目標城市和鄰近城市的經緯度等相關信息生成目標城市和鄰近城市的地圖,并用歸一化后的三個基本氣象因子數值數據填充相應城市地圖的像素,生成三通道氣象因子圖,其中溫度、氣壓和相對濕度各對應t時刻圖像的一個通道。繼而運用ResNet-50模型提取三通道氣象因子圖像深度語義特征,每個圖像的特征均為2 048維。由于圖像的特征維度較高,可能對后續的預測性能帶來不好的影響。因此,用PCA技術進行降維,使用MSE評價準則選取主成分的最優個數,該個數記為n*,使用前n*個主成分得到最優的特征組合,即{X1t},{X2t},…,{Xn*t}。該組合包含了數據氣象因子的大部分信息,作為后續ARIMAX模型的Xt,PM2.5序列數據作為ARIMAX模型中的Yt。由于ARIMAX模型要求輸入的時間序列數據是平穩序列,因此在建立模型前檢驗{X1t},{X2t},…,{Xn*t},PM2.5序列的平穩性和方差齊性。若數據是平穩的,則運用最優特征組合和PM2.5數據建立ARIMAX模型實現PM2.5的高精度多步預測。若數據不平穩,則對數據進行差分變換至平穩序列再建立模型。具體地,融合深度卷積神經網絡特征的ARIMAX霧霾PM2.5濃度預測算法過程如下:

輸入:三因素氣象數據、PM2.5數據;

a)數值數據轉化為三通道圖像

b)ResNet-50提取圖像特征,特征維數為2 048

c)forn=1 to 2 048

End

e)將前n*個主成分{X1t},{X2t},…,{Xn*t}作為最佳特征組合

f)檢驗{X1t},{X2t},…,{Xn*t},PM2.5序列的平穩性

g)如果序列是平穩的,則轉到第i步,否則第h步

h)對數據進行(一次或多次)差分操作

i)檢驗方差齊性,如果序列是異方差,轉到第j步,否則轉到第k步

j)對原始數據進行數據變換,轉到第g步

k)識別模型,確定p和q

輸出:預測值。

2 實驗分析

為了驗證提出的霧霾預測框架的有效性,收集了一個數據量大小為1 826的PM2.5 濃度和氣象因子數據集,并在此數據集上將提出的預測框架與廣泛使用的ARIMA模型、三因素ARIMAX模型、多元回歸模型、ResNet-多元回歸模型、LSTM模型和SVM模型在四個常用的性能評價指標上進行了對比。

2.1 數據及其分析

主要收集了山西省11個城市(太原、大同、朔州、忻州、陽泉、呂梁、晉中、長治、晉城、臨汾、運城)2015年1月至2019年12月的空氣質量和氣象數據:(a)主要空氣污染源PM2.5濃度數據;(b)三個基本氣象因子:溫度、氣壓和相對濕度數據。然后,將三個基本氣象因子數值數據轉化為圖像數據。具體地,根據目標城市和鄰近城市的經緯度等相關信息生成目標城市和鄰近城市的地圖,并用歸一化后的三個基本氣象因子數值數據填充相應城市地圖的像素,生成1 826張的三通道氣象因子圖像,如圖3所示。

圖3 三通道氣象因子圖

基于生成的圖像,通過ResNet-50模型提取2 048維特征,繼而為了保證模型的預測精度,采用PCA降維,找到最佳的特征組合。經過實驗,如圖4所示,因子個數為34時得到了最小的RMSE,即34維特征為PCA提取的最佳特征組合。最后,基于上述34維重要深度語義特征和PM2.5序列,經過平穩性、方差齊性和白噪聲檢驗后,建立ARIMAX模型預測PM2.5濃度。例如,在大同市地區,大同市氣象和霧霾序列數據通過平穩性、方差齊性和白噪聲檢驗后,建立ARIMAX(2,1,3)模型,對大同市未來PM2.5濃度進行預測。

圖4 特征個數與RMSE變化關系

2.2 評價指標

使用幾種常用的霧霾污染預測評價指標評估預測模型性能:皮爾遜相關系數(Pearson’s Correlation Coefficient,PCC)、均方誤差(Mean Square Error,MSE)、均方根誤差(Root Mean Squared Error,RMSE)和平均絕對誤差(Mean Absolute Error,MAE),它們的表達式如下:

2.3 實驗結果

將該文提出的方法與LSTM模型、SVM(三因素)模型、多元回歸(三因素)模型、ResNet-多元回歸模型、ARIMA模型、ARIMAX(三因素)模型進行比較:

(1)LSTM模型:原始LSTM模型,直接使用PM2.5序列建立模型。

(2)SVM(三因素)模型:直接使用三個氣象因子作為PM2.5預測的影響因素,建立SVM回歸模型。

(3)多元(三因素)模型:直接使用三個氣象因子作為PM2.5預測的影響因素,建立多元回歸模型。

(4)ResNet-多元回歸模型:首先使用ResNet神經網絡提取三通道氣象因子圖深度語義特征,經過主成分分析找到最佳特征組合,繼而基于最佳特征組合建立多元回歸模型。

(5)ARIMA模型:僅使用PM2.5序列建立ARIMA模型。

(6)ARIMAX(三因素)模型:直接使用三個氣象因子作為PM2.5預測的影響因素,建立ARIMAX模型。

表2~表5給出了11個城市的平均MSE、RMSE、MAE和PCC值對于1、3、5、7天的長短期PM2.5預測的多個模型的對比結果,圖5給出了預測長度為1天時,各個城市的多個模型的MSE、RMSE、MAE和PCC對比結果。

表2 其他模型與提出框架對四種度量的1天PM2.5濃度預測比較

表3 其他模型與提出框架對四種度量的3天PM2.5濃度預測比較

表4 其他模型與提出框架對四種度量的5天PM2.5濃度預測比較

接著,鑒于單純使用ARIMA模型預測PM2.5濃度模型性能較差,該文將影響霧霾濃度的三個氣象因子加入到ARIMA模型,建立了三因素ARIMAX模型。在1、3、5、7天長短期PM2.5預測下,提出的預測框架在四個指標下始終優于三因素ARIMAX模型。在某些情況下,提出的預測框架改進達到了10%~30%。例如,如表5所列,在7天PM2.5濃度預測的情況下,所提出的預測框架分別與三因素ARIMAX模型的MSE、RMSE、MAE和PCC度量進行比較,性能提高了27.9%、16.5%、15.5%、27.2%。這是因為,霧霾的形成和發展過程是非常復雜的,而直接將三因素數據建模可能無法充分有效地模擬復雜的霧霾過程,從而導致模型性能較低。這一原因在多元回歸中也得到了驗證。例如,在四個粒度下,使用卷積神經網絡提取的特征作為自變量建立的多元回歸模型的性能均遠遠超過直接用三個氣象因素建立的多元回歸模型的性能。

表5 其他模型與提出框架對四種度量的7天PM2.5濃度預測比較

圖5 山西省11個城市的七種模型的四種評價指標比較

首先,在1、3、5、7天長短期PM2.5預測下,提出的預測框架在四個指標下始終優于ARIMA模型。例如,如表2所列,在預測時長為1天時,11個城市的平均MSE、RMSE、MAE和PCC值,ARIMA模型分別為992.043、30.978、21.486、0.632,而提出的預測框架分別為327.135、17.275、12.958、0.769,顯著優于ARIMA模型。這些結果驗證了單純使用ARIMA模型預測PM2.5濃度是遠遠不夠的,ARIMA模型無法考慮到影響霧霾濃度的因素,導致預測結果不準確。

然后,該文使用卷積神經網絡提取的特征作為自變量建立多元回歸模型,實驗結果驗證了單獨利用卷積提取圖像特征做預測是有缺陷的,這樣的預測模型只關注了數據之間深度語義特征,如空間相關性,忽略了序列相關性,而ARIMA模型更擅長捕獲序列相關性進行短期預測,進而驗證了提出的預測框架能夠同時利用序列相關性和空間相關性等信息進行建模的有效性。另外,提出的預測框架在1、3、5和7天長短期PM2.5預測和四個指標下的性能始終優于SVM模型和LSTM模型,產生了最佳的實驗結果。

最后,給出了預測長度為1時,山西省每個城市的七個預測模型的MSE、RMSE、MAE和PCC值的對比結果。如圖5所示,ARIMA模型、三因素ARIMAX模型、多元回歸模型、ResNet-多元回歸模型、LSTM模型和SVM模型在MSE、RMSE和MAE度量下的線條明顯高于提出的預測框架的線條,上述六個模型在PCC度量下的線條明顯低于提出的預測框架的線條。這進一步證實了提出的預測框架無論是11個城市的平均結果還是各個城市獨立結果上均展示了最優的性能,進一步驗證提出預測框架的有效性。

3 結束語

綜上所述,該文提出了一個融合卷積神經網絡特征的ARIMAX霧霾序列預測框架。運用ResNet-50卷積神經網絡捕獲霧霾影響因素序列中的深度語義特征,如鄰近城市的霧霾的空間相關信息,用ARIMAX模型建模捕獲霧霾的時間序列相關信息。在真實的空氣質量和氣象數據集(中國山西省)上驗證了提出的霧霾PM2.5濃度預測框架的有效性。實驗結果表明,在1、3、5、7天長短期PM2.5濃度預測中,提出的預測框架始終優于當前廣泛使用的ARIMA模型、三因素ARIMAX模型、多元回歸模型、ResNet-多元回歸模型、LSTM模型和SVM模型。

猜你喜歡
特征模型
一半模型
抓住特征巧觀察
重要模型『一線三等角』
新型冠狀病毒及其流行病學特征認識
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 亚洲欧美日韩天堂| 国产美女在线免费观看| 欧美日韩高清在线| 国产成人一区| 19国产精品麻豆免费观看| 国产自产视频一区二区三区| 国产不卡在线看| 亚洲国产日韩视频观看| 亚洲啪啪网| 四虎永久免费网站| 欧美亚洲一二三区 | 狠狠色婷婷丁香综合久久韩国| 亚洲人免费视频| 国产一区二区人大臿蕉香蕉| 99er这里只有精品| 亚洲天堂网站在线| 国产精品久久精品| 91色国产在线| 国产不卡国语在线| 国产主播在线一区| 亚洲日韩高清在线亚洲专区| 亚洲熟妇AV日韩熟妇在线| 国产成人一二三| 久久国产精品77777| 黄色污网站在线观看| 亚洲愉拍一区二区精品| 成人中文字幕在线| 亚洲激情99| 欧美不卡在线视频| 亚洲中文在线看视频一区| 欧美日韩资源| 亚洲国内精品自在自线官| 无码一区二区波多野结衣播放搜索| 97青青青国产在线播放| av大片在线无码免费| 四虎在线观看视频高清无码| 天天综合天天综合| 欧美日韩在线观看一区二区三区| 亚洲伊人天堂| 亚洲国产精品日韩欧美一区| 极品私人尤物在线精品首页| 人妻丰满熟妇啪啪| 国产免费羞羞视频| 91麻豆精品国产高清在线| h视频在线观看网站| 国产在线观看一区精品| 国产激情影院| 熟女视频91| 国产欧美日韩精品综合在线| 欧美色视频网站| 欧美日韩国产在线观看一区二区三区| 91激情视频| 伊人精品视频免费在线| 2048国产精品原创综合在线| 欧美日韩中文字幕在线| 精品久久国产综合精麻豆| 亚洲视频四区| 欧美日本一区二区三区免费| 久久久噜噜噜久久中文字幕色伊伊 | 亚洲成A人V欧美综合| 亚洲第一香蕉视频| 久久婷婷人人澡人人爱91| 久久精品中文字幕免费| 小说区 亚洲 自拍 另类| 2020精品极品国产色在线观看 | 欧美伦理一区| 凹凸精品免费精品视频| 精品1区2区3区| 重口调教一区二区视频| 又爽又大又光又色的午夜视频| 精品国产中文一级毛片在线看| 国产美女91呻吟求| 奇米影视狠狠精品7777| 国产乱论视频| 亚洲综合色在线| 亚洲黄色网站视频| 人妻丰满熟妇αv无码| 亚洲精品自拍区在线观看| 国产乱人伦精品一区二区| 国产色伊人| 日本高清有码人妻| 国产乱人伦精品一区二区|