黃偉建,李丹陽,黃 遠
(河北工程大學信息與電氣工程學院,河北邯鄲 056038)
(?通信作者電子郵箱757918272@qq.com)
由于氣候變化、工業生產和人口聚集等原因,我國多地的空氣質量狀況不容樂觀。持續惡化的空氣質量狀況已嚴重影響了中國的經濟發展和公眾的身體健康。隨著我國空氣質量監測體系的逐步完善,我國已建成多層次的空氣質量監測網絡。空氣質量指數(Air Quality Index,AQI)根據大氣環境中二氧化硫(SO2)、二氧化氮(NO2)、一氧化碳(CO)、臭氧(O3)、可吸入顆粒物(PM2.5、PM10)濃度值計算得出用于表示空氣清潔或污染程度。提高空氣質量分析和預測的科學性與準確性可以幫助政府提升對空氣質量評價、管理和決策的可靠性,及時采取有效的防控措施規避大氣污染造成的損害,保護公眾健康。
早期的空氣質量預測方法主要包括數值預測和回歸統計[1]。數值預測方法通過利用多個環境監測站的監測信息建立氣象排放和化學模型來模擬污染物的遷移、交換、擴散和排放過程[2]。該方法受復雜的先驗知識、不可靠和有限的數據以及各種使用約束[3],因此用來模擬真實的大氣環境具有一定理論難度。回歸統計方法避免了復雜的理論模型,通過使用基于統計的模型來預測空氣質量。然而影響空氣質量的各項因子與大氣污染物濃度之間復雜的線性或非線性關系很難用確定的數學模型進行描述[4]。
隨著物聯網與傳感器技術的快速發展和應用,城市中各種傳感器及相關數據采集設備采集的大氣數據為空氣質量預測提供了必要的數據來源。由于傳統的淺層學習模型在處理空氣質量這類大數據方面仍存在瓶頸,因此新的空氣質量預測方法需要數據驅動模型的支持[5]。文獻[6]利用長短期記憶(Long Short-Term Memory,LSTM)網絡來挖掘空氣質量數據中存在的深層次時間依賴特征,通過提取輸入序列中的長時間依賴關系對空氣質量進行預測。由于LSTM 網絡無法對空氣質量間復雜的空間相關性進行建模分析,因此預測精度較低。文獻[7]提出基于歷史空氣污染物濃度數據、氣象數據和時間戳數據的空氣污染物濃度預測LSTME(Long Short-Term Memory Extended)模型。該模型能夠對具有長時間依賴性的時間序列進行建模,并能自動確定最優滯后時間。然而LSTME 模型隨著預測步長的增加,其預測性能有所下降。文獻[8]提出一個通用且有效的DAL(Deep Air Learning)模型來解決細粒度空氣質量中的插值、預測和特征分析。該模型主要思想在于嵌入式特征選擇以及對深度學習網絡中不同層的半監督學習,利用未標記空氣質量數據的相關信息來提高插值和預測性能。
除了對空氣質量數據間的時間相關性進行建模外,非線性空間依賴性也是影響空氣質量預測性能的重要因素之一。由于地面環境監測站呈現非均勻分布,因此如何將空間特征處理嵌入到各種基于神經網絡的方法中一直是以往工作中的難題。一些折中的方法嘗試將卷積神經網絡(Convolutional Neural Network,CNN)應用于歐氏空間,通過人工將監測站點重新排列為二維陣列來挖掘其中的空間依賴性。如文獻[9]采用融合CNN 和LSTM 結構的ConvLSTM(Convolutional Long Short-Term Memory)模型來模擬站點測量數據間的時空關系。但該模型是基于CNN 構建的網絡,因此最適用于歐氏數據中的空間關系。為了使城市中多個環境監測站點間的空間特征處理能夠嵌入到深度學習方法中以進一步提高空氣質量預測精度,本文利用圖卷積網絡(Graph Convolutional Network,GCN)使原先只適用于處理歐氏數據的卷積操作擴展至可處理任意圖數據的特點[10],提出一種基于GCN、門控循環單元(Gated Recurrent Unit,GRU)網絡、LSTM 網絡構成的時空混合STAQI(Spatio Temporal Air Quality Index)模型用于空氣質量預測。
本文主要貢獻如下:
1)對門控循環單元網絡進行改進。通過將圖卷積網絡嵌入門控循環單元,使該網絡對輸入數據具有空間特征提取的能力。這使原本適用于處理時間序列的門控循環單元網絡可同時提取數據間時空依賴特征,同時與長短期記憶網絡結合,提出一種新型的空氣質量預測模型。
2)為防止過擬合問題的發生,通過在原有損失函數的基礎上加入L2正則化項來降低模型復雜度和不穩定性。
3)在真實的數據集中從不同角度評估STAQI模型和其他多種模型的預測性能,驗證了該模型具有最佳預測效果以及較強的泛化能力。
空氣質量監測站通過在站內安裝多參數自動傳感器來連續自動對周圍空氣質量進行監測。城市中部署的環境監測站分布于不同的地理位置空間并以一定時間間隔進行自動監測。因此監測站點產生大量具有空間坐標和時間戳的數據,這些數據被稱為時空數據[11]。
從空間維度來看,某一區域的環境污染排放會受其他空間單元環境污染排放空間溢出效應的影響[12]。地理層次較高的位置具有較粗的粒度信息,父節點粒度由其子節點粒度組成。例如,一個監測站位于某一地區,該監測數據能準確反映周圍區域細粒度空氣質量狀況。而此地區又位于某一城市,整個城市粗粒度空氣質量信息由該城市各監測站點的監測數據共同決定。此外,兩個站點間的地理距離與兩地空氣質量相關性成正比。
從時間維度來看,大氣污染物排放影響因素的變化過程往往是緩慢的,當前污染排放積累值會受到前期污染排放的影響。對監測數據中每個實例的時間戳按時間順序進行排序可生成順序屬性,其中相鄰的時間戳通常比遠處的時間戳具有更高的相似性。
綜上所述,空氣質量間的動態時空相關性可表示為兩部分:第一是各站點傳感器間相關性。從圖1 中可以看出不同傳感器時間序列之間的空間相關性是高度動態的,并隨時間不斷變化。第二是傳感器內相關性。地理感知時間序列通常遵循周期性變化模式(如圖1中站點4產生的時間序列),并隨時間與地理位置的不同而變化[13]。因此,空氣質量預測是一個典型的時空序列預測問題,時間與空間依賴關系應該被明確建模。

圖1 多站點間的動態時空相關性Fig.1 Dynamic spatio-temporal correlation between multiple sites
STAQI 模型由全局組件和局部組件構成,對目標區域污染物以及周圍鄰近區域內空氣質量動態轉化對目標站點空氣質量預測產生的影響進行分析研究。在不用人為處理數據提取特征的情況下,STAQI 模型通過反復訓練可從大量有監督數據集中自動學習空氣質量數據中動態時空依賴特征進而對目標站點進行細粒度空氣質量預測。該模型結構如圖2 所示,下面對STAQI模型實現過程進行主要介紹。

圖2 STAQI模型結構Fig.2 Structure of STAQI model
2.1.1 全局組件
城市各監測站點間的空氣質量并不是相互孤立而是存在一定相關性。通過選取北京市東四、天壇與官園站點同一時段內空氣質量數據進行對比,結果如圖3 所示,可以發現各站點空氣質量隨時間具有相似的變化趨勢。因此全局組件從時空依賴的角度分別進行建模并融合以提取鄰近站點空氣質量對預測產生的影響。

圖3 東四、天壇、官園站點空氣質量對比Fig.3 Comparison of air quality at Dongsi,Tiantan and Guanyuan sites
1)空間依賴性建模。
城市中分布的各監測站點間距并不是等同的,因此構成的拓撲網絡為圖結構,這意味著無法使用CNN 處理這類非歐氏數據以提取空間特征。GCN是一種對圖數據進行深度學習的方法[14],其核心思想是學習一個函數映射使得圖中的節點可以聚合自身節點和鄰居節點的特征來生成節點新表示。
定義1拓撲圖G。利用未加權圖G=(V,E)來描述城市各環境監測站間的地理位置拓撲結構。每個站點作為圖中的一個節點,V 代表城市中所有站點的集合,即V={V1,V2,…,VN},N 為監測站點總個數。E 代表各監測站點間邊的集合。由于大氣環境是一個實時動態變化的系統,根據地理第一定律,各站點間存在不同程度的影響關系。因此利用式(1)來計算兩兩站點間的距離并取其倒數作為連邊權重值存儲在鄰接矩陣A中,A ∈RN×N。

其中:X(a,b)、Y(c,d)代表兩個站點位置,a、c為緯度,b、d為經度,r為地球半徑。
定義2特征矩陣XN×P。將目標站點所在城市各環境監測站歷史AQI 值作為網中節點的屬性特征,表示為X ∈RN×P。P 代表節點屬性的數量特征,即歷史時間序列長度。Xt∈RN×i表示i時刻城市所有環境監測站的AQI 當前值。
GCN通過利用目標站點所在城市各環境監測站地理位置拓撲結構G 和特征矩陣X 的信息學習復雜映射函數以提取空間特征,主要步驟如下:
①根據目標站點所在城市各環境監測站地理位置構建拓撲圖G和鄰接矩陣A。
②利用各站點監測數據的AQI信息構建特征矩陣X。

④利用式(2)提取特征矩陣中的空間信息:其中:σ(?)表示激活函數表示第i 層權值矩陣表示第i層的激活值,且
2)時間依賴性建模。
循環神經網絡(Recurrent Neural Network,RNN)是一個可用于處理時間序列的網絡[15]。然而,在實際的運用中會存在梯度消失、梯度爆炸等問題[16],因此傳統的RNN 在時序預測方面存在一定的局限性。GRU 是RNN 的一種變體結構,該網絡具有結構相對簡單、參數較少、訓練能力較快等優勢。因此在全局組件中利用GRU 網絡提取鄰近站點空氣質量數據間的時間依賴特征。
全局組件原理如圖4 所示。首先根據目標站點所在城市各環境監測站地理位置信息構成拓撲圖,根據拓撲圖計算生成相應的鄰接矩陣、度矩陣和拉普拉斯矩陣。利用GCN 根據拉普拉斯矩陣來動態捕獲各環境監測站的不同影響權重,獲得空間特征。其次將提取空間特征后的時間序列作為GRU的輸入,通過單元之間的信息傳遞獲取時間特征。由于GRU整體輸出為最后一個單元時刻的隱藏狀態,它的維度不同于標簽向量,因此最后通過全連接層做維度轉換。圖5 左側顯示了全局組件預測過程,其中每一個循環單元結構簡稱為GG(GCN GRU),右側顯示了GG 單元細胞具體結構,ht-1表示t -1時刻的輸出,GCN 是圖卷積操作,輸入數據xt經過GCN 生成xt',ut、rt分別是t 時刻的更新門和重置門,ct為t 時刻細胞狀態,ht表示t時刻的輸出。

全局組件計算過程如下所示:其中:f(A,Xt)表示圖卷積過程,W和b代表訓練過程中的權重和偏置。

圖4 全局組件原理Fig.4 Principle of global component

圖5 全局組件預測過程Fig.5 Prediction process of global component
2.1.2 局部組件
一方面,當前空氣質量狀況會受到過去一段時間內污染物累積的影響;另一方面,站點監測到的空氣質量數據是一組具有一定周期性的序列。比如一個工廠周期性地排放污染氣體,那么附近站點的空氣質量可能會隨著時間的推移而重復。因此空氣質量在時間維度上既具有短期性質,也具有長期性質。
LSTM 在傳統RNN 基礎上通過在隱藏層各神經單元中增加記憶單元從而使時間序列上的記憶信息可控[17]。LSTM 單元細胞由遺忘門ft、輸入門it和輸出門ot構成[18],各部分更新公式如下所示:

其中:°表示按元素乘,W 和b代表訓練過程中的權重和偏置,ht、ct分別表示t時刻的隱藏狀態和細胞狀態。
局部組件以目標站點過去n 個時間步長的本地污染物濃度與目標站點AQI值作為輸入,通過LSTM網絡提取輸入數據中的時間相關特性,最后將LSTM 的輸出經過全連接層轉換成與標簽向量一致的維度,從而得到局部組件的輸出。局部組件的訓練算法主要包含以下3個步驟:
1)前向計算LSTM 每個神經元的輸出值,即分別根據式(7)~式(12)計算ft、it、ct、ot、ht向量值。每個時刻的隱藏狀態ht接入輸出層,經過Softmax 函數后取得預測值,進而得到殘差E:

2)反向計算每個神經元的誤差項δ 值。誤差項的反向傳播包括兩個方面:一個是沿時間軸的反向傳播,即根據t 時刻的誤差項δt來計算t -1 時刻的誤差項δt-1。其中δt定義為則t -1時刻的誤差項δt-1為:

另一個是將誤差向上一層傳播。即假設當前為第l 層來計算l -1層的誤差項。
3)根據相應的誤差項來計算各權重矩陣和偏置向量的梯度(共計12個),從而更新各參數。
2.1.3 組件融合
STAQI 模型采用加權融合的方式來聯合局部組件輸出ov與全局組件輸出oc以形成目標站點AQI預測值Y,其計算過程如下所示:

其中α 為組合權值(0 ≤α ≤1)。在實驗部分,將對組件分配不同權重從而進行預測性能對比并根據實驗結果選取α最佳取值。
模型訓練過程以最小化損失函數為目標,使模型更精確地擬合訓練數據。但若模型參數w 太多,會導致模型復雜度大大提高,模型在訓練集上具有出色的擬合效果,但在測試集上性能欠佳。因此本文在原有的損失函數L0(w)基礎上加入L2 正則化項來對權重系數加以約束限制,使得模型盡量簡單,整體的損失函數L(w)可表示為:

對L(w)進行求導:

對參數w更新如下所示:

由此可以看出當w 趨于0 時,加入L2 正則化項可以使得參數減小到很小范圍內,從而降低模型復雜度。綜上所述,STAQI 模型中使用的損失函數如式(19)所示,其中用Yt和來表示目標站點實際AQI值和預測AQI值。損失函數中第一項用于最小化站點實際AQI值與預測AQI值之間的誤差。第二項Lreg是L2正則化項,有助于避免過擬合問題,λ為超參數。

輸入 測試數據;
輸出 預測值。
1)初始化模型多組超參數值。
2)加載鄰接矩陣A和數據集。
3)使用Min-Max方法將數據歸一化到[-1,1]。
4)根據不同時間窗口,利用滑動窗口機制構建有監督數據集和測試集。
5)根據批尺寸大小計算訓練總批次。
6)搭建全局組件。首先實現GG 單元細胞結構,通過繼承RNNCell類改寫_init_和_call_方法來實現。_init_方法中需要指定激活函數、節點數量、隱藏單元數量并獲取根據鄰接矩陣計算得到的拉普拉斯矩陣。_call_方法中對輸入數據進行變化,通過提取拉普拉斯矩陣中目標站點所在列與原始輸入數據相乘,利用提取空間特征后的輸入數據新表示來計算GRU 單元細胞狀態。調用自定義GG 細胞類,利用最后單元狀態輸出值通過全連接層轉化成與標簽向量相同的維度。
7)搭建局部組件。設置LSTM 節點數量和隱藏單元數量,利用LSTM 網絡最后單元輸出值作為全連接層的輸入,作維度轉化。
8)融合全局組件與局部組件輸出。
9)定義損失函數和均方根誤差。
10)使用Adam優化器以最小化損失值為目標。
11)定義以訓練總批次為循環次數的循環體,在循環體中首先實現對訓練集中輸入數據的劃分,即劃分為全局組件與局部組件輸入。其次調用已定義的全局和局部組件。最后將當前批次局部組件輸入、全局組件輸入、標簽數據作為填充數據來動態執行優化器、損失函數值以及預測值的計算。
12)對訓練好的模型輸入測試數據進行測試,獲得模型輸出值。
13)將模型輸出值進行反歸一化處理,得到模型實際預測值并輸出。
本文選取北京地區35個環境監測站從2014年4月1日至2019 年12 月31 日的歷史監測信息作為實驗數據集。數據從http://beijingair.sinaapp.com 網站中獲得。空氣質量監測數據為小時粒度信息,包括SO2、NO2、CO、O3、PM2.5、PM10六種大氣污染物濃度值和AQI 值。通過在Pycharm 開發環境中安裝配置Tensorflow框架并使用Python編程語言來完成有關實驗。
收集的數據必須經過預處理才可作為STAQI 模型的輸入,主要由于以下兩方面原因:第一,外界多種不確定性因素的干擾導致收集的數據中存在某些時間序列或屬性值缺失,因此需要遍歷整個數據集對缺失的時間序列進行插入并利用空值填充方法填充其他特征數據項。第二,空氣質量受多重因素影響,各影響因子量綱不同。為保證模型預測性能,本文采用Min-Max 方法將數據歸一化到[-1,1],最終在評價模型的預測效果時,再將預測值重新還原到原來的大小并與真實值進行比較。整個數據集按照8∶2比例劃分為訓練集和測試集用于模型訓練及測試。訓練集中的每條數據由同一時刻目標站點6 種污染物濃度值和目標站點所在城市各環境監測站點AQI值組成。
3.2.1 實驗流程
本實驗首先需要收集相關實驗數據,對收集的數據進行預處理使數據變得完整以符合模型的輸入要求。其次將整個數據集劃分為訓練集與測試集。利用訓練集中的數據,使用滑動窗口機制來建立模型輸入和輸出結果之間的關系從而構成有監督數據集。每條有監督數據集由特征窗口和標簽窗口構成。通過將大量有監督數據集作為模型輸入并在一定迭代次數內不斷訓練調整模型參數,使得模型可以學習特征和標簽之間復雜的非線性關系。最后使用測試集對訓練好的模型性能進行測試,在面對只有特征沒有標簽的數據時,訓練好的STAQI模型可以推斷出與之對應的標簽進而完成空氣質量預測任務。STAQI模型的整個實驗流程如圖6所示。

圖6 STAQI模型實驗流程Fig.6 Experimental flowchart of STAQI model
3.2.2 評價指標
為了評估STAQI 模型訓練后的預測性能,本文使用均方根誤差(Root Mean Square Error,RMSE)來評估站點空氣質量真實值與預測值之間的差異,RMSE 數值越低表示模型的預測精度越高,其計算公式如下所示:

3.2.3 模型超參數設置
模型超參數的不同取值對模型預測性能將產生一定影響,主要包括迭代次數、網絡深度、學習率、輸入層的向量大小、隱藏層單元數量、批尺寸等超參數[19]。本實驗采用Adam優化器,手動設置學習率為0.001,批尺寸為64,迭代次數為300。為了最小化隱藏單元數量的不同取值對STAQI 模型預測性能產生的客觀影響,將從[8,16,32,64,100,128]中選擇不同的隱藏單元數量進行實驗,結果如表1所示。在固定α取值為0.5時,當增加隱藏單元數量時,RMSE值先降低后增加。這主要是因為當隱藏單元數量大于一定閾值時,模型復雜度和計算難度大大增加,從而增加了預測誤差。當隱藏單元數量為64 時,RMSE 誤差值最小,因此在實驗中將LSTM 模型與GRU模型中的隱藏單元數量設置為64。

表1 隱藏單元數量對RMSE的影響Tab.1 Influence of number of hidden cells on RMSE
此外,由于STAQI 模型輸出是一個局部組件和全局組件的加權參數值α(0 ≤α ≤1)。為設置α 的最佳取值,本文在0.0 和1.0 之間改變α 大小來比較模型RMSE 值,實驗結果如表2 所示,選取RMSE 最低值對應的0.6 作為本實驗中α 的取值。通過對α參數尋優的結果可以發現局部組件具有更大的權重,這意味著本地污染物濃度對目標站點空氣質量預測產生的影響要高于鄰近站點空氣質量對目標站點空氣質量預測產生的影響。

表2 α取值對RMSE的影響Tab.2 Effect of α value on RMSE
3.3.1 基準模型比較
本節從不同時間窗口和預測不同目標站點兩個方面將STAQI 模型與自回歸綜合移動平均模型(Auto Regressive Integrated Moving Average model,ARIMA)、支持向量回歸(Support Vector Regression,SVR)[20]、反 向 傳 播(Back Propagation,BP)神經網絡[21]、GRU 進行對比。其中SVR 使用線性核函數,懲罰項為0.001。
1)基于不同時間窗口的空氣質量預測。
利用時間窗口描述模型使用過去N小時的歷史數據來預測未來T小時后的目標站點空氣質量,簡記為(N,T)。通過使用不同基準模型對北京市東四監測站點進行預測,實驗結果如表3 所示。從表3 可以得到以下四方面結論:第一,GRU 模型強調了時間特征建模的重要性,通常比其他基線模型(如ARIMA、SVR、BP 模型)具有更高的預測精度。第二,基于時空特性的STAQI 模型與只考慮時間特征的GRU 模型相比能獲得更好的預測效果。第三,對于包含時序處理模塊的模型(如GRU、STAQI 模型)來說,在相同預測步長的情況下,模型輸入的歷史數據越多,可進一步提高其預測能力。第四,無論時間窗口如何變化,STAQI 模型都可以通過訓練獲得最佳預測性能,相較于基線模型中性能較優的GRU 模型,STAQI 模型RMSE 值大約下降19%。因此STAQI 模型不僅可以用于短期預測,還適用于中長期預測。

表3 不同時間窗口的預測結果Tab.3 Prediction results of different time windows
2)基于不同目標站點的空氣質量預測。
為檢驗STAQI模型對不同目標站點的預測能力是否具有顯著差異,本文使用不同基線模型對北京市天壇站點未來一定時間步長的AQI進行預測,實驗結果如表4所示。從表4可以發現STAQI模型相比其他基線模型對于任意AQI預測步長仍能取得最佳預測性能。其中與性能較優的GRU 模型相比,STAQI 模型RMSE 值大約下降6%,因此STAQI 模型對地理位置不同、具有地勢差異的不同站點的空氣質量預測能力具有較強的泛化性。

表4 不同模型對天壇站點AQI預測的RMSE值Tab.4 RMSE values predicted by different models for AQI of Tiantan site
此外,對于北京市35 個環境監測站點,本文使用不同基準模型對各環境站點未來一定時間步長的空氣質量進行預測并統計各模型最優預測站點數量,實驗結果如表5 所示。從表5 可以看出在對未來1 h 的短期預測中各模型的最優預測站點數量大致相同,但隨著預測窗口逐漸增大,ARIMA、SVR、BP 模型對空氣質量這類時空數據預測能力越來越低。由于GRU 模型是一種專門用于處理時間序列的網絡,隨著預測步長增加,其最優站點統計數量要高于ARIMA、SVR 和BP 模型,但低于STAQI 模型。基于時空混合的STAQI 模型隨預測步長的增加相比其他基線模型顯示出明顯的預測優勢。

表5 不同模型最優預測站點數統計Tab.5 Statistics on the number of optimal prediction sites by different model
3.3.2 變體模型比較
為了檢驗STAQI模型中各個組件對模型預測性能的有效性,本文將STAQI模型與由GCN 和GRU 構成的全局組件模型(LOCAL)和由LSTM 構成的局部組件模型(GLOBAL)進行比較,實驗結果如表6所示。從表6可以看出對于不同預測步長STAQI 模型的RMSE 都取得最低值。相較于變體模型中性能較優的局部組件模型,STAQI 模型RMSE 值大約下降16%。這是由于局部組件模型只考慮了空氣質量數據中的時間特性,忽略了空間相關性。而全局組件模型把對目標站點的空氣質量預測完全依賴于鄰居節點的空氣質量狀況,忽略了本地污染物濃度對目標站點空氣質量預測的影響。STAQI模型將時間與空間、局部與全局因素進行結合,使得該模型可以更好地擬合空氣質量變化趨勢,提高預測精度。

表6 變體模型預測的RMSE值比較Tab.6 Comparison of RMSE values predicted by variant models
此外本文對北京市35 個環境監測站點未來6 h 的空氣質量使用變體模型和STAQI 模型分別進行預測,各模型的RMSE 值如圖7 所示。從圖7 可以發現對于任一站點STAQI模型的RMSE 都取得最低值,因此融合了全局組件和局部組件的STAQI模型可以提高對空氣質量的預測能力。

圖7 變體模型對北京市35個站點的預測結果比較Fig.7 Comparison of prediction results of variant models for 35 sites in Beijing
3.3.3 模型預測及改進分析
為了直觀顯示STAQI 模型在真實數據集中的預測效果,本文使用STAQI 模型對東四站點進行預測,實驗結果如圖8所示。從圖8 可以看出STAQI 模型通過提取空氣質量中存在的時空特征可以很好地擬合空氣質量變化趨勢;但是STAQI模型在拐點處的預測誤差要大于對平穩序列預測的誤差,這是由于受極端天氣條件如暴風、暴雨等影響,導致空氣質量在極短的時間內發生突變。因此在未來工作中,可以在模型中融合氣象因素以提高模型在空氣質量拐點處的預測能力。

圖8 STAQI模型對東四站點的預測結果Fig.8 Predicted results of STAQI model for Dongsi site
針對空氣質量間存在的復雜時空特征,本文提出一種面向空氣質量的新型STAQI 時空混合預測模型,它由全局組件和局部組件構成。該模型對地面多個環境監測站之間的時空依賴性進行明確建模,可以自動學習多變量空氣質量相關時間序列數據局部趨勢的相關特征和時空依賴模式。與傳統僅考慮時間相關性的方法相比,STAQI 模型在保留原有監測站點位置分布的基礎上將空間特征處理嵌入深度學習方法中以同時提取城市中多站點間的復雜時空相關性。通過在真實的數據集上進行評估,并與不同基準模型和變體模型在不同預測水平下進行比較,結果表明STAQI 模型對空氣質量預測具有更精準的預測效果。
為了進一步提高模型預測性能,未來研究工作中將以以下兩方面作為研究重點。首先,空氣質量受多種復雜因素影響,僅僅利用污染數據和空氣質量數據作為影響因素具有一定片面性,因此可以在模型中融合氣象因素、交通流量等其他影響因子對問題進行建模。其次,可在LSTM 網絡中引入注意力機制,使得該網絡對不同時期的歷史數據可分配不同權重的注意力,從而獲得更精準的預測。