基于敏感參數(shù)發(fā)現(xiàn)的區(qū)域重點污染物濃度預(yù)測①

2022-01-06 06:05:26潘欣玉

計算機系統(tǒng)應(yīng)用 2021年10期

潘欣玉,鄭亮

（中國石油大學(xué)（華東）計算機科學(xué)與技術(shù)學(xué)院,青島 266580）

近年來,空氣質(zhì)量成為人們越來越關(guān)心的問題,大氣污染物濃度預(yù)測對于預(yù)防地區(qū)污染具有重要的意義.區(qū)域內(nèi)的污染物濃度預(yù)測,可以對區(qū)域空氣質(zhì)量的微變化及時做出響應(yīng).污染物的預(yù)警對于區(qū)域可持續(xù)發(fā)展具有十分重要的作用,可為政府決策制定、環(huán)境監(jiān)管[1-3]執(zhí)行提供技術(shù)支持,因此研究污染物預(yù)測工作具有重要意義.

現(xiàn)階段對于污染物預(yù)測的研究包含數(shù)值模擬及統(tǒng)計計算兩部分.數(shù)值模擬[4,5]方法充分研究污染物在大氣中的遷移變化,預(yù)測的精確度較高.但在預(yù)測過程中需要收集復(fù)雜的物化數(shù)據(jù),計算過程冗雜,且需應(yīng)用氣象、物化等多學(xué)科知識,預(yù)測工作較為繁瑣; 統(tǒng)計計算為污染物預(yù)測工作提供了廣泛思路,可應(yīng)用各種神經(jīng)網(wǎng)絡(luò)模型進行污染物預(yù)測工作[6,7],通過對神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建及統(tǒng)計計算可以實現(xiàn)簡易精確的預(yù)測.然而當(dāng)前神經(jīng)網(wǎng)絡(luò)預(yù)測模型多為前饋型神經(jīng)網(wǎng)絡(luò),其輸出結(jié)果僅與當(dāng)前輸入有關(guān),無法研究污染物數(shù)據(jù)前后依賴關(guān)系,因而需構(gòu)建一種可以對前后依賴序列數(shù)據(jù)進行預(yù)測的模型.且由于多種污染物具有相同排放源,所以多個污染物間往往存在潛在關(guān)聯(lián)關(guān)系,使得一種污染物濃度的變化可反映出其他污染物濃度變化情況,以往預(yù)測方法中,無論數(shù)值模擬還是統(tǒng)計計算均未考慮應(yīng)用污染物間關(guān)聯(lián)關(guān)系進行預(yù)測工作.

針對上述兩個問題,本文充分考慮LSTM神經(jīng)網(wǎng)絡(luò)在處理時間序列數(shù)據(jù)前后依賴關(guān)系的優(yōu)勢,應(yīng)用待預(yù)測污染物及其敏感參數(shù)之間的關(guān)聯(lián)關(guān)系,實現(xiàn)區(qū)域污染物的濃度預(yù)測工作.本文將關(guān)聯(lián)規(guī)則算法[8,9]與多元回歸分析[10,11]結(jié)合應(yīng)用,發(fā)現(xiàn)待預(yù)測污染物的敏感參數(shù),在此基礎(chǔ)上構(gòu)建LSTM模型,將待預(yù)測污染物及其敏感參數(shù),全部作為LSTM預(yù)測模型的輸入變量,從而更加準(zhǔn)確的實現(xiàn)對各種重點污染物濃度的預(yù)測.

1 相關(guān)工作

當(dāng)前污染物濃度分析預(yù)測方法主要有機理類與非機理類兩個方向.機理類方法中數(shù)值模擬[1,2]涉及復(fù)雜物化流程,需要建立完整的污染物擴散過程相關(guān)物化模型[12],將污染物的排放、擴散、遷移、轉(zhuǎn)化過程使用復(fù)雜的偏微分方程來解析,通過展示模式得到空氣污染物濃度的空間分布及變化趨勢.

非機理類方法對污染物排放的復(fù)雜機理過程不做過多要求,主要是基于歷史數(shù)據(jù)應(yīng)用統(tǒng)計學(xué)方法構(gòu)建神經(jīng)網(wǎng)絡(luò)預(yù)測模型[3,4].孫寶磊等[13,14]建立BP預(yù)測模型對污染物的日均濃度進行預(yù)測,通過對模擬輸出值和期望輸出值誤差的迭代計算調(diào)整,使BP神經(jīng)網(wǎng)絡(luò)預(yù)測輸出不斷逼近期望輸出,直至誤差滿足要求.方彥[15]構(gòu)建RBF神經(jīng)網(wǎng)絡(luò)模型,基于歷史數(shù)據(jù)作為訓(xùn)練樣本構(gòu)建模型并以同期數(shù)據(jù)作為測試樣本,并選取2018年同期數(shù)據(jù)作為測試樣本對區(qū)域污染物進行預(yù)測.郭曉君等[16,17]基于GM（1,1）模型、Verhulst模型和SCGM（1,1）模型建立組合灰色預(yù)測模型,運用預(yù)測有效度方法確定組合預(yù)測模型的權(quán)重系數(shù),利用模型預(yù)測污染物排放量,通過灰色系統(tǒng)GM（1,1）殘差修正模型對大氣污染物濃度進行預(yù)測.支持向量機在大氣污染物濃度預(yù)測方面也有應(yīng)用[18-21],在對各類影響因子進行分析的基礎(chǔ)上進行建模預(yù)測,利用PCA方法對輸入因子降維形成支持向量機的訓(xùn)練樣本集,建立大氣污染預(yù)模型.Haewon等通過構(gòu)建聚類回歸模型[22-24]進行污染物濃度預(yù)測,根據(jù)氣象要素與污染物濃度數(shù)據(jù)資料,分析天氣變化規(guī)律,挖掘若干種天氣類型,并分析各種天氣類型的典型參數(shù),將這些參數(shù)與相應(yīng)的環(huán)境質(zhì)量實測數(shù)據(jù)通過回歸分析[25-27]建立定量關(guān)系,根據(jù)定量關(guān)系進行污染物濃度預(yù)測.杜續(xù)等[28]針對神經(jīng)網(wǎng)絡(luò)算法在當(dāng)前污染物濃度預(yù)測領(lǐng)域存在的易過擬合、網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜、學(xué)習(xí)效率低等問題,引入隨機森林回歸算法,分析氣象條件、大氣污染物濃度和季節(jié)所包含的多項特征因素,通過調(diào)整參數(shù)的最優(yōu)組合,設(shè)計出一種新的污染物濃度預(yù)測模型—RFRP模型.馬天成等[29]采用一種改進型PSO優(yōu)化的模糊神經(jīng)網(wǎng)絡(luò),將粒子群算法與模糊神經(jīng)網(wǎng)絡(luò)進行融合,發(fā)揮PSO算法全局尋優(yōu)的特點,預(yù)測污染物濃度的變化規(guī)律.

在污染物預(yù)測領(lǐng)域,機理類方法預(yù)測過程較為復(fù)雜,需要綜合污染物遷移過程中各種物化因素,因此機理類方法通用性較低.在以往非機理類模型中,前饋型神經(jīng)網(wǎng)絡(luò)未考慮時間序列依賴關(guān)系.以上兩種方法均未考慮污染物間關(guān)聯(lián)關(guān)系的影響,準(zhǔn)確性有待提高.因此,本文充分考慮污染物間的具有關(guān)聯(lián)關(guān)系的特點,以此為基礎(chǔ)建立基于敏感參數(shù)發(fā)現(xiàn)的LSTM預(yù)測模型[30-33]的污染物預(yù)測模型,應(yīng)用待預(yù)測污染物及其敏感參數(shù)的關(guān)聯(lián)關(guān)系來提高模型的預(yù)測精確度.

2 區(qū)域重點污染物濃度預(yù)測方法

在現(xiàn)實情況中,由于污染源并非排放單一類型的污染物,多種污染物具有相同排放源,污染物間往往存在潛在關(guān)系,一種污染物的變化可能反映另一種污染物變化,所以在污染物濃度預(yù)測工作中可應(yīng)用污染物間的關(guān)系進行預(yù)測,即需考慮待預(yù)測污染物敏感參數(shù)這一影響因素.基于上述問題,本文將污染物預(yù)測工作分為兩階段進行.

（1）基于關(guān)聯(lián)規(guī)則與多元回歸分析的敏感參數(shù)發(fā)現(xiàn)方法.在該方法中,首先應(yīng)用關(guān)聯(lián)規(guī)則算法對污染物數(shù)據(jù)集進行關(guān)聯(lián)關(guān)系發(fā)現(xiàn),初步挖掘出各污染物的敏感參數(shù).再應(yīng)用多元回歸分析實現(xiàn)各污染物間相關(guān)性分析,將各污染物的相關(guān)性分析結(jié)果與關(guān)聯(lián)性分析結(jié)果取交集,保留二者共同部分,保證敏感參數(shù)發(fā)現(xiàn)的完備性與準(zhǔn)確性,并通過對比試驗驗證了敏感參數(shù)的有效性.最終實現(xiàn)各污染物敏感參數(shù)的發(fā)現(xiàn),為后續(xù)污染物預(yù)測工作的開展奠定基礎(chǔ).

（2）基于敏感參數(shù)發(fā)現(xiàn)的污染物預(yù)測方法.由于污染物數(shù)據(jù)存在時間序列上的前后依賴關(guān)系,將待預(yù)測污染物及其敏感參數(shù)作為預(yù)測模型特征變量,實現(xiàn)污染物濃度預(yù)測工作.在該部分工作中,通過對現(xiàn)有的LSTM預(yù)測模型的改進完成污染物濃度預(yù)測工作.

2.1 基于關(guān)聯(lián)規(guī)則的重點污染物關(guān)系發(fā)現(xiàn)

本文采用關(guān)聯(lián)規(guī)則算法進行污染物間關(guān)聯(lián)性關(guān)系發(fā)現(xiàn).針對污染物參數(shù)數(shù)據(jù),首先對污染物參數(shù)值分區(qū)間處理,依據(jù)污染物數(shù)值最小值及最大值對參數(shù)數(shù)據(jù)三等分.例如SO2用S表示,分為S1、S2、S3.S1表示SO2濃度很小,S2表示SO2濃度中等,S3表示SO2濃度大.O3用O表示,NO2用N表示,CO用C表示,PM2.5用P表示,PM10用M表示.其中,參數(shù)程度詞的等級越高代表的值越大.

（1）首先基于式（1）計算每個參數(shù)程度詞集的支持度.

（2）不斷迭代使用上一次得到的（k-1）項頻繁項集,計算頻繁項集中參數(shù)程度詞的支持度,保留滿足支持度閾值ST的參數(shù)程度集,產(chǎn)生新的候選k項頻繁項集Lk,直到?jīng)]有新的頻繁項集產(chǎn)生.

（3）獲取k項頻繁項集Lk的關(guān)聯(lián)規(guī)則Ls→Lk?s,其中,Ls表示由s個參數(shù)程度詞組成的程度詞集,Lk?s表示去掉Lk中s個參數(shù)程度詞剩余的程度詞組成的程度詞集.

（4）計算每個候選關(guān)聯(lián)規(guī)則的置信度,置信度的計算公式如式（2）.

（5）設(shè)置一個置信度閾值CT,當(dāng)一個項集內(nèi)所有子集之間的置信度都滿足置信度閾值CT時,則認(rèn)為該項集內(nèi)的所有程度詞之間具有較強的關(guān)聯(lián)性,并留下這樣的項集,保留到關(guān)聯(lián)規(guī)則集中.

2.2 基于多元回歸分析的污染物相關(guān)性分析

針對污染物指標(biāo)數(shù)據(jù),應(yīng)用回歸分析中的相關(guān)系數(shù)法獲取各個污染物指標(biāo)之間的相關(guān)系數(shù),發(fā)現(xiàn)各個污染物指標(biāo)之間的相關(guān)性程度,綜合污染物間關(guān)聯(lián)規(guī)則進一步發(fā)現(xiàn)污染物間關(guān)系.

回歸分析使用相關(guān)系數(shù)來度量污染物指標(biāo)之間線性相關(guān)關(guān)系.其定義如式（3）所示.

求得兩污染物指標(biāo)相關(guān)系數(shù)后,應(yīng)用T檢驗判斷自變量X中影響因子對因變量Y的影響顯著性程度,T統(tǒng)計量計算公式如下:

根據(jù)t檢驗表,查得顯著水平α的臨界值tα.若t>tα,則拒絕原假設(shè),說明兩指標(biāo)間具有較強相關(guān)性; 否則,說明兩指標(biāo)間相關(guān)性不強.

2.3 基于LSTM的重點污染物預(yù)測模型

本文在進行污染物預(yù)測研究時充分考慮污染物敏感參數(shù)及時間序列關(guān)系,通過對LSTM預(yù)測模型進行改進,實現(xiàn)污染物預(yù)測工作.本文預(yù)測工作的改進主要有以下兩點:

（1）模型預(yù)測參數(shù)及輸入特征的選擇.在模型構(gòu)建之前引入?yún)?shù)choose_target來進行待預(yù)測污染物的選擇,choose_target取值為0-5,分別代表SO2、NO2、PM10、PM2.5、O3、CO六種污染物,選擇不同參數(shù)值即對不同污染物預(yù)測,例如choose_target=3則代表此時的待預(yù)測污染物為PM2.5.設(shè)置參數(shù)needed_target來進行待預(yù)測污染物輸入特征的選擇,needed_target取值同樣為0-5.例如needed_target=[0,1,2]則代表此時預(yù)測模型輸入特征為SO2、NO2、PM10.

（2）本模型在預(yù)測過程中采用了滾動預(yù)測的方式.采用“早停止”策略判斷模型收斂性,首先將污染物輸入特征數(shù)據(jù)輸入到模型進行濃度預(yù)測,得出未來一天的污染濃度數(shù)據(jù)并記錄; 然后將實際輸出結(jié)果加入下一條樣本的污染物濃度特征中,與其他敏感參數(shù)特征共同作為訓(xùn)練樣本再次預(yù)測未來一天的污染濃度數(shù)據(jù),依次類推,得到預(yù)測結(jié)果.

基于LSTM重點污染物預(yù)測模型框架如圖1所示.

圖1 基于LSTM主要污染物預(yù)測模型框架

本文使用Keras深度框架構(gòu)建LSTM模型.預(yù)測模型的構(gòu)建流程包括以下4個步驟.

（1）構(gòu)建模型

本預(yù)測模型包含一個LSTM神經(jīng)網(wǎng)絡(luò)層和一個全連接層,兩層之間順序連接.首先設(shè)置LSTM神經(jīng)網(wǎng)絡(luò)層:一種污染物具有n個敏感參數(shù),則訓(xùn)練集特征數(shù)為n+1,因此模型的輸入層特征維度設(shè)置為n+1,并設(shè)置時間步長及循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)內(nèi)部Sigmoid層和tanh層的神經(jīng)元數(shù)量,最后設(shè)置預(yù)測模型輸出層,用于輸出污染物預(yù)測結(jié)果.

（2）模型參數(shù)設(shè)置

本模型采用均方誤差作為模型的損失函數(shù),采用Adam優(yōu)化算法作為模型優(yōu)化器,在模型訓(xùn)練過程中設(shè)置每次迭代訓(xùn)練的樣本數(shù)據(jù)量、訓(xùn)練輪數(shù)、模型學(xué)習(xí)率.

（3）模型預(yù)測過程

模型采用滾動預(yù)測的方式,首先將污染物輸入特征數(shù)據(jù)輸入到模型進行濃度預(yù)測,得出未來一天的污染濃度數(shù)據(jù)并記錄; 然后將實際輸出結(jié)果加入下一條樣本的污染物濃度特征中,與其他敏感參數(shù)特征共同作為訓(xùn)練樣本再次預(yù)測未來一天的污染濃度數(shù)據(jù),依次類推,得到預(yù)測結(jié)果.

（4）模型評價

用式（5）計算各污染物指標(biāo)預(yù)測數(shù)據(jù)與真實數(shù)據(jù)間均方根誤差RMS E.

其中,xi為第i個數(shù)據(jù)點污染物指標(biāo)濃度的實測值,為第i個數(shù)據(jù)點污染物指標(biāo)濃度的預(yù)測值,n為數(shù)據(jù)長度.

2.4 基于敏感參數(shù)發(fā)現(xiàn)的污染物濃度預(yù)測方法描述

（1）對原始環(huán)保監(jiān)測數(shù)據(jù)進行數(shù)據(jù)清洗、去除無用數(shù)據(jù)、數(shù)據(jù)標(biāo)準(zhǔn)化等操作得到預(yù)處理后的數(shù)據(jù)集.

（2）掃描預(yù)處理后環(huán)保監(jiān)測數(shù)據(jù)集,得到滿足支持度閾值ST的k項頻繁項集,基于k項頻繁項集組合得到候選關(guān)聯(lián)規(guī)則集,將所有滿足置信度閾值CT的污染物間關(guān)聯(lián)規(guī)則加入關(guān)聯(lián)規(guī)則集.

（3）再次掃描環(huán)保監(jiān)測數(shù)據(jù)集,得到污染物兩兩之間的相關(guān)系數(shù),保留相關(guān)系數(shù)大于0.5的污染物關(guān)系,將各污染物的相關(guān)性分析結(jié)果與關(guān)聯(lián)性分析結(jié)果取交集,保留二者共同部分,實現(xiàn)污染物的敏感參數(shù)發(fā)現(xiàn)工作.

（4）綜合（2）（3）所發(fā)現(xiàn)的各污染物的敏感參數(shù),以與待預(yù)測污染物及其敏感參數(shù)作為預(yù)測模型輸入變量,實現(xiàn)對污染物的濃度預(yù)測.

3 實驗結(jié)果與分析

3.1 實驗數(shù)據(jù)

本實驗使用區(qū)域內(nèi)8個環(huán)保監(jiān)測點所得的環(huán)保監(jiān)測數(shù)據(jù),實驗數(shù)據(jù)共有209 340條數(shù)據(jù).

3.2 數(shù)據(jù)預(yù)處理

本實驗數(shù)據(jù)預(yù)處理操作包含數(shù)據(jù)清洗及數(shù)據(jù)標(biāo)準(zhǔn)化.首先對數(shù)據(jù)進行數(shù)據(jù)清洗,去除異常數(shù)據(jù)點及空白數(shù)據(jù)、重復(fù)數(shù)據(jù).其次,進行數(shù)據(jù)標(biāo)準(zhǔn)化操作,針對清洗后數(shù)據(jù)采用式（6）進行標(biāo)準(zhǔn)化操作.

其中,x為數(shù)據(jù)清洗后的環(huán)保監(jiān)測數(shù)據(jù),μ為所有樣本數(shù)據(jù)的均值,σ為所有樣本數(shù)據(jù)的標(biāo)準(zhǔn)差.

3.3 重點污染物關(guān)系發(fā)現(xiàn)

3.3.1 污染物間關(guān)聯(lián)分析

設(shè)置支持度5%,置信度60%,通過污染物指標(biāo)間關(guān)聯(lián)規(guī)則挖掘,得到污染物指標(biāo)間的關(guān)聯(lián)規(guī)則集,可初步挖掘出污染物間的關(guān)聯(lián)關(guān)系,結(jié)果如表1所示.

3.3.2 污染物間相關(guān)性分析

為進一步發(fā)現(xiàn)污染物指標(biāo)間的相關(guān)性,對污染物指標(biāo)進行相關(guān)性分析,結(jié)果如表2所示.

當(dāng)相關(guān)系數(shù)大于0.5則兩種指標(biāo)相關(guān)性較強,綜合表1與表2結(jié)果,污染物間關(guān)系發(fā)現(xiàn)結(jié)果如表3所示.

表1 重點污染物關(guān)聯(lián)規(guī)則結(jié)果表

表2 重點污染物相關(guān)系數(shù)表

表3 重點污染物關(guān)系表

3.4 重點污染物預(yù)測結(jié)果及評估

3.4.1 基于敏感參數(shù)發(fā)現(xiàn)的LSTM污染物預(yù)測

針對關(guān)聯(lián)規(guī)則算法與多元回歸分析挖掘的污染物關(guān)系,預(yù)測模型構(gòu)建時,對SO2的預(yù)測輸入變量設(shè)置為SO2; 對NO2的預(yù)測輸入變量為NO2、CO、O3; 對CO的預(yù)測輸入變量為CO、NO2、PM10、PM2.5; 對O3的預(yù)測輸入變量為O3、NO2; 對PM10的預(yù)測輸入變量為PM10、CO、PM2.5; 對PM2.5的預(yù)測輸入變量為PM2.5、CO、PM10.將數(shù)據(jù)預(yù)處理后的數(shù)據(jù)集中的后600條數(shù)據(jù)作為測試集數(shù)據(jù),其余作為訓(xùn)練集數(shù)據(jù),并將訓(xùn)練集中10%的數(shù)據(jù)作為驗證集數(shù)據(jù).采用前24個時刻的污染物濃度數(shù)據(jù)對下一時刻污染物濃度數(shù)據(jù)進行預(yù)測,時間步長設(shè)置為24,每次迭代訓(xùn)練的樣本數(shù)據(jù)量設(shè)置為96,將學(xué)習(xí)率設(shè)置為0.0001,訓(xùn)練輪數(shù)次數(shù)設(shè)置為50,隱藏層神經(jīng)元數(shù)量設(shè)置為256.

如果模型兩次迭代之間損失值變化已經(jīng)很小,那么說明模型收斂,可以結(jié)束訓(xùn)練.因此,為驗證本文模型的收斂性,引入“早停止”策略.當(dāng)驗證集與訓(xùn)練集上模型損失已不再變化時,無論是否達到所設(shè)置的迭代次數(shù),均停止模型訓(xùn)練.

本文模型構(gòu)建之初迭代次數(shù)設(shè)置為50次,但是由圖2所知,當(dāng)模型迭代次數(shù)為16次時,模型已達收斂,所以此時停止模型訓(xùn)練,以減少模型損耗提高訓(xùn)練性能.

圖2 模型收斂性判別圖

為檢驗和說明本文提出模型的預(yù)測性能,將本文污染物預(yù)測模型與未經(jīng)敏感參數(shù)發(fā)現(xiàn)的LSTM模型進行對比預(yù)測.對比結(jié)果如圖3-圖12所示.

圖3 本文SO2預(yù)測結(jié)果擬合圖

圖4 未經(jīng)敏感參數(shù)發(fā)現(xiàn)SO2預(yù)測結(jié)果擬合圖

圖5 本文NO2預(yù)測結(jié)果擬合圖

圖3-圖12中,Forecast-model1為經(jīng)敏感參數(shù)發(fā)現(xiàn)的LSTM預(yù)測模型結(jié)果; Forecast-model2為未經(jīng)敏感參數(shù)發(fā)現(xiàn)的預(yù)測模型結(jié)果; Real_data為污染物真實值.可以看出,本文模型預(yù)測效果優(yōu)于未經(jīng)敏感參數(shù)發(fā)現(xiàn)的對比模型,能夠較好地跟蹤各種污染物濃度變化趨勢,并響應(yīng)其波動變化,實現(xiàn)相對精確的預(yù)測.

圖6 未經(jīng)敏感參數(shù)發(fā)現(xiàn)NO2預(yù)測結(jié)果擬合圖

圖7 本文CO預(yù)測結(jié)果擬合圖

圖8 未經(jīng)敏感參數(shù)發(fā)現(xiàn)CO預(yù)測結(jié)果擬合圖

圖9 本文O3預(yù)測結(jié)果擬合圖

圖10 未經(jīng)敏感參數(shù)發(fā)現(xiàn)O3預(yù)測結(jié)果擬合圖

圖11 本文PM10預(yù)測結(jié)果擬合圖

圖12 未經(jīng)敏感參數(shù)發(fā)現(xiàn)PM10預(yù)測結(jié)果擬合圖

3.4.2 污染物預(yù)測對比評估結(jié)果

根據(jù)SO2、NO2、CO、O3、PM10、PM2.5六種污染物預(yù)測值與真實值情況,兩種污染物預(yù)測模型誤差對比情況如表4所示.

表4 模型均方根誤差評估表

由圖3-圖14及表4所知,經(jīng)污染物敏感參數(shù)發(fā)現(xiàn)的預(yù)測模型擬合效果與預(yù)測誤差均優(yōu)于對比模型.由此,證實了本文預(yù)測模型預(yù)測效果優(yōu)于未經(jīng)敏感參數(shù)發(fā)現(xiàn)的LSTM模型.

圖13 本文PM2.5預(yù)測結(jié)果擬合圖

圖14 未經(jīng)敏感參數(shù)發(fā)現(xiàn)PM2.5預(yù)測結(jié)果擬合圖

4 結(jié)語

本文提出了一種基于敏感參數(shù)發(fā)現(xiàn)的區(qū)域重點污染物濃度預(yù)測方法.該方法主要包含3個模塊,即數(shù)據(jù)預(yù)處理模塊、重點污染物敏感參數(shù)發(fā)現(xiàn)模塊、污染物預(yù)測模塊.其中,在數(shù)據(jù)預(yù)處理模塊主要是針對將原始數(shù)據(jù)進行數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)準(zhǔn)化操作.在重點污染物敏感參數(shù)發(fā)現(xiàn)模塊對環(huán)保監(jiān)測數(shù)據(jù)應(yīng)用關(guān)聯(lián)規(guī)則算法、多元回歸分析挖掘出各污染物的強相關(guān)污染物,為預(yù)測模型構(gòu)建時輸入變量的設(shè)置提供依據(jù).在污染物預(yù)測模塊構(gòu)建LSTM污染物預(yù)測模型,基于挖掘所得各污染物間的敏感參數(shù)設(shè)置輸入變量,使用均方根誤差評估模型性能,證實本文模型較之以往未經(jīng)污染物間關(guān)系發(fā)現(xiàn)的LSTM模型精確度較高.可有效實現(xiàn)環(huán)境污染預(yù)測完成由“滯后”到“超前”的轉(zhuǎn)變.本文雖已實現(xiàn)重點污染物的預(yù)測,但是重點污染物的追蹤工作同樣是環(huán)保監(jiān)測的重點工作,因此,下一步將研究重點污染物的溯源追蹤工作,即依據(jù)污染物歷史數(shù)據(jù)及各行業(yè)企業(yè)排污數(shù)據(jù)查清重點污染物的排放源頭,從而與污染物預(yù)測共同為環(huán)保監(jiān)測工作提供技術(shù)支撐.