賀愛香,魏巧玲,范奎奎,丁孟琴
(安徽新華學院信息工程學院,安徽合肥230088)
隨著我國經濟的快速發展和城鎮化進程的加快,空氣質量呈現出明顯的區域性特征。合肥市位于中國中東地區,經濟發展日新月異,生態環境的壓力隨之加大,主要影響因素表現為城市人口、工業、資源消耗和機動車總量等[1]。環境治理已被政府作為提高人民生活質量和改善民生的重點工作[2]。近年來,合肥市委、市政府高度重視城市環境質量,提出了一系列治理城市環境空氣質量的措施,雖然城區環境空氣質量有所改善,但合肥市空氣質量整體水平在全國省級城市中排名仍然靠后[3]。中國的空氣污染主要來源于煤制能源結構和汽車尾氣排放,其重要因素指標是SO2、NO2、NO、O3、PM10、PM2.5等。由于環境空氣質量受眾多因素的影響,建立科學的監測評價指標模型是一個多維度的復雜模糊問題,利用灰色聚類法建立評價模型并比較分析對環境質量的有效管理具有重要的實踐和理論意義[4]。
國內外學者對空氣質量評價進行了大量的模型研究和對比分析。如丁卉等在對廣州的空氣質量進行評估時,使用了疊加權重的灰色聚類方法,同時通過模糊綜合評估和階段數對城市空氣質量進行了定量評估[5];高明等通過分析北京市空氣質量得出影響空氣質量因素是由產業結構、工業污染源排放和氣象要素相互作用而形成[6];劉杰等利用灰色聚類模型評價了北京市6類污染物的環境空氣質量,為城市環境的治理提出了指導性的建議[7];陶源盛等學者根據成都市空氣中3種主要污染物PM10、SO2和NO2的數據樣本,采用模糊綜合評價法和灰色關聯分析法對空氣質量進行評價,通過分級和定性檢驗確定影響空氣質量的主要因素[8]。進行空氣質量評價還有其他方法,例如物源分析[9]和神經網絡模型法[10]等,其中物源分析法沒有對評價因子的權重問題進行深入探討,而模糊評判法中應用了不確定的最大隸屬函數。對于具有更好穩定性的神經網絡,需要訓練大量的樣本數據和客觀標準來確定隱藏層的數量,所以提出一種改進的灰色聚類評價模型準確評價城市空氣質量等級是非常有必要的工作。
一般情況下,同一類觀察對象的集合可以用作一個集群。灰色聚類是使用灰色關聯矩陣或灰色數量的白化權重函數對檢測對象進行分類。通過建立目標指標的白化權重函數來反映集群中的級別指標值的間隔值[11]。本文提出的城市空氣質量評價模型是在灰色聚類的應用范圍中改進了灰色白化權重的聚類方法,然后進行分析和對比。灰色聚類的定義可以描述為有n個聚類對象,m個指標,s個不同灰類,根據第i(i=1,2,…,n)個對象關于j(j=1,2,…,m)指標的實際觀察值,將i個對象分類為t,t∈{1,2,…,s}個灰類[12]。灰色聚類的整體思路是構建轉換灰色信息的白化權函數,轉化過程同時兼顧信息中各類指標的權重。聚類系數就是聚類對象的類別隸屬度,使用最大隸屬度原則來計算類別。本研究中的監測數據來源于合肥市環境保護局實時自動檢測站點,嚴格按照國家標準,以合肥市空氣質量狀況中各污染物濃度每日平均值為樣本,構建灰色聚類評價模型并進行分析[13]。
抽樣空氣質量監測數據來自合肥市10個自動檢測站,分別是明珠廣場地區、三里街市區、琥珀山莊住宅區、董鋪水庫環境保護區、長江中路街區、廬陽區政府、瑤海工業區、包河區、濱湖新區和高新區站點。結合國家《環境空氣質量標準》(GB3095-2012),確定 NO2、SO2、CO、O3、PM10、PM2.5為空氣質量評價因子,即為灰色聚類的聚類指標j(j=1,2,…,6)。根據城市空氣質量指標將空氣質量指數(AQI)取值范圍定為0~500,劃分為6個等級,即0~50、51~100、101~150、151~200、201~300和大于300,分別對應于I、II、III、IV、V和VI級國家空氣質量標準中污染物濃度限值的日平均值,具體6個等級如表1所示。

表1 灰類的劃分標準
合肥市從2015年開始采用AQI指標評價空氣質量,所以選取2015年1月至2018年2月合肥市城市空氣質量日數據共1 155條作為聚類樣本進行實例評價。原始監測數據經過處理單位統一為mg/m3,并從此樣本數據中隨機提取部分數據如表2所示。

表2 合肥市空氣質量監測數據(部分樣本)
為了使聚類樣本的計算和綜合分析變得簡單,先需要消除維數的影響,因此對聚類樣本的白化數進行歸一無量綱化處理=xij/Soj,其中是樣本歸一化的結果,xij是第i個聚類樣本的第j個聚類索引的檢測數據,Soj為指標限值的平均值,作為參考標準值。表3顯示了標準化樣本數據的結果。

表3 標準化處理后的樣本

表4 標準化處理的灰度限值
本文評價的空氣質量基于劃分的直線型梯形白化函數,上限及下限白化函數分別用于描述I、VI等級,中間Ⅱ、Ⅲ、IV、V等4個等級分別用典型級別白化函數描述。灰類的區間范圍即每個濃度等級范圍對應一個質量評價等級,在此范圍內白化值都為1。基于構建評估指標的灰階白化函數,獲得灰階白值,其中x是白化數中的實際指標。為節省篇幅,本文僅以PM2.5指標為代表,具體白化函數如下。

經典灰色聚類模型主要分析目標的指標權重和實際權重。指標權重主要考慮各類指標在空氣質量評價中的權重。灰類限值越大,指標權重在同一灰類中所占權重越大,這將導致聚類對象的該指標的數值相對于其他指標數值偏大。指標在整個評價體系中的重要性并不相同,因此應該考慮評價指標實際權重,而實際樣本數據的權重未表現在白化函數中,因此對實際樣本數據和評價指標權重疊加計算,突出樣本權重,評估結果將會傾向于采樣數據級別,并選擇權重最高的指標污染物作為主要污染物。下面將分別給出指標權系數和實際權的定義和公式。

表5 指標灰色聚類權
將標準化的實際指標值代入白化函數,乘以指數權重,再乘以實際權重,計算第i個聚類對象的第k個灰色聚類的聚類系數由每個聚類對象的6個聚類系數級別組成,選取表3樣本數據中前5條和后5條數據,求出聚類系數矩陣,以上計算過程較復雜,通過MATLAB編程實現。令δ*=max1≤k≤s{},則其對應的灰類等級即當日空氣質量級別,如表6所示。


表6 聚類系數矩陣結果
從2015年1月至2018年2月合肥市城市空氣質量日數據中隨機選取1 155條空氣質量數據,利用灰色聚類模型評價出每天的空氣質量等級。為了驗證改進的灰色聚類法評價結果的準確性和可靠性,將評價結果與模糊綜合評價法以及我國大多數城市采用的AQI方法進行比較。樣本數據的灰色聚類、模糊綜合評價法以及AQI評價等級如表7所示。從表7中可以看出,灰色聚類方法與模糊綜合評價法評價的結果有一定的差異,與AQI評價結果也存在差異。

表7 3種評價法評價結果對比
灰色聚類評價方法與AQI評價的系數、等級和首要污染物結果對比如表8所示。空氣質量等級的兩種評價結果基本相同,而利用灰色聚類模型確定的首要污染物全部是細顆粒物,只包括PM10和PM2.5,并且絕大部分的首要污染物是PM2.5。在AQI方法評價的結果中4和5的首要污染物是NO2,這一點兩種評價方法存在差異。

表8 評價結果比較
灰色聚類評價過程中綜合考慮指標權和實際權的疊加權重,使得評價結果與真實的空氣質量狀況基本相匹配。采用AQI方法僅能粗略地評價空氣污染的質量等級,使得監測數據處理后的結果不是特別準確。灰色聚類考慮到空氣中的污染因素及污染數據的不確定性和隨機性,對數據的處理全部采用精確化數字結果,使得該模型的評判結果趨于準確和穩定。在AQI方法中更偏向于采用最主要的污染因子進行研究,且監測數據不多。如果總是以最大的污染因子數據進行分析,會使數據處理的結果有比較大的誤差,容易產生邊界性問題,且評價結果相對不準確。 灰色聚類評價模型考慮了各項指標的實際權重,克服了AQI評價中以最大污染指標代替整體指標的不足和模糊綜合評判法不確定的最大隸屬函數問題。
本文通過改進灰色聚類模型評價方法,利用多種污染物指標評價合肥市2015年1月至2018年2月空氣質量狀況。文章通過提取部分樣本數據后被標準化并確定白化函數,利用疊加權重計算出聚類系數,將評價結果與模糊綜合評價法和AQI評價結果作比較,可以看出該模型評價結果與實際情況匹配更好,有效地解決了以單一的污染指標代替總體而存在的模糊性問題,同時運用白化函數進行數據處理,解決了評價等級的邊界性問題。
空氣的化學成分復雜,傳統等比例灰色聚類模型的評價因子數值會過于離散化,數據處理會更加復雜化,從而遺漏許多關鍵性信息。為了提高評價結果的準確性,在以后的研究中要優化評價模型,采用指數型白化函數來代替傳統等比例函數模型,以更準確地評判城市環境質量。