郭金姝
(石家莊市環境監測中心河北石家莊050021)
基于圖像像素統計理論的大氣污染度評價方法
郭金姝
(石家莊市環境監測中心河北石家莊050021)
大氣污染度測量一般采用高精度測量儀器給出具體數值。基于圖像像素統計理論,利用圖像的標準差、梯度、熵、空間頻率等統計指標構建大氣污染度評價模型,通過對一段時間內在同一拍攝場景的圖像進行統計指標分析,然后和空氣污染指數進行相關性統計,發現圖像像素統計指標和空氣污染指數之間具有強相關性,這為分析大氣污染程度提供了一種新的手段。
圖像;梯度;熵;空間頻率;大氣污染度
大氣是由多種成分組成的混合氣體,這些混合氣體的組成通常包括干潔空氣、水汽及懸浮微粒。大氣污染通常是指由于人類活動和自然過程引起某種物質進入大氣中,呈現出足夠的濃度,達到了足夠的時間并因此而危害了人體的舒適,健康和福利或危害了環境的現象[1]。
空氣污染指數(Air Pollution Index,API)是根據空氣環境質量標準和各項污染物的生態環境效應及其對人體健康的影響來確定污染指數的分級數值及相應的污染物濃度限值。目前我國所用的空氣污染指數的分級標準是:(1)空氣污染指數50點對應的污染物濃度為國家空氣質量日均值一級標準,50以下為優;(2)空氣污染指數100點對應的污染物濃度為國家空氣質量日均值二級標準,51~100為良好;(3)空氣污染指數200點對應的污染物濃度空氣污染指數為國家空氣質量日均值三級標準,101~150為輕微污染,151~200為輕度污染;(4)空氣污染指數的更高值段對應于各種污染物對人體健康產生不同影響時的濃度限值,201~300為中度污染,300以上為重度污染。計入空氣污染指數的污染因子有二氧化硫、二氧化氮及可吸入顆粒物[2]。
目前在空氣污染指數測量方面,多采用高精度精密儀器進行測量。本文提出了一種基于圖像像素統計理論的大氣污染度評價方法,通過計算同一拍攝地點不同空氣質量條件下的圖像像素統計指標,如標準差、梯度、熵、空間頻率的變化情況來評估空氣污染程度。計算發現,利用圖像像素統計指標和采用高精度測量儀器獲得的實驗數據之間具有強相關性,驗證了本文提出方法的可行性。
基于圖像像素統計理論的評價方法沒有絕對的指標,它主要依賴圖像像素灰度變化情況,考察圖像在細節保留程度、信息量是否提高、噪聲是否得到抑制等方面發生的變化。較為常用的指標主要包括標準差、梯度、熵、空間頻率等。
標準差(Standard Deviation,SD)反映了圖像灰度相對于灰度平均值的離散情況。一定程度上標準差可反映圖像的反差大小。若標準差大,則圖像灰度級分布分散,圖像的反差大。標準差小,圖像的反差小,對比度不大,色調單一均勻,不易分辨太多信息。一般來說,大氣污染程度越大,拍攝的大氣圖像反差越小。

其中,I為圖像,Iˉ為圖像中某一點圖像均值,M和N分別為圖像尺度。
平均梯度(Average Gradient,AG)又稱清晰度。平均梯度敏感的反應圖像對微小細節反差表達的能力,常用來評價圖像的清晰度,同時還可反映圖像中微小細節反差和紋理變換特征,通常平均梯度越大,圖像層次越多,圖像越清晰。一般來說,大氣污染程度越大,拍攝的大氣圖像清晰度越小。

圖像的熵值是衡量圖像信息豐富程度的一個重要指標。圖像熵雖然不能反映圖像灰度分布的空間特征,但是卻可以有效表示圖像灰度分布的空間特征。一般來說熵值越大,圖像包含的信息量也越大。設為圖像總的灰度等級,表示為,其中,。則圖像信息熵可定義為:L={l1,l2,...lt...,lm},其中,l1<l2<,...<lt<...,<lm。則圖像信息熵可定義為:

其中,為第個灰度等級出現的概率。圖像熵值反映了圖像信息量的多少,圖像熵值越大,一定程度上可認為圖像信息量的增加,圖像所含信息量越豐富,說明圖像清晰度越好或圖像包含的內容越明顯。由于大氣污染程度的增加,往往會出現圖像場景中信息量逐步下降的過程,因此圖像熵評價模型可以很好的預測大氣的污染程度。
空間頻率(Spatial Frequency,SF)在一定程度上反映了圖像空間域的總體活躍程度。像的行頻率(RowFrequency,RF)、列頻率(Column Frequency,CF)和圖像的空間頻率可表示為:

其中,RF和CF分別表示為:

實驗圖像來源于北京環保局朝陽區農展館檢測子站公布的若干圖像。2011年11月22日至12月5日共拍攝了14幅北京東部地帶的空氣污染狀況[3],其選擇每日在同一地點拍攝同一場景,這些場景成為北京半個月來天氣和空氣情況變化的直觀顯示。圖1是參與實驗的14幅圖像,表1是對應于上述圖像,利用高精度測量儀器獲得的實驗數據以及利用圖像像素統計指標獲得的計算結果(實際計算中對圖像進行了裁剪)。

圖1 北京東部地帶空氣污染狀況圖

表1 空氣污染狀況數據
上述API數據可直觀認為是反映大氣污染程度的重要指標,為考察圖像預測大氣污染程度的準確性,將圖像像素統計指標和API數據進行相關性分析,利用Pearson線性相關系數(Correlation Coefficient,CC)考察兩組變量之間的相關性[4],CC可表示為:

式中,rp表示相關系數,n表示樣本數,xi和yi分別表示兩變量的變量值,xˉ和yˉ分別表示變量均值。直觀上,rp[5]可用來衡量兩個數據集合分布是否在一條直線上,即衡量兩個變量間的線性關系,其取值在-1~1。若rp>0,表明兩個變量是正相關,即一個變量的值越大,另一個變量的值也會越大;若rp<0,表明兩個變量負相關,即一個變量的值越大,另一個變量的值反而會越小;rp的絕對值越大,說明兩組變量之間的相關性越強;若rp為1或者-1,兩組變量之間呈現嚴格的線性關系,相關系數越接近于0,相關度越弱;若rp為0,表明兩個變量之間不是線性相關,但有可能是其它方式的相關。表2給出了Pearson相關系數的相關性統計數值。圖2為兩組變量之間相關性分析。

表2 Pearson相關系數相關性統計

圖2 Pearson線性相關系數
為便于進行數據統計,將分值轉換為z分數或標準分數,標準化數值是變量值與其平均數的離差除以標準差后的值,也稱z分數或標準分數。可以對一組數據中各個數值進行標準化處理,以測度每個數據在該組數據中的相對位置,并可用它來判斷一組數據是否有異常值。設標準化數值為z,則有[6]:

式中,xi表示變量值,xˉ表示變量均值,σ為樣本方差。對API和圖像統計指標進行相關性計算分別可得圖3。

圖3 圖像統計指標與API之間的相關性統計
由圖3可知,標準差與API之間的相關系數為0.570,平均梯度與API之間的相關系數為0.685,圖像熵值與API之間的相關系數為0.546,空間頻率與API之間的相關系數為0.692。根據表2可知,標準差、圖像熵值與API之間存在中等程度相關,相比之下,平均梯度和空間頻率與API之間存在強相關性,即說明利用圖像紋理細節或圖像的清晰程度判斷大氣污染程度具有可行性,且具有操作簡單、實時性好、經濟直觀等優點。
大氣是人類賴以生存和發展的必不可少的環境要素之一,然而人口的增多,人類活動頻繁,自然因素影響使大氣污染嚴重,開展大氣環境保護方面的研究已刻不容緩。本文從圖像處理的角度出發,力求通過計算圖像像素的統計指標數值來對大氣污染程度進行評價和預測,初步實驗結果顯示,圖像平均梯度、空間頻率和大氣污染指標API之間存在強相關性,說明了本文提出方法的可行性。由于目前采集的圖像樣本較少,且觀測時間和圖像拍攝條件也未能嚴格約束,因此下步工作應進一步擴大參加實驗的圖像樣本數量,驗證基于圖像統計指標評價方法的普適性。
[1]桑燕鴻,周大杰,楊靜.大氣污染對人體健康影響的經濟損失研究[J],生態經濟,2010,(1).
[2]任彥卿,曹國良,涂娟.陜西省四市2007~2009年空氣污染指數分析[J].環境保護與循環經濟,2010,(8).
[3]高新波,路文.視覺信息質量評價方法[M].西安電子科技大學出版社,2011.
[4]J.L.Rodgers,W.A.Nicewander.Thirteen ways to look at the correlation coefficient[J].American Statistician,1988,42(1):59-66.
[5]張勇,金偉其.夜視融合圖像質量主觀評價方法[J].紅外與激光工程,2013,42(2):528-532.