宗宜宸 劉志鑫 王斐然


【摘 要】本文通過主成分分析法與聚類分析法的結合對河北省的幾個主要城市的主要污染物排放量進行總結與分類,為各個地區(qū)治理環(huán)境污染提供客觀的參考依據(jù)。
【關鍵詞】聚類分析;主成分分析;河北省;主要污染物排放量
1.研究現(xiàn)狀
隨著工業(yè)化時代的發(fā)展,工廠向大自然排放的污染氣體也逐漸增加,人類活動對環(huán)境污染的強度也越來越大,甚至成為了引至全球及區(qū)域尺度環(huán)境變化的主要驅動力。因此,制定區(qū)域污染源清單已經(jīng)成為國內外科學界關注的熱點領域。
2.研究方法
2.1主成分分析
2.2聚類分析
2.3實例展示
2.3.1步驟
(1)主成分分析:
為消除各個變量之間的量綱影響,從樣本的相關系數(shù)矩陣出發(fā)。根據(jù)原始變量數(shù)據(jù)相關矩陣顯示,在各變量之間的相關系數(shù)矩陣中可以看出,有較強相關性的變量依次為:X1與X2之間的相關系數(shù)為0.975;X1與X6 之間的相關系數(shù)為0.832;X2與X6之間的相關系數(shù)為0.857.
因而,前兩個主成分為:第一個主成分:
F1 0.215X1 0.218X2 0.203X3 0.168X4 0.192X5 0.166X6
第二個主成分:
F2 0.207X1 0.220X2 0.176X3 0.540X4 0.341X5 0.597X6
由表達式可以看出第一主成分是由 PM2.5,PM10,SO2,CO 反映的污染物排放量的綜合指標,第二主成分是由 PM2.5,PM10,NO2,CO,O3 反映的污染物排放量的綜合指標。
(2)聚類分析:
地區(qū)之間的近似矩陣反映了地區(qū)之間的相似性或相異性的矩陣,由于計算距離使用的是平方歐式距離,所以地區(qū)間距離越大,主要污染物越相異。
平均連接(組之間)聚類表,以表的形式說明聚類的過程。
譜系圖結果顯示出河北省各個地區(qū)污染物排放量有較大差異。
3.結論
在主成分分析中計算出的兩個主成分中,得出最主要的4個主要污染物為PM2.5,PM10,SO2,CO,其次為NO2,O3。從圖1譜系圖中可以看出分五類比較合適,其中,張家口為第一類,廊坊、承德、秦皇島為第二類,唐山為第三類,石家莊、邯鄲、邢臺為第一類,衡水、滄州、保定為第二類,唐山為第三類,廊坊、承德、秦皇島為第四類,張家口為第五類。各個地區(qū)在尋找污染源時可以作為參考。
參考文獻:
[1]IPCC.Climate Change 2007:The Physical Science Basis.Cambridge University Press,2007.
[2]楊文夷,李杰朱,莉莉等.我國空氣污染物認為源排放清單對比[J].環(huán)境科學研究.2006,7(16):704-709.
(作者單位:1.華北理工大學材料科學與工程學院;2.華北理工大學建筑工程學院3.華北理工大學臨床醫(yī)學院院)