劉菊紅 李青
摘 要:本文以中國2009年各地區工業廢氣排放的情況為研究對象,首先根據各地區工業廢氣排放的情況進行分類,將要研究的復雜問題簡單化,接著運用貝葉斯判別分析法將待判的幾個地區分到已知類中,而后運用降維的思想將影響各地區工業廢氣排放的多個指標轉化為少數幾個綜合指標,進而分析我國工業廢氣排放的主要原因。
關鍵詞:廢氣排放 聚類分析 判別分析 主成分分析 降維 本文主要研究2009年我國各地區工業廢氣排放的情況,采用多元統計中的聚類分析法、貝葉斯判別分析法、主成分分析法將要研究的復雜問題簡單化,將多個指標轉化為少數幾個綜合指標,進而分析我國工業廢氣排放的主要原因。
一、使用系統聚類法對各大中城市進行分類與結論
各地區工業廢氣排放量是反映一定時期內工業廢氣排放量變動趨勢和程度的相對數,包括工業二氧化硫排放量、工業煙塵排放量、工業粉塵排放量、工業二氧化硫去除量、工業煙塵去除量、工業粉塵去除量。我們將要研究的是這六個指標下15個地區(北京、天津、貴陽、西寧、重慶、太原、南京、杭州、濟南、石家莊、呼和浩特、哈爾濱、鄭州、武漢、長沙)廢氣排放情況的問題,對這個問題進行系統聚類,其中樣品間距離采用歐氏距離,類間距離的度量分別采用離差平方和法和最長距離法做聚類圖。輸出結果。
數據來源:2010中國統計年鑒,中華人民共和國國家統計局網站:http://www.stats.gov.cn
按離差平方和法,由圖我們可以將15個地區進行系統聚類:
第一類:北京、天津、太原、南京、杭州、濟南;第二類:石家莊、呼和浩特、哈爾濱、鄭州、武漢、貴陽、西寧;第三類:重慶;第四類:長沙。
數據來源:2010中國統計年鑒,中華人民共和國國家統計局網站:http://www.stats.gov.cn
按最長距離法,由圖我們可以將15個大中城市進行系統聚類:
第一類:北京、天津、太原、南京、杭州、濟南;第二類:石家莊、呼和浩特、哈爾濱、鄭州、武漢、貴陽、西寧;第三類:重慶;第四類:長沙。
由聚類圖不難看出兩種分類方法分析結果是完全一致的。
從聚類圖上我們可以把我國15個地區工業廢氣排放情況分成四類:
第一種類型,這些地區都是國家重點工業建設經濟區域,工業技術先進,也是最近幾年我國工業經濟發展速度最快的地區,尤其北京是我國首都,發展尤為重要,而太原主要有煤炭事業;
第二種類型,這些地區都是正處于發展建設中,工業經濟發展處于穩步建設中,與北京等地相比顯然不屬于同一類型;
第三種類型,重慶屬于老工業基地,現在又走新型工業化建設道路,故與上面的兩種類型都有所區別;
第四種類型,長沙屬于新型工業建設基地,堅持走新型工業化道路,與上面三種類型顯然不能化為同一類。
二、使用判別分析對未知分類地區進行分類與結論
現從未分類的地區中選出6個地區:沈陽、合肥、廣州、成都、西安、烏魯木齊進行判別分析,分析它們屬于哪一類型。假設他們都屬于第一類,現調用SAS9.1統計軟件進行貝葉斯判別分析,分析結果。
數據來源:2010中國統計年鑒,中華人民共和國國家統計局網站:http://www.stats.gov.cn
從分類看出,只有廣州屬于第一類,其余地區劃分為第二類。
廣州是全國重要的工業基地,華南地區的綜合性工業制造中心,屬于我國經濟發達地區,因此,應歸為第一類。沈陽、合肥、廣州、成都、西安這些地方,工業經濟處于穩步建設中,與第二類的各個地區的經濟發展相似,所以應歸為第二類。而烏魯木齊重點發展油氣加工及化學工業,廢氣排放的狀況和第二類的各地區也應屬于同一類別。
三、使用主成分分析各地區工業廢氣排放情況與結論
對我國各地區廢氣排放情況進行統計分析,選出六個影響指標中較重要的作為主成分。
工業二氧化硫排放量; 工業煙塵排放量; 工業粉塵排放量;
工業二氧化硫去除量; 工業煙塵去除量; 工業粉塵去除量。
這些指標基本可以反映我國各地區廢氣排放情況,再用SAS軟件中的主成分分析對X1 — X6進行主成分分析。分析的結果。
在上述第一表達式中, X1的系數最大,表明第一主成分值大時工業二氧化硫排放量較大,因此可以把第一主成分稱為二氧化硫排放因子;在第二表達式中, X3,X5的系數最大,說明第二個主成分值越大時,工業粉塵排放量、工業煙塵去除量越大,因此可以把第二主成分稱為工業粉塵排放因子;在第三表達式中, X6的系數最大,說明第三個主成分值越大時工業粉塵去除量越大,因此可以把第三主成分稱為工業粉塵去除因子;在第四表達式中, X2,X4的系數最大,說明第四個主成分值越大時工業煙塵排放量、工業二氧化硫去除量越大,因此可以把第四主成分稱為工業煙塵排放因子。由以上討論可知,4個變量可分為4類:{X1},{X3,X5},{ X6},{X2,X4 }。
數據來源:2010中國統計年鑒,中華人民共和國國家統計局網站:http://www.stats.gov.cn
由前兩個主成分的散點圖可知,我國各地區廢氣排放情況是居中的占大部分,偏高或偏低的占小部分。
在影響各地區廢氣排放情況的六個指數中,最重要的指數是工業二氧化硫排放量,它是造成廢氣排放最主要的因素,像北京等一線地區,工業技術快速發展,在發展工業經濟建設的同時燃燒掉大量的燃料,釋放出各種污染大氣的氣體,二氧化硫就是主要的污染物之一。而到目前為止北方地區獲取能源的主要供給為煤炭,大量的煤炭在燃燒的過程中就會釋放出過量的污染氣體、固體顆粒,致使二氧化硫的含量在廢氣排放中所占的比例越來越重。
參考文獻:
[1] 盛來運.中國統計年鑒[M].中國統計出版社,2010.
[2] 裴喜春.SAS及應用(第二版)[J].北京:中國農業出版社,2007(7).
[3] 任雪松, 于秀林.多元統計分析[J].北京:中國統計出版社,2007(7).
[4] 王靜龍,梁小筠.參數統計分析[J].北京:高等教育出版社,200(4).
[5] 楊啟帆,康徐升,趙雅圖.數學建模[J].北京:高等教育出版社,2008(5).
[6] Dallase Johnson,Applied Multivariate Methods for Data Analysis[J].Beijing:Higher Education Press, 2005(5).
(責任編輯:康偉)