崔雪楊
(北京交通大學經濟與管理學院,北京 100044)
基于聚類分析和因子分析的我國各地區環境污染狀況研究
崔雪楊
(北京交通大學經濟與管理學院,北京 100044)
本文利用多元統計中聚類分析和因子分析的方法,對我國31個省、自治區、直轄市的工業及生活排放污染物進行數據分析,通過借鑒已有的研究成果和相關文獻,選取了能較好衡量我國環境污染的八項指標。在此基礎上根據不同地區的因子得分情況提取出三個解釋性較好的公共因子,并給出了每個因子的地區排名和合理解釋,最后提出了幾點對策和建議。
聚類分析 因子分析 環境污染評價
近年來隨著城市發展的需要,人類從環境獲取資源的數量越來越多,與此同時排放到環境中的氣體、液體和固體廢棄物也不斷增加。我國經濟快速發展的過程是大量消耗自然資源的過程,也是環境和資源破壞遭到巨大破壞的過程,尤其是建立在工業領域的“高耗能、高投入、高污染”的粗放型生產方式上,而粗放型經濟發展方式必然會給我國各個地區環境和生態帶來越來越大的沖擊壓力。環境污染、自然資源的破壞和再生能力的下降也在不斷威脅著人類的生存,這也使人們越來越關注環境和生態成本,如何處理好環境和經濟的和諧發展問題已成為一個亟待解決的課題。
本文以全國31個地區為研究對象,通過借鑒已有研究成果及相關文獻選取了能較好衡量環境污染狀況的八項指標,分別為:X1:工業廢水排放總量(萬噸)、X2:工業廢水中化學需氧量排放量(萬噸)、X3:生活污水排放量(萬噸)、X4:生活污水中化學需氧量排放量(萬噸)、X5:工業廢氣排放量(億標立方米)、X6:工業二氧化硫排放量(萬噸)、X7:工業煙塵排放量(萬噸)、X8:工業固體廢物排放量(噸)。數據主要來源于2011年中國統計年鑒,并參考環保部網站公布的相關數據進行了核對和完善。
2.1 聚類分析的目的
為了對31個地區的環境污染水平及分類有大致的了解,首先對樣本進行聚類分析。本文通過不同聚類數設定結果的比較將聚類數設為4,并采用系統聚類法進行了初分類。

表1 樹狀圖分類結果

表2 提取的公共因子

表3 因子得分系數
2.2 聚類分析的過程
(1)聚類結果樹狀圖見圖1。
(2)樹狀圖分類結果整理見表1。
2.3 聚類結果分析
由以上表格可以看出污染最嚴重的是山西和重慶,山西為我國的煤炭大省,由于以煤炭工業為中心的重工業體系,同時深處內陸地區,降水少,因而產生嚴重的環境污染。重慶也是煤炭資源比較豐富的地區,也是老重工業基地,再加上盆地地形,多丘陵,空氣不流通等等原因導致其環境污染比較嚴重。
河北、河南、遼寧、山東、江蘇、廣西都是我國比較有名的工業區,再加上近年來經濟發展勢頭都很猛,經濟總量越大,需要的原料會越多,導致經濟活動的副產品——污染物的排放就越多,而其環境污染狀況也隨之有惡化的趨勢。同時環境污染狀況應該還與產業結構有關,比如河北省、山東省以鋼鐵、建材等重工業為主、而廣西省則有色金屬開采和冶煉增長比較快。
3.1 因子分析的目的
通過對各個環境污染指標變量的共同信息進行提取,將環境污染指標簡化為幾個可以被解釋的潛在公共因子,從而能夠大致了解各地區環境污染的主要原因,同時通過計算因子得分得到各個地區環境污染狀況嚴重程度的排名。
3.2 因子分析的過程
首先經過原始變量相關系數、變量KMO和Bartlett球度檢驗和反映像相關矩陣驗證數據適合做因子分析,提取的公共因子見表2。
提取方法:主成份分析。
根據表中的數據,前3個因子累計方差貢獻率為85.338%,因此提取前3個因子作為公共因子。
由于初始載荷矩陣不夠清晰,進而采用方差最大正交旋轉得到了三個可解釋的因子。第一個因子主要解釋了工業廢水排放總量、工業廢水中化學需氧量排放量、生活污水排放量、生活污水中化學需氧量排放量,可解釋為液體因子;第二個因子主要解釋了工業廢氣排放量、工業二氧化硫排放量、工業煙塵排放量,可解釋為氣體因子;第三個因子主要解釋了工業固體廢物排放量,可解釋為固體因子。最后計算因子得分系數見表3。
采用回歸法估計因子得分系數,并輸出因子得分系數,據此得出因子得分函數為:
F1=0.307X1+0.161X2+0.477X3+0.397X4-0.166X5-0.058X6-0.231X7+0.118X8
F2=-0.054X1+0.093X2-0.250X3-0.150X4+0.401X5+ 0.337X6+0.463X7-0.072X8
F3=-0.041X1-0.027X2+0.120X3+0.085X4-0.110X5+ 0.110X6-0.076X7+0.997X8
在此基礎上不僅可以計算出各地區在各個因子上的因子得分,而且可以利用線性加權的方法計算各個地區環境污染狀況的因子得分,用旋轉后的方差貢獻率作為總得分系數,公式為:綜合得分=FAC1_1*36.567+FAC2_1*35.840+FAC3_1*12.931,按這3項得分和綜合得分的排名見表4。
3.3 因子分析結果解釋
通過對環境污染各項指標進行因子分析,提取出了三個解釋性比較好的公共因子,分別為液體因子、氣體因子、固體因子。

表4 因子得分和綜合得分
按第一個因子液體因子排名,廣東省得分最高,其次為江蘇,最低為內蒙古,廣東省在第一主因子方面排名較高主要是因為:廣東省水系發達,水資源豐富,但由于工業廢水和城市污水的排入,污染嚴重,水質性缺水的威脅加劇。
按第二個因子氣體因子進行排名,可發現河北省,山西省得分比較高,它們之所以在第二主因子方面污染嚴重主要是因為河北、山西兩省能源、資源豐富,但是由于經濟增長率持續加快,產業結構屬偏重型,如今能源消耗已大于能源生產總資源,工農業的發展和人口增加所帶來的環境污染問題嚴重影響了兩省的生態環境和可持續發展戰略的實施。
按第三個因子固體因子排名,重慶市、山西得分比較高,最低為寧夏,重慶第三因子污染嚴重主要是因為重慶是中國重要的老重工業基地,現代制造業基地,國家高技術產業基地,隨著經濟和技術的飛速發展,如果沒有良好的處理措施,必然會造成過多的固體廢物存在。
最后的綜合排名中,廣東、江蘇、山東、山西、河南、河北的排名都靠前,說明其環境污染狀況比較嚴重,需要加大治理力度。
(1)各地區環保部門應根據污染狀況有針對性的采取措施治理環境污染;(2)政府及有關部門應加強建設項目的監管,完善環境污染防治法制建設;(3)研發新技術,加大環境保護的科技投入,大力發展環保產業;(4)進一步加強環境保護的宣傳工作,加強全社會對環境污染的廣泛重視;(5)加快對老工業、污染嚴重的企業項目的產業結構調整,結合產業升級和技術改造,加快治理力度。
致謝:
感謝我的導師,她淵博的知識和人格魅力使我受益匪淺;感謝我的父母,他們的支持和鼓勵才使我有了前進的動力;感謝我周圍的同學和朋友讓我收獲了珍貴的友誼。
[1]黃桐城,李壽德,顧孟迪.因子分析法在環境污染檢測與評價中的應用[J].工業工程與管理,2007(5):95-100.
[2]彭迪云,劉彩梅.江西省環境與經濟可持續發展狀況的實證研究[J].南昌大學學報(理科版),2011(6):602-606.
[3]劉照德,丁潔花.我國工業污染分布狀況研究[J].數學的實踐與認識,2009(1):99-104.
[4]周全.幾種多元統計分析方法及其在生活中的應用[D].長江大學, 2012.
[5]鄒本東,徐子優,華蕾等.因子分析法解析北京市大氣顆粒物PM_ (10)的來源[J].中國環境監測,2007(2):79-85.
The purpose of this article is to investigate environmental pollution of 31 provinces in our country by referring the existing research results and related literature. This paper applied cluster analysis and factor analysis to 8 principal monitored indexes by the help of statistical software SPSS, and summed up 8 indexes to 3 factors, each of which had special meaning. On this basis it compared and evaluated the environmental pollution in China, using the final factor scores in different regions. The result of this paper is helpful for the Environmental protection department to adopt an effective policy and improve regional environmental pollution in China.
cluster analysis factor analysis environmental pollution evaluation
崔雪楊(1989—),女,漢族,山東聊城人,北京交通大學經濟管理學院,碩士研究生,研究方向:企業管理。