崔金蕾 李國東
(新疆財經大學應用數學學院,新疆 烏魯木齊 830012)
在經濟迅猛發展的同時,環境相應著也發生了變化。環境的污染越來越嚴重,部分省市出現了嚴重的霧霾,水體被污染等現象,這危害著人類的生存。盡管政府采取了一定的措施,但是經濟的發展對環境的破壞不是一蹴而就的,因此對環境的治理效果也不一定有顯著的成效。新疆是一個重工業基地,對產品進行初加工,不可避免的要有大量的廢水廢氣的排放,這就需要對各個行業各個部門有一個詳盡的分析,得出工業中對環境的污染最大的行業,對治理有一定的針對性,進行綜合治理。
從國內外的文獻來看,很多專家學者研究經濟的發展對于環境污染的影響,如1991~2011年甘肅省經濟增長環境污染研究[1];各個區域對環境污染的研究,如我國區域城市化與環境污染關系的空間計量研究[2],河南省產業結構升級與環境污染關系研究[3]等等。本文以新疆工業中各行業為例,現在將用統計的一些方法對工業中廢水廢氣的排放進行分析,得出應加強管理行業類別的結論。
現借鑒《2013年新疆統計年鑒》中的數據,將其整理如下:
行業分為農副食品加工業、食品制造業、酒、飲料和精制茶制造業、紡織業、造紙及紙制品業、石油加工、煉焦及核燃料加工業、化學原料及化學制品制造業、化學纖維制造業、黑色金屬冶煉及壓延加工業、電力、熱力的生產和供應業、其他行業,分別簡稱為農品加工、食品制造、副食制造、紡織業、紙制品業、燃料加工、原料制造、纖維制造、金屬加工、電熱產供、其他行業,如表1所示[4]:

表1 工業按行業重點調查工業企業廢水廢氣及污染物排放情況
主成分分析是設法將原來眾多具有一定相關性(比如P個指標),重新組合成一組新的互相無關的綜合指標來代替原來的指標。主成分分析,是考察多個變量間相關性一種多元統計方法,研究如何通過少數幾個主成分來揭示多個變量間的內部結構,即從原始變量中導出少數幾個主成分,使它們盡可能多地保留原始變量的信息,且彼此間互不相關。通常數學上的處理就是將原來P個指標作線性組合,作為新的綜合指標[5]。
最經典的做法就是用F1(選取的第一個線性組合,即第一個綜合指標)的方差來表達,即Var(F1)越大,表示F1包含的信息越多。因此在所有的線性組合中選取的F1應該是方差最大的,故稱F1為第一主成分。如果第一主成分不足以代表原來P個指標的信息,再考慮選取F2即選第二個線性組合,為了有效地反映原來信息,F1已有的信息就不需要再出現在F2中,用數學語言表達就是要求 cov(F1,F2) = 0,則稱F2為第二主成分,依此類推可以構造出第三、第四,…F…,第P個主成分。

其中 a1i,a2i,… ,api(i = 1, …m)為X的協 方差陣Σ的 特征值所對應的特征向量, ZX1,Z X2, … ,ZXp是原始變量經過標準化處理的值。 A=(aij)p×m=(a1,a2, …am),Rai=λiai其中,R為 相關系數矩陣,a是相應的特征值和單位特征向量,λ1≥λ2≥… ≥λp≥0。i
其中主成分分析法的計算步驟:
(1)指標數據標準化(SPSS軟件自動執行);
(2)指標之間的相關性判定;
(3)確定主成分個數m;
(4)主成分Fi表達式;
(5)主成分Fi命名。
依據研究對象(樣品或指標)的特征,對其進行分類的方法,減少研究對象的數目。各類事物缺乏可靠的歷史資料,無法確定共有多少類別,目的是將性質相近事物歸入一類。各指標之間具有一定的相關關系。
主要的步驟如下:第一步:逐個掃描樣本,每個樣本依據其與已掃描過的樣本的距離,被歸為以前的類,或生成一個新類。第二步,對第一步中各類依據類間距離進行合并,按一定的標準,停止合并。
采用SPSS軟件及其R軟件對新疆工業各行業污染的排放量進行分析。
(1)主成分的初始結果分析

表2 主成分分析的初始結果
根據表2可知,主成分包含指標變量的信息比較接近,其中指標工業廢水排放量與工業廢水中氨氮排放量信息損失比較大。
(2)主成分的提取

表3 主成分提取表解釋的總方差
觀察表3,主成分提取表中有三個特征值大于1的主成分,且累積貢獻率達到91.248%,所以提取三個主成分比較合適。用碎石圖直觀的表示為圖1:

(3)主成分的矩陣表示
把工業廢水排放量、工業廢氣排放量、工業氮氧化物排放量、工業煙粉塵排放量看作第一主成分,取名工業污染重要排放物;工業廢水中化學需氧量排放量、工業二氧化硫排放量看作第二主成分,取名第二排放污染;工業廢水中氨氮排放量看作第三主成分見表4。

表4 原指標變量用主成分表示成份矩陣
(4)主成分的得分

圖5 主成分得分系數矩陣
則主成分的組合模型公式如下:

綜合評價指數= 0.55 F1+0.2F2+0.16F3
可以將新疆各個行業的工業廢水排放量、工業廢水中化學需氧量排放量、工業廢水中氨氮排放量、工業廢氣排放量、工業二氧化硫排放量、工業氮氧化物排放量、工業煙粉塵排放量的截面數據分別帶入模型的公式F1,F2,F3中,并計算綜合評價指數,根據其得分大小排序,就可以知道哪一個行業對環境污染的影響最大。綜合得分見表6。

表6 各行業的綜合得分
根據綜合得分的表的排名,可知原料制造業的污染最大,紡織業的污染相對來說最小,所以更應該加強排名前三的原料制造業、纖維制造業、電熱產供業的治理,這樣才能使環境越來越好。

表7 主成分的協方差矩陣

1 1.000 .000 .000 2 .000 1.000 .000 3 .000 .000 1.000
根據表7可知,三個主成分兩兩之間的相關系數為0,說明經主成分分析提取后的三個主成分之間沒有相關性,實現了主成分分析的優化設計目標。
用R軟件編程進行層次聚類分析,結果見圖3。

根據圖3可知將原料制造、纖維制造分為第一類,電熱產供、紙制品業、金屬加工、其他行業分為第二類,燃料加工、副食制造、農品加工、食品制造、紡織業分為第三類,采取大致的三類措施進行治理,這樣不僅節約了資金也節省了時間。
本文主要是用簡單的統計方法得到了原料制造業、纖維制造業、電熱產供業更需要加強對行業的管理,雖然其他行業綜合得分不是很高,但是也不能松懈管理。文章的方法也可以應用到各個省市地區的各個行業,應用具有一定的廣泛性。
[1] 李波,肖歡.1991~2011年甘肅省經濟增長環境污染研究[J].現代商貿工業,2013(19):51-53.
[2] 王家庭.我國區域城市化與環境污染關系的空間計量研究[J].文明和諧與共同繁榮,2013:383.
[3] 閆麗霞.河南省產業結構升級與環境污染關系研究[J].低碳經濟,2013(8):26-29.
[4] 新疆維吾爾自治區統計局.2013年新疆統計年鑒[M].中國統計出版社,2013.
[5] Richard A. Johnson,Dean W. Wichern. 實用多元統計分析(第四版)[M].清華大學出版社,2001.