陳禹璇



摘?要:本文以云南省16個州市政府所在地的空氣質量為研究對象,采用聚類分析法,運用R軟件進行系統聚類和K均值聚類,將16個城市依據相關指標分為4類,針對每一類城市的特點,有針對性地提出改善空氣質量,推進生態文明建設的建議。
關鍵詞:空氣質量;聚類分析;云南省
中圖分類號:F2?????文獻標識碼:A??????doi:10.19311/j.cnki.16723198.2023.20.009
0?引言
云南省是中國通往南亞、東南亞的門戶和窗口,自然生態環境和區位優勢極其優越。云南是全國植物種類最多的省份,森林面積居全國第3位,森林覆蓋率為65.04%,被譽為“植物王國”;同時云南素有“動物王國”之稱,動物種類數居全國之冠,脊椎動物達2273種,占全國的51.4%。其中,鳥類793種,占63.7%;獸類300種,占51.1%;魚類366種,占45.7%;生態環保力度空前,九大高原湖泊水質穩步向好,近5年來云南省各州市政府所在地城市空氣質量優良天數比率穩定在98%以上,良好的生態環境已經成為云南最大的亮點和特色,COP15在云南成功舉辦,亞洲象北上南歸,使云南的國際影響力和美譽度大幅提升。城鎮化率隨著云南省經濟社會的發展而不斷提升,截至2022年底,云南省的常住人口城鎮化率為53%,比2012年的38.47%提高了14.53個百分點;城市空氣質量隨著大量人口向城市聚集,成了社會關注的熱點,保持優良的空氣質量成為云南省各主要城市的高質量發展的重要基礎。本文以云南主要城市10年來的空氣質量為樣本,16組樣本數據通過聚類分析的方法將被分為4類,之后則提出各類城市繼續保持優良空氣質量,促進經濟社會發展的建議。
1?云南省主要城市空氣質量的聚類分析
1.1?研究方法
本文運用的聚類分析方法核心是將樣品或變量按照自身特性進行合理分類,該方法經常應用在經濟、管理、氣象預報等多個領域。不同于傳統的分類方法,聚類分析采用定性與定量相結合的方式科學合理地對樣品或變量進行分類。本文主要采用系統聚類和K均值聚類法對16組樣本數據進行分類即Q型聚類即對樣品進行聚類。根據樣本進行的Q型聚類,是根據各個樣本之間的距離來衡量的,每組數據可看作Rp(p維空間)的一個點,n組樣本數據就是Rp中的n個點,需要利用歐式距離來度量這n個點之間的距離即靠近程度。
設X=(X1,X2,…,Xp)T和Y=(Y1,Y2,…,Yp)T是p維向量,可將其視為p維空間中的兩點,測量點X與Y之間的歐式距離公式為:
d(x,y)=[(∑pi=1(xi-yi)2)]12
1.2?數據說明
本文采用的數據來源于2013-2022年《云南省統計年鑒》,統計范圍是云南省各州、市所在地監測城市,統計數據包含年份、可吸入顆粒物(PM10)、細顆粒物(PM2.5)、二氧化硫(SO2)、二氧化氮(NO2)和空氣質量達到及好于二級的天數。數據時間跨度為2012-2021年。
基于上述數據,同時云南省空氣質量普遍優于全國大部分省市,而且細顆粒物(PM2.5)的年平均濃度基本小于35(μg/m3),因此選取云南各主要城市2012-2021年空氣質量的四個指標:可吸入顆粒物(PM10)、二氧化硫(SO2)、二氧化氮(NO2)和空氣質量達到及好于二級的天數,各個指標的含義如下:
可吸入顆粒物(PM10):可吸入顆粒物指空氣動力學當量直徑≤10微米的顆粒物。
二氧化硫(SO2):大氣主要污染物之一,在許多工業生產過程中會產生此類污染物,特別說明當二氧化硫溶于水會形成會形成亞硫酸(酸雨的主要成分)。
二氧化氮(NO2):是在人類活動中產生的類物質,在臭氧的形成過程中起著重要作用,比如機動車尾氣、鍋爐廢氣的排放等。
空氣質量達到及好于二級的天數:空氣污染指數(API)處于51~100,達到國家空氣質量日均值二級標準,空氣質量良好,符合城市空氣質量的要求。
根據統計數據,分別計算2012-2021年可吸入顆粒物、二氧化硫、二氧化氮、三個指標的平均濃度和年平均空氣質量達到及好于二級的天數,得到新的數據表,見表1。
1.3?系統聚類分析
采用R軟件對16個主要城市進行系統聚類,此方法適用于樣本容量較小的情況,可主觀地判斷出應當將樣本分為幾類。首先采用類平均法做系統聚類,此方法優勢在于較好地利用了所有的樣品信息。當取合并距離為16時,則16個主要城市可分為4類。類平均法聚類結果如圖1所示。
在取得類平均結果后,采用離差平方和法(Ward法),此方法是最常用的系統聚類方法,這種方法的核心思想是在同類樣品的離差平方和即類內離差平方和應當較小,而不同類之間的離差平方和即類間離差平方和應當較大。當取合并距離為21時,則16個主要城市可分為5類。Ward法聚類結果如圖2所示。
采用兩種不同的系統聚類法得出的結果大致相同,除景洪市和芒市外其余城市分類相同。當采用類平均法時,這兩個城市歸入第3類;而采用Ward法時,這兩個城市則單獨成一類即第5類。
1.4?K均值聚類分析
由于采取的系統聚類方法不同,最終產生的分類也不同,無法確定最終分類結果,為確定最優的分類結果,故采用K均值聚類法進行分類。
K均值聚類的基本思想為:首先確定參數K,然后將n個樣本大概分為K類,之后按照相關函數準則去修改不合理的分類,直到有關函數收斂即可停止,就可得到最終分類結果。判斷分類結果的好壞則需看between_SS/total_SS,即類間平方和在總離差平方和中的占比,當比值越大時則說明分類結果越好。
當K取4時,聚為4類。類間平方和在總離差平方和中的占比(between_SS/total_SS=70.2%)。
此方法和系統聚類中類Ward法的分類結果完全相同。
在考慮到樣本容量較小的情況下(16個),分類的個數也應相應的較少。同時在分析類間平方和在總離差平方和中的占比時,應注意此項標準不能去判斷分類的個數,只是在確定分K類的情況下去分析此種分類方式的合理性。因此在分4類時(between_SS/total_SS=70.2%),每個類之間的差別較為顯著,最后得到的分類結果見表2。
針對分類結果進行檢驗,將上述K均值分析結果進行方差分析,如表3所示。
可知可吸入顆粒物(PM10)、二氧化硫(SO2)和二氧化氮(NO2)這三項指標呈現出的顯著性(p<0.05),說明這三項指標在聚類分析中有顯著性的作用,即按照這幾項指標對16個主要城市進行分類的。而空氣質量達到及好于二級的天數(天)這一項的p值則是明顯地大于0.05,說明在聚類過程中此項指標不顯著,雖不能作為明顯的劃分的依據,但其實際意義依然顯著。
因為本文的目的是在確定分類后,針對不同類別的城市提出相應的綠色發展建議,在R軟件中可得到類均值,即可具體分析4個類之間的差別,見表4。
第1類只有昆明一個城市。昆明是云南省的經濟、社會發展中心,是云南省唯一的特大型城市。由于人口高度集聚,其PM10的年平均濃度達到了571μg/m3位居4類第一,而二氧化氮(NO2)年平均濃度達到316μg/m3同樣位居4類第一,空氣質量整體上低于省內其他主要城市。
第2類中有香格里拉市、大理市、麗江市、普洱市。前3座城市都是云南省的傳統旅游城市,旅游業作為主導產業,工業比較不發達,普洱市則是近幾年憑借普洱茶成為名揚國內的新興旅游城市,此類中的各項均值均位于4類中的最后,即這3項指標均為最優,說明4個城市空氣質量總體位于全省前列。
第3類中有景洪市、芒市、瀘水市、保山市、臨滄市和文山市,這6個城市是沿邊州市所在地,臨近緬甸、老撾邊境線,空氣中二氧化硫(SO2)和二氧化氮(NO2)年平均濃度均不高,空氣質量整體較好。
第4類中有楚雄市、蒙自市、昭通市、曲靖市和玉溪市,這5個城市基本處于滇中地區,傳統工業較為發達,工業體系較為完善,因此空氣中二氧化硫(SO2)和二氧化氮(NO2)年平均濃度較高,空氣質量一般。
2?提升城市空氣質量的建議
2.1?第1類城市
昆明作為云南省經濟社會發展中心,應將綠色發展作為首要目標。一是對傳統工業進行轉型升級,推動鋼鐵、有色金屬等行業高質量發展,從源頭上控制污染源;二是積極倡導民眾綠色生活方式,推進綠色低碳出行;三是加強生態園林、生態小區建設,提高綠地占有率。
2.2?第2類城市
作為云南省主要的旅游城市,香格里拉市、大理市、麗江市和普洱市應繼續錨定旅游興市,建設生態文明旅游名城,一是因地制宜發展旅游業,利用地理文化優勢打造宜居城市;二是保護生態綠地,共享生態福祉,將綠色作為發展的底色,積極建設生態文明示范市;三是結合脫貧攻堅與鄉村振興戰略的有效銜接,推動城鄉一體化發展。
2.3?第3類城市
此類城市為沿邊州市所在地,臨近緬甸、老撾邊境線,一產、三產所占比重較大,因此應利用地域優勢和當地豐富的自然資源推進綠色發展。一是保護生態環境,加強林草生態建設,重點發展地方特色農特產品;二是利用沿邊優勢,加強與緬甸、老撾等地的邊境貿易,開發旅游產業;三是進一步加強環保宣傳教育,開展全民性綠色活動,提高民眾環保意識。
2.4?第4類城市
作為傳統工業城市,應注重產業升級改造,發展綠色產業,構建“綠水青山就是金山銀山”的發展思路。一是加大對傳統工業產業的環保資金投入,逐步轉型升級,堅決遏制“兩高”產業盲目發展;二是堅持生態優先、綠色發展的理念,促進各產業園區和開發區向綠色化、低碳化、循環化轉型;三是傳播綠色發展理念,提升全民低碳意識,共建美麗家園。
3?結論
本文對云南省16個主要城市的空氣質量進行了聚類分析,并根據分類結果對4類城市提升空氣質量提出建議。本文在查找數據上存在一定缺陷,在后續研究中可以查找較多指標,建立更加復雜的對比及預測模型,從而增強統計分析的針對性,為各州市提高空氣質量,推動綠色發展提供更有建設性的意見和對策。
參考文獻
[1]劉莎妮.論地方政府對中國參與東盟區域合作中的支持[D].上海:上海師范大學,2013.
[2]范必成.越南老街省與中國云南省次區域旅游合作研究[D].昆明:云南大學,2014.
[3]虞穎,孟彥菊.中國31個主要城市空氣質量的聚類分析和主成分分析[J].科技和產業,2022,22(05):246250.
[4]費宇.多元統計分析—基于R[M].北京:中國人民大學出版社,2020.
[5]姚勝,孫周寅,賈如,等.基于聚類分析法的河北省傳統村落現狀特征及活化策略研究[J].中國集體經濟,2022,(32):1923.