摘要:提出人口壓力指標,運用主成分分析方法對我國人口壓力作出評價,并根據壓力指標對我國各個省市進行了分類#65377;在其基礎之上,運用空間數據挖掘中GIS的空間自相關分析方法,分析了我國人口壓力空間分布模式;研究認為我國人口壓力從西部向東部總體減小,人口壓力在空間分布上呈現明顯的聚集模式#65377;圍繞京津#65380;江浙閩#65380;山東等區域與周圍省市的人口壓力形成低—低關聯模式,圍繞陜甘青#65380;川渝等省市與周圍保持高—高關聯模式#65377;這種空間分布態勢值得政府決策部門注意#65377;
關鍵詞:空間數據挖掘; 地理信息系統; 人口壓力; 空間分布模式; 主成分分析
中圖分類號:G206.2文獻標志碼:A
文章編號:1001-3695(2007)04-0232-03
0引言
空間數據挖掘(Spatial Data Mining)是在數據挖掘基礎之上,結合地理信息系統(Geographic Information System,GIS)
#65380;遙感圖像處理#65380;全球定位系統(GPS)#65380;模式識別#65380;可視化等相關研究領域而形成的一個分支學科,也稱為空間數據挖掘和知識發現(Spatial Data Mining and Knowledge Discovery, SDMKD)#65377;地理信息系統是計算機科學#65380;地理學#65380;測量學#65380;地圖學等多門學科綜合的技術#65377;其基本技術是空間數據庫#65380;地圖可視化及空間分析,而空間分析是GIS的關鍵技術#65377;主成分分析(Principal Component Analysis)也是數據挖掘中的一種方法#65377;它是將分散在一組變量上的信息集中到某幾個綜合指標(主成分)上的探索性統計分析方法,即利用主成分來描述數據集內部結構,起到了數據降維的作用#65377;空間數據挖掘和知識發現的目的在于從數據庫中挖掘事先未知且潛在有用的知識[1]#65377;因此本文將結合GIS中的空間分析方法(主要為空間自相關分析)和主成分分析方法來分析我國人口壓力及空間分布模式問題,以期獲得潛在的知識#65377;
人口壓力是指人口的非適度狀態,即人口系統與經濟#65380;社會#65380;資源和環境等系統的不適應或不協調,既包括人口過剩,又包括人口不足;既包括人口數量對其他系統的壓力,又包括人口質量#65380;人口結構等對其他系統的壓力#65377;因此,可以用人口壓力指標來對我國人口空間分布的合理性進行評價[2]#65377;在參考前人的研究成果后,本文提出人口經濟壓力(為敘述簡便起見,以下均簡稱為人口壓力)的概念#65377;它是衡量人口規模與經濟承載能力之間是否協調的指標#65377;同時從GIS的觀點出發,提出人口壓力空間分布不同于傳統人口壓力研究#65377;該研究是人口空間分布研究范圍的延伸#65377;其目的是為了明確各個區域人口壓力分布態勢,為國家相關部門制定政策提供參考#65377;因此在本文人口壓力空間分布評價研究中,不僅需要進行人口壓力評價,更需要運用空間數據挖掘理論中的GIS技術對評價結果的空間分布特征進行研究#65377;
1評價指標的選取
具體評價指標可以從以下四個方面選取:
(1)人口增長壓力#65377;選取指標為人口自然增長率#65377;指標數值越大壓力越大;反之壓力越小#65377;
(2)人口生活水平壓力#65377;其選取指標包括:人均國民收入,指標數值越大壓力越小,反之壓力越大;人口撫養比,指標數值越大壓力越大,反之壓力越小;預期壽命,指標數值越大壓力越小,反之壓力越大#65377;
(3)人口素質壓力#65377;選取指標為15歲以上文盲半文盲比例#65377;指標數值越大壓力越大,反之壓力越小#65377;
(4)人口就業壓力#65377;城鎮登記失業率#65377;指標數值越大壓力越大,反之壓力越小(由于資料的緣故,沒有農村的失業率數據)#65377;
2研究方法
2.1原始數據標準化方法
由于各個指標屬于不同數量級,沒有統一的度量標準,需要對指標進行標準化#65377;但是原始數據中存在數值越大越優越和越小越優越兩類,因此對這兩類指標應該分別有不同的標準化方法#65377;本文采用的方法如下:
設fik(i=1,2,…,n)為第i個地區中第k個指標的原始數值#65377;設fk1為第k個指標在所有方案中的最小值,而fk2為第k個指標在所有方案中的最大值,則可用下式將原始數據變換成無量綱值#65377;
數值越大越優越型:
數值越小越優越型:
2.2人口壓力評價方法