摘要:文章主要依據2006年的統計年鑒數據,針對2005年全國31個省市自治區直轄市(除港澳臺地區外)的23個主要經濟發展指標。運用因子分析方法得出三個意義較為明確的公因子。然后運用聚類分析方法得到各地區經濟發展層次分布狀況,運用判別分析方法進行分析評價,并根據分析結果,結合實際情況對其根本原因進行了探討。
關鍵詞:因子分析;聚類分析;判別分析:經濟發展
一、引言
當今社會是一個信息爆炸的時代,社會中存在多種不確定性,所以要正確使用數據分析方法進行數據分析,有效提取信息是生活中決策的關鍵。我國經濟發展水平是大家都很關心的問題,它關系到人民的生活水平,社會的發展程度以及國家的綜合國力,因此研究我國各地區的經濟發展水平非常有必要。
因子分析、聚類分析和判別分析是多元統計分析中三個重要的分析方法。本文針對2005年全國31個省市自治區直轄市(除港澳臺地區外)的主要經濟發展指標,先后運用因子分析方法、聚類分析方法和判別分析方法,進行分析評價。
二、文獻綜述
目前,針對區域經濟的研究很多,隨著研究地不斷深入,越來越多的定量方法被引入進來。吳玉鳴在采用因子分析法對我國31個行政區劃的第三產業綜合發展水平進行了評估,提出實施第三產業非均衡協調發展戰略。梁曉俐對全國30個行政區劃的經濟發展水平進行了主成分分析,根據因子加權綜合得分進行分類排序,得到全國的經濟發展水平總體上呈現東高西低的地域分布。這幾篇文章都只是對各地區經濟發展水平進行了排序,并沒有很好地進行分類,不利于看出各個地區經濟發展的快慢情況。陳佳、吳潤衡、劉喜波先后運用因子分析方法和聚類分析方法針對2004年全國31個省市自治區直轄市(除港澳臺地區外)的26個主要經濟發展指標進行分析評價。王維、李仕明、肖磊先后運用因子分析方法和聚類分析方法,對全國31個省、市、自治區的地區經濟發展水平進行動態分析。這幾篇文獻使用的數據都已經比較陳舊,不能反映近幾年的經濟發展。為了彌補以上不足,本文對全國2006年的經濟數據進行分析,首先對所選的經濟指標做因子分析,科學有效地縮減指標規模,得出三個意義較為明確的公共因子,再用聚類分析方法,得到各地區經濟發展層次分布狀況,最后用判別分析方法看所選方法的判斷準確性。
三、樣本數據
本文選取了2005年全國地區23個主要經濟發展指標(數據來源:《中國國家統計年鑒2006》):年底人口數(萬人);就業人員(萬人);職工人數(萬人);地區生產總值(億元);人均地區生產總值(元);商品房銷售額(萬元);竣工房屋面積(萬平方米);房屋住宅銷售面積(萬平方米);職工平均工資(元);旅游外匯收入(百萬美元);社會消費品零售總額(億元);各地區貨物周轉量(億噸公里);各地區貨運量(萬噸);各地區客運量(萬人);城鎮居民平均每人全年總收入(元);農村居民平均每人全年總收入(元);城鎮居民全年最終消費支出(億元);農村居民全年最終消費支出(億元);城鎮固定資產投資(億元);外商投資總額(億美元);稅金總額(萬元);利潤總額(億元);工業增加值(億元)。
四、統計分析
本文采用SPSS11.5進行統計分析。
(一)對原始數據的因子分析和主成分分析
1、KMO檢驗與Bartlett球度檢驗(見表1)。KOM值是用于比較觀測相關系數值與偏相關系數值的一個指標,其值越逼近于1,表示對這些變量進行因子分析的效果越好。本樣本的KOM值為0.792,適合因子分析,而且可以得到比較滿意的結果。而且,Bartlett球度檢驗的顯著性概率為0.000小于顯著性水平0.05,也說明適合因子分析。
c2d435552210947a53af4e7bc50c66fc
2、旋轉后的因子載荷矩陣。利用SPSS提取了三個因子,因為未經旋轉的載荷矩陣中,因子變量在許多變量上都有較高的載荷,為了使因子更具直觀含義,所以運用方差極大法對因子載荷矩陣旋轉。因子1包括年底人口數、就業人員、職工人數、地區生產總值、房屋住宅銷售面積、社會消費品零售總額、各地區貨運量、各地區客運量、城鎮居民全年最終消費支出、農民居民全年最終消費支出、城鎮固定資產投資、利潤總額和工業增加值,主要反映經濟總量和人民生活水平,所以可以命名為經濟總量因子;因子2包括人均地區生產總值、商品房銷售額、竣工房屋面積、職工平均工資旅游外匯收入、城鎮居民平均每人全年總收入、農村居民平均每人全年總收入、外商投資總額和稅金總額,反映的是全社會各方面收入情況,可以命名為收入因子;因子3只有各地區貨物周轉量這一個變量,這個變量對于我國經濟發展具有重要作用,所以可以命名為經濟發展因子。
3、因子得分函數。根據因子得分矩陣,可以得到因子得分函數:

(二)對綜合得分數據的聚類分析
對全國各地區經濟發展水平進行3-6類的聚類分析,類間距離為類間平均鏈鎖法,樣本間距離為歐式距離平方法。通過對比發現分為四類是比較恰當的,能夠體現各省市經濟發展的快慢情況。分成四類時:北京和上海屬于第一類;江蘇、浙江和山東屬于第三類;廣東屬于第四類;其他屬于第二類。我們分析不同類的地區時同樣采用指標平均值。
通過分析各類均值結果,可以得出各類地區所選取的經濟指標方面發展的水平情況,綜合分析就可得出各類地區的發展水平。
(三)對各類進行判別分析
因為本身所選的樣品就比較少,所以沒有從中抽調一些分析,這樣我們可以用交互驗證的方法來判別聚類效果優劣(見表2)。

表2顯示了交互驗證結果。可以看到該判別函數的準確率為100%,交互驗證的結果和自身驗證的結果完全相同,因此該判別函數是較為穩定的。
五、結論
應該說本文的分析結果對于宏觀地考察地區經濟發展狀況以及對各地區制定和調整經濟發展戰略是具有一定的實際意義的。
從因子分析的結果來看,因子l包含了全部信息的65.136%,這說明我國經濟的發展主要是經濟總量的增長。
以下幾個問題值得我們注意:城鎮固定資產投資額的載荷較高,所以投資熱問題是我們一直比較關注的;人口因素的載荷也是比較高,說明人口因素在中國經濟增長中所起的作用不容忽視;交通運輸量相關指標的載荷很大,這說明交通在經濟發展中起了很重要的作用,而且從目前來看,各個城市都比較重視交通的發展。
因子2反映了一個我們現在比較關注的問題——城鄉差距問題。此外,商品房和住房指標的載荷也很突出,說明2005年我國的房地產業的發展非常突出,從目前的形式來看,房地產仍然是非常熱門的。
從聚類分析的結果,可以得出如下結論:2005年,經濟發展最快的省份是廣東;其次是江蘇、浙江、山東三省;發展中等的是北京、上海;其他省份發展相對比較慢。
從判別分析的結果來看,以上分類的結果是比較理想的。
盡管以上分析只是就2005年我國經濟發展水平的評價,但是卻可以從中發現長期以來我國經濟的一些優勢和存在的一些問題,也可以看出一些我國經濟的未來發展趨勢。
由于查找的數據有限,數據雖比之前研究的文獻新,但相對來說也不是最新的,所以有待以后用更新更多的數據進行分