張 茜,劉 淼
(伊犁師范學院數學與統計學院,新疆伊寧835000)
伊犁州直縣(市)2013年經濟發展保持平穩增長態勢,對新疆的政策實踐起到了重要的意義,但在經濟運行中仍存在一些突出的問題.本文主要研究了伊犁州直10個縣(市)包括伊寧市、奎屯市、伊寧縣、霍城縣、察布查爾錫伯自治縣、鞏留縣、新源縣、尼勒克縣、昭蘇縣、特克斯縣的綜合經濟情況,依據《伊犁哈薩克自治州2013年年鑒》《伊犁調查年鑒》等資料和相關統計公報收集了伊犁州直10個縣(市)2013年綜合經濟數據,依據因子分析的原理對其進行實證分析,得出伊犁州直縣(市)的經濟運行狀況,并對出現的問題提出相應的改進意見和建議.
因子分析的本質在于通過研究諸多原始變量之間的內部關系,利用諸多變量之間存在的共同因子簡化變量間的復雜關系,即將諸多變量均分解為公共因子和單一因子兩部分,根據多元統計分析的原理,通過剔除公共因子,由較少的相互獨立的因子變量來反映原始變量的信息,具體表示為

其中,p個原始變量分別為x1,x2,x3,…,xp,且均已被標準化,因子變量分別為F1,F2,F3,…,Fm(m<p),即X=AF+aijε,這里F是公共因子,A表示因子載荷矩陣,因子載荷aij表示原始變量xi在因子Fj上的負荷,原始變量不能被因子變量解釋的部分記作特殊因子ε,即殘差部分.
首先,對原始變量之間的相關系數矩陣進行分析,找出少數幾個可以影響所有原始變量的復合變量,并用其描述出諸多原始變量間的關系,這種R型因子分析所得變量間的關系可通過因子載荷矩陣實現.依據每個原始變量與公共因子相關性的大小,按相關性較高的變量屬于同類、相關性較低的變量屬不同類的原則進行完全分類,根據公共因子所包含變量的特點對因子進行解釋命名.
對9個變量進行分析,X1為第一產業生產總值,X2為第二產業生產總值,X3為第三產業生產總值,X4為各縣市民族人口數,X5為社會消費品零售總額,X6為社會固定資產總投資,X7為在崗職工工資總額,X8為建筑施工企業總產值,X9為地方財政收支情況.
運用spss17.0統計軟件進行因子分析,從表1可知有9個指標的數據,故先進行9個指標數據的標準化處理,然后進行KMO檢驗和球形Bartlett檢驗,檢驗結果如表2所示,KMO統計量的值為0.641,Bartlett檢驗的卡方統計量值為136.089,由此可知表1各項指標數據是適合進行因子分析的.

表1 9個指標數據統計表

表2 標準化處理檢驗結果KMO and Bartlett’s Testa
1.2.1 提取公共因子
根據主成分分析方法的原理,如表3所示,前兩個公共因子特征值的累計方差貢獻率達到了88.334%,故只需對前兩個主因子進行分析即可.

表3 總方差解釋表
1.2.2 因子命名及得分
由于因子負荷的大小反映了某個指標對某個公共因子重要程度,故需要通過計算因子載荷矩陣確定公共因子與各個原始指標間的相關系數.根據因子載荷矩陣(表4)可以看出,公共因子與各變量間的差異不明顯,所以要進一步進行旋轉,選擇方差最大化進行因子旋轉,得到旋轉后的因子載荷矩陣(表5).由表5,可將指標集分為兩個主因子,第一主因子在地方財政收支情況、社會消費品零售總額、第三產業生產總值方面顯著;第二因子在第一產業生產總值、各縣市民族人口數方面顯著.

表4 因子載荷矩陣

表5 旋轉后的因子載何矩陣

表6 因子得分系數矩陣
根據表6得到因子分析模型和因子得分函數為

兩個公共因子從各方面反映了各地區的經濟狀況,由于λ1=73.663,λ2=14.681,根據,即可得到各縣市綜合經濟因子得分(表7).

表7 各地區綜合經濟公共因子得分及綜合得分排序
聚類分析是研究“物以類聚”的一種多元統計分析方法,根據樣本的多個觀測指標,對事物進行分類.目前被廣大學者廣泛應用的是譜系聚類法,先將各變量各自分類,再將上述指標中最接近的聚為一類,以此類推,直至將所有子類聚為一類,進而得到了一個根據相似性強弱聚集在一起的一個譜系大類.
通常用來定義樣本距離的方法有歐氏距離、絕對距離、Minkowski距離等,其中歐式距離最為常見.我們采用組間平均數類間法對表7作聚類分析得到譜系圖(圖1)

圖1 譜系圖
通過選取2013年伊犁哈薩克自治州綜合經濟的9個主要指標數據,分別根據因子分析方法和聚類分析的原理對所選數據進行了實證分析,得到了影響綜合經濟變動水平的兩個主要因子,并結合聚類分析對變動水平因子進行聚類,得到如下結論.
伊犁州直10個縣(市)中伊寧市、奎屯市的第一個公因子得分和綜合得分排名都在第一位,而第二個公因子排名卻靠后,說明這兩個城市由于各民族人口數較少,不以農林漁業方面的發展為主;另外伊寧市、奎屯市又是伊犁州政治、經濟、文化的中心,代表著伊犁州整體經濟發展的風向標,在伊犁州發揮著不可替代的作用;伊寧縣、霍城縣、新源縣是面積較大的農業大縣,擁有得天獨厚的生態資源,因此其第二個公共因子得分較高;察布查爾縣、昭蘇縣、尼勒克縣、鞏留縣、特克斯縣離首府伊寧市較遠,受交通資源等環境因素制約,經濟發展相對落后.分類結果如表8所示.

表8 分類結果
由綜合得分可以看出,各地區應充分利用自己的資源,如新源縣應繼續加大旅游業的發展,伊寧縣應發展農牧業的資源優勢等,繼續推行西部大開發戰略,縮小各地區的差異,從而推進伊犁州整體經濟協調發展.
[1]張潤楚.多元統計分析[M].北京:科學出版社,2006.
[2]伊犁州統計局.伊犁州統計年鑒(2013)[Z].2014.
[3]梅長林,周家良.實用統計方法[M].西安:西安交通大學,2005.
[4]劉淼,姜福成.基于面板數據的伊犁州直縣市經濟社會發展因子的實證分析研究[J].數學的實踐與認識,2013(43):25-29.
[5]石宏景.基于因子和聚類分析的居民消費價格變動水平評價[J].西南農業大學學報,2012(10):23-27.
[6]吳棟,李樂夫,李陽子.近幾年居民消費結構統計分析的研究綜述——關于因子分析和聚類分析的應用[J].數理統計與管理,2012(26):776-781.
[7]汪磊,羅蓉,王志凌.因子聚類分析在西部中心城市經濟發展評價中的應用[J].經濟研究導刊,2011(10):152-154.
[8]王娜娜.基于面板數據的江蘇城市經濟社會發展水平評價[J].中國證券期貨,2012(1):118-119.