羅雨婷+林卉



(山東科技大學)
【摘要】本文在寫作前查閱了大量有關第三產業發展方面的資料,大量引用了2015年我國各地區第三產業有關數據,基于多元統計分析中的因子分子法,利用SPSS分析軟件,對各地區第三產業的發展狀況進行了分析。
【關鍵詞】因子分析 SPSS 第三產業
使用軟件:SPSS
一、引言
因子分析是多元統計分析的一種重要方法,其主要特點在于可探索不易觀測或不能觀察的潛在因素。Charles Spearman在1904年發表的“對智力測驗得分進行統計分析”的著名文章,可以說是因子分析的首創,至今它已發展成為多元統計分析中較為成熟的一個分支。因子分析最初應用于教育心理學,現已廣泛應用于社會調查、教育測量、心理分析和成因分析等領域。
二、數據處理
第一步:錄入數據
有以下變量:地區,農林牧漁服務業(x1),交通運輸倉儲及郵電通信業(x2),批發零售業(x3),住宿及餐飲業(x4),金融業(x5),房地產業(x6),衛生及社會福利業(x7),文化、體育和娛樂業(x8),科學研究和綜合技術服務業(x9),其他(x10).
第二步:基本操作, 具體步驟如下:
1.選擇菜單:【分析】→【降維】→【因子分析】。選擇參與因子分析的變量到【變量】框中.
2. 其中,【原始分析結果】表示輸出因子分析的初始解;【系數】表示輸出相關系數矩陣;【反應象】表示輸出反應象相關矩陣;【KMO和Bartlett的球形度檢驗】表示進行巴特利球度檢驗和KMO檢驗.
由于原有變量存在數量級差異,因此選擇“相關性矩陣”進行分析;在【特征值大于】框中輸入“1”,SPSS將提取大于1的特征值;在【輸出】框中選擇輸出“未旋轉的因子解”和“碎石圖”.
其中,【最大方差法】為方差極大法;在【輸出】框中指定輸出與因子旋轉相關的信息,在這里選擇“旋轉解”和“載荷圖”。其中,【旋轉解】表示輸出旋轉后的因子載荷矩陣,【載荷圖】表示輸出旋轉后的因子載荷散點圖。
選中【保存為變量】,表示因子得分被保存在SPSS變量中。在【方法】中選中“回歸”法進行分析計算因子得分。并且顯示因子得分系數矩陣。
三、 結果分析
1.考察原有變量是否適合進行因子分析
由表2-1可知,巴特利特球度檢驗統計量的觀測值為459.095,相應的概率 P-值接近0。如果顯著性水平α為0.05,由于概率P-值小于顯著性水平α,則應拒絕原假設,認為相關系數矩陣與單位陣有顯著差異。同時,KMO值為0.892,根據Kaiser的KMO度量標準可知原有變量適合因子分析。
2.因子的命名解釋
由表4-1可知,x5(金融業),x6(房地產業),x10(其他),x3(批發零售業)在第一個因子上有較高的載荷,可解釋為經濟類指標;其他指標則在第二個因子上有較高的載荷,可解釋為非經濟類指標。與旋轉前相比,因子含義比較清晰。
提取方法:主成份分析。
旋轉方法:Kaiser 標準化最大方差法。
a. 旋轉在 3 次迭代后已收斂。
3.各省市自治區的綜合評價
可利用因子得分變量對地區進行對比研究。
首先,繪制兩因子得分變量的散點圖,如圖所示。
其中,橫軸表示因子變量1,縱軸為因子變量2.
觀察圖可見,山東、上海、江蘇、廣東是較為特殊的點(省市),其他樣本(地區)較相似。山東的第二因子得分最高,表明非經濟類的第三產業增加值遠遠高于其他;第一因子得分居平均值,表明經濟類第三產業增加值與其他地區差異不大。江蘇的兩個因子得分均比較高,都高于平均水平,因此總體上江蘇的第三產業增加值是較高的。廣東的第一因子得分最高,表明經濟類第三產業增加值遠高于其他省市;第二因子得分略低于平均值,表明非經濟類第三產業增加值與其他地區差異不明顯。
四、總結與結論
1.首先通過KMO和巴特利特球度檢驗與相關矩陣,得出變量是否適合進行因子分析,其次要進行檢驗從而得出因子個數。
2.對因子分析模型進行正交因子旋轉(方差極大法)、因子得分,建立初始因子載荷陣從而的出分析結果。
3.根據檢驗結果把因子分析模型的各系數帶入方程后,得到最終的因子分析方程為:
=-0.232x1+0.098x2+0.22x3+0.097x4+0.377x5+0.283x6-0.141x7-0.104x8-0.107x9+0.266x10
=0.397x1+0.072x2-0.057x3+0.074x4-0.248x5-0.13x6+0.312x7+0.28x8+0.262x9-0.111x10
參考文獻:
[1]薛薇.統計分析與SPSS的應用[M].中國人民大學出版社.
[2]國家統計局.中國統計年鑒,2015.