黃文霞 李民



摘? 要: 本文主要分析北京、天津、河北、山西、遼寧、吉林、上海、江蘇、浙江、安徽、福建等11個地區的基本設施建設投資、消費價格指數、公共交通人數、AAAA級旅游景點數、住宿、餐飲業服務人數、接待入境旅游人數、旅游外匯收入、園林、綠地面積等8個因素對各地區旅游業發展的影響程度,根據2015年(中國統計年鑒)的相關數據,首先進行相關分析,分析各變量之間的相關性,其次利用多元統計方法中的主成分分析方法和因子分析方法,借助SPSS軟件,提取出3個影響旅游業的主要因素最后構造這3個主要因素與8個可控因素之間的線性方程及綜合得分函數,通過Excel計算出各個地區的綜合得分。
關鍵詞: SPSS;相關分析;主成分分析;因子分析
中圖分類號: TP391. 41? ? 文獻標識碼: A? ? DOI:10.3969/j.issn.1003-6970.2019.01.031
【Abstract】: This paper mainly analyzes the infrastructure construction investment, consumer price index, public transportation number, AAAA-level tourist attractions, accommodation, and accommodation in 11 areas including Beijing, Tianjin, Hebei, Shanxi, Liaoning, Jilin, Shanghai, Jiangsu, Zhejiang, Anhui, and Fujian. According to the relevant data of 2015 (China Statistical Yearbook), the relevant analysis of the number of catering service, the number of inbound tourists, the foreign exchange income of tourism, the garden and the green area will be analyzed and analyzed. The correlation between the variables, and then the principal component analysis method and factor analysis method in the multivariate statistical method, using the SPSS software to extract three main factors affecting the tourism industry, the final construction of these three main factors and 8 controllable The linear equation between the factors and the comprehensive score function are used to calculate the comprehensive scores of each region through Excel.
【Key words】: SPSS; Correlation analysis; Principal component analysis; Actor analysis
0? 引言
隨著我國的改革開放和繁榮發展,各地區旅游人數逐年增多,如何更好的發展旅游業是各地區面臨的一個重要課題。地區基礎設施的完善,經濟的發展以及旅游資源的科學開發利用,管理水平的提高對旅游業的發展至關重要。本文利用2015年《中國統計年鑒》[3] 11個地區的基本設施建設投資、消費價格指數、公共交通人數、AAAA級旅游景點數、旅游服務設施情況、接待入境旅游人數、旅游外匯收入、園林、綠地面積這8個因素的數據資料。其中,從南方選取了四個地區,包括江蘇、浙江、上海、福建;從中部選取了兩個地區,包括山西、安徽;從北方選取了五個地區,包括遼寧、吉林、北京、天津、河北。收集的原始數據如表1所示。
1? 相關分析
相關分析是適當的統計指標衡量變量之間相關程度的強弱及相關的方向。相關分析包括了簡單相關分析、偏相關分析和距離相關分析。本文研究所
采用的是簡單相關分析,簡單相關分析是在兩兩變量之間進行的。不同類型的變量數據,應采用不同的相關分析方法。
運用SPSS19.0軟件對表1中的數據進行相關分析,得到Pearson相關系數表如表2所示。
表2給出了Pearson相關系數,它以一個矩陣的形式表示出來。從中可以看出,各變量之間的相關系數(r)都大于或者接近0.5,說明各變量之間是相關的。
2? 主成分分析
主成分分析[4–5]也稱主分量分析,是由霍特林于1993年首先出的。主成分分析是利用降維的思想,在損失很少信息的前提下,把多個指標轉換為幾個綜合指標的多元統計方法。通過主成分分析,可以從事物之間錯綜復雜的關系中找出一些主要成分,從而能有效利用大量統計數據進行定量分析,揭示變量之間的內在關系,得到對事物特征及其發展規律的一些神層次的啟發,把研究工作引向深入。
2.1? SPSS19.0進行主成分分析[6]
根據以對十一個地區8個因素的主成分分析得到,影響各地區旅游發展的第一主成分因素為旅游規模與收入方面的因素。旅游規模的擴大、旅游收入的增加能直接影響到區域旅游事業的發展;其次是區域消費與綠化建設對旅游業的影響,據目前來看,旅游消費對于人們選擇旅游地來說還是一個重要的影響因素。通過各地區的綜合因素得分的排序看到:北京、上海、江蘇、浙江是最強勢的地區,這些地區有著很好的旅游資源與旅游環境。遼寧、福建、安徽這幾個地區在區域消費與綠化建設方面比較有優勢,但是景點建設還不夠完善,旅游收入與規模偏低。天津、河北、山西等地區整體相對薄弱,還有很大的發展空間。
3? 因子分析
因子分析的思想始于1904年查爾斯·斯皮爾曼(Charles Spearman)對學生考試成績的研究。因子分析模型是主成分分析的推廣。它也是利用降維的思想,由研究原始變量相關矩陣內部的依賴關系出發,把一些具有錯綜復雜關系的變量歸結為少數幾個綜合因子的一種多變量統計分析方法。相比主成分分析,因子分析更傾向于描述原始變量之間的相關關系,因此,因子分析的出發點是原始變量的相關矩陣[9]。
運用SPSS軟件對原始數據進行因子分析,初始因子載荷矩陣(見表7)、公因子方差(見表7)。
由表9可知,因子分析一共提取了三個主成分,這三個主成分因子的特征值分別為 ;各因子的方差貢獻率分別為54.293%、、18.657%、13.652%;提取的三個主成分因子的累計方差貢獻率達到86.602%,即說明基本上保留了原來指標的信息。通過旋轉平方和載入,可知主成分1的貢獻率為35.069%,主成分2的貢獻率為33.602%,主成分3的貢獻率為17.931%。
為了解釋方便對因子進行旋轉得到旋轉后的因子載荷矩陣,如表10所示。
其中,因子得分為正值,表示該地區此因子表現高于平均水平;因子得分為負值,表示該地區此因子表現低于平均水平。由表11的分析結果,結合各地區在三個公共因子上的得分和綜合得分,即可對各地區的旅游發展狀況進行評價。綜合得分靠前的地區是江蘇、北京和上海,他們都擁有較好的旅游資源和環境。遼寧、福建、安徽這幾個地區在消費價格指數和園林綠地面積上比較占有優勢,但是景點建設還不夠完善,旅游收入與規模偏低,需要加強景點建設,以吸引更多的游客。而天津、河北、山西等地區整體相對薄弱,還有很大的發展空間。
4? 主成分分析和因子分析的結果對比
根據兩種分析方法的結果,我們可以看出在各主成分(公共因子)所體現的指標略有不同,如表12所示。
從主成分分析和因子分析的綜合排名上看,兩者的排名雖然順序不一樣,但是大概的分段還是一致,北京、上海、江蘇、浙江都是前四名,遼寧、福建、安徽這幾個地區居中,天津、河北、山西這幾個地區靠后,故得出的結論基本一致。
5? 結論
根據本文對這十一個地區8個因素的多元統計分析,可以得到以下結論:
第一,影響各地區旅游發展的主要因素為旅游規模與收入方面的因素,旅游規模的擴大、旅游收入的增加能直接影響到區域旅游事業的發展。
第二,區域消費與綠化建設對旅游業的影響也比較重要,旅游消費對于人們選擇旅游地來說還是一個重要的影響因素。
第三,北京、上海、江蘇、浙江是最強勢的地區,這些地區有著很好的旅游資源與旅游環境。
第四,遼寧、福建、安徽這幾個地區在區域消費與綠化建設方面比較有優勢,但是景點建設還不夠完善,旅游收入與規模偏低。
第五,天津、河北、山西等地區整體相對薄弱,還有很大的發展空間。
參考文獻
何曉群. 多元統計分析[M]. 北京: 中國人民大學出版社, 2004.
賈俊平, 何曉群, 金勇進. 統計學[M]. 北京: 中國人民大學出版社, 2012.
中國國家統計局. 中國統計年鑒[R]. 北京: 中國統計出版社, 2015.
Javed A. Face Recognition Based on Principal Component Analysis[J]. International Journal of Image, Graphics and Signal Processing (IJIGSP), 2013, 5(2): 38.
He Lianghua. Multi-Dimension Principal Component Analy sis based on face recognition[J]. The Journal of New Indus tria lization, 2012, 2(1): 59-65.
何亮. 主成分分析在SPSS中的運用[J]. 山西農業大學學報, 2007(4): 44-46.
何應婷, 等. SPSS統計分析[M]. 北京: 電子工業出版社, 2010.
薛薇. 基于SPSS的數據分析[M]. 北京: 中國人民大學出版社, 2006.
唐功爽. 基于SPSS的主成分分析于因子分析的辨析[J]. 統計教育, 2007(2).
田里. 旅游經濟學[M]. 北京: 科學出版社, 2004.