陳清娟 饒婉瑩

[摘 要]隨著居民生活水平的提高,旅游業迅猛發展并成為目前最具活力的產業之一。為了探究我國各省市旅游業影響因素的問題,文章利用國內旅游業1998—2016年的相關數據建立多元線性模型并基于EViews軟件對模型進行回歸、估計、檢驗、修正以及預測。結果驗證了模型的有效性并得出了國內游客人數,住宿和餐營業增加值,居民消費水平是影響國內旅游業收入的主要因素的結論,從而為有關部門制定規劃提供參考。
[關鍵詞]旅游業;多元線性回歸;影響因素
[中圖分類號]F592.7
1 前 言
旅游業作為我國最具朝氣的新興產業之一,在20世紀90年代中后期開始得到跨越式發展,目前已經形成了世界上最大的國內旅游市場。面對旅游業帶來的積極收益,地方政府期望通過加大投資旅游產業來帶動區域經濟轉型升級。為了保證投資能帶來明顯的效益,使之成為各個省市新的經濟增長點,需要找到影響旅游業發展的因素,對癥下藥,從而在激烈的旅游市場競爭中保持優勢。
因此,文章對中國各省市的旅游業影響因素開展定量的研究對提升地方旅游產業質量,實現資源要素的高效配置具有一定的現實意義。
2 文獻綜述
目前,國內學者已經采用了不同的模型方法對旅游業影響因素的相關問題展開了諸多研究。如黃芬芬和胡宏昌[1]利用主分量曲線回歸的方法建立了影響中國旅游收入因素的模型。具體到省份的研究,甘俊偉等[2]基于DEMATEL方法確定了對川藏旅游產業競爭力起關鍵性作用的因素。申鵬鵬等[3]等提出DEA-Malmquist指數二次分解模型并將其應用于江蘇省旅游產業影響因素的探究。王兆峰和霍菲菲[4]基于VAR模型對湖南武陵山片區旅游產業生態效率影響因素進行了分析。
此外,就應用研究方面而言,學者們已經將多元線性回歸模型應用在各個研究領域。比如,宋淑麗和齊偉娜[5]基于多元線性回歸對黑龍江省農村剩余勞動力轉移的問題進行了研究。付倩嬈[6]通過在線樣本更新的多元線性回歸建立PM2.5含量預測模型。張朋遠[7]將它用來探究影響職工工資的內部因素以及工資提升空間的影響因素。張福旺和苑會娟[8]通過散點圖對影響空腹血糖的主要因素進行分析和確定。
3 理論模型
本文采用多元線性回歸模型進行分析,它是由一組獨立解釋變量值X1,X2,…,XK預測一個或多個被解釋變量Y的一種統計工具,反映了因變量隨自變量變化時的平均變化程度。在滿足經典假定的條件下,基于最小二乘法的原理可以建立有K-1個解釋變量的多元線性回歸模型的一般形式:
Yi=β0+β1X1i+β2X2i+…+βkXki+μi
i=1,2,…,n (1)
其中n是該多元回歸模型的樣本容量,k是它的解釋變量個數,當k=1時,它被稱為一元線性回歸模型;當k≥2時,它被稱為多元回歸模型。μ是隨機干擾項,代表了多數影響變化的微小因素集合,它是不能由現有變量決定的部分。β0是回歸常數,在參數估計過程中該變量的樣本觀測值一直取1,因此通常被看成是一個虛變量的系數。βk是偏回歸系數,可以解釋為在其他因素不變化的條件下,解釋變量Xj(對任意i的xji)的單位變動對被解釋變量產生βj個平均單位值的影響。
4 數據來源及指標選取
該部分選取的1998—2016年的樣本數據主要分為兩種,其中宏觀經濟類數據來自《中國統計年鑒》,旅游類相關數據主要來自國家旅游局。另外,選取國內旅游收入Y(億元)為被解釋變量并選取幾個相對重要的指標作為解釋變量。它們分別是:
(1)鐵路營運里程X1(萬公里):國內旅游中占據主導地位的是鐵路交通,因此本文選擇鐵路營運里程來描述國內旅客的遠途出行情況和旅游目的地的可到達程度。
(2)就業人數X2(萬人):就業人口表示有經濟來源的人口數量,這些人更有能力承擔旅游的花費,所以也將它作為一個解釋變量。
(3)國內游客人數X3(萬人次):國內游客人數指我國大陸游客一年內在國內旅游的總人次,它從數量上直接表現了國內旅游的規模和水平。
(4)住宿和餐營業增加值X4(億元):旅途中的衣食住行是消費者必須支付的并且占據很大比重的花費。
(5)居民消費水平X5(元):居民的消費水平被認為是居民出游次數以及出游時消費能力高低的決定性因素。
(6)城鎮人口X6(萬人):城鎮居民便捷的交通條件以及日益增長的精神需求增加了出行旅游的概率。
5 實證分析
5.1 模型的建立
為了研究影響旅游業發展的因素,收集了1998—2014年的相關旅游數據進行實證分析。根據Y與X1近似呈現線性關系的散點圖,其余5個變量的散點圖與X1類似,構建多元線性回歸分析模型:
Y=C+β1X1+β2X2+β3X3+β4X4+β5X5+β6X6+μ (2)
利用EViews軟件進行參數估計,可以得到模型估計的結果為:
Y= -136282.2+295.2786X1+2.291275X2+0.063358X3-1.938149X4+2.640438X5-0.826431X6
s=(22025.78)(258.7339)(0.386828)(0.008299)(0.312751)(0.227058)(0.141686)
t=(-6.187396)(1.141244)(5.923242)(7.634534)(-6.197094)(11.62894)(-5.832820)
R2=0.999794 S.E=162.4829 F=8083.889 DW=2.071798
由估計結果可以得出擬合系數R2為0.999794,修正的擬合系數為0.999670,F統計值為8083.889,這說明模型總體是顯著的而且擬合的效果較好。當給定顯著性水平α=0.05時,t分布表顯示其臨界值t0.025(10)=2.2281,可以看出X2,X3,X4,X5,X6都通過了t檢驗,這表明選定的這5個變量對國內旅游收入具有較好的解釋作用。但是X1沒有通過t檢驗,這種結果可能是由多重共線性引起的。
5.2 多重共線性檢驗
文章利用相關系數矩陣法來判斷該模型是否存在多重共線性,可以發現各個解釋變量的相關系數都在0.85以上(>0.8),因此可以判定該模型確實存在多重共線性。因此,采用逐步回歸法對多重共線性進行修正,解釋變量X1,X2,X6被剔除,因此模型修正為:
Y=C+β3X3+β4X4+β5X5+μ (3)
5.3 異方差檢驗
基于懷特檢驗法,本文對修正后的模型進行異方差檢驗。得到檢驗結果為nR2=15.87685,由于χ20.05(9)=6.919,χ20.05(9)=16.919>nR2=15.87685,因此模型中的隨機誤差項沒有異方差性。另外,可以觀察到nR2的相伴概率P值為0.0695,它大于給定的顯著性水平α=0.05,則接受不存在異方差的原假設,因此無須用加權最小二乘法對其進行修正。
5.4 自相關檢驗
本研究利用杜賓—沃森檢驗法進行一階自相關的檢驗可知DW值為1.957324。在給定顯著性水平為α=0.05的條件下,因為dL=0.90 為了進一步驗證結果,采用拉格朗日乘數檢驗法進行模型二階自相關的檢驗,可以得出nR2的相伴概率(即P值)=0.8101>α=0.05的顯著性水平,因此隨機干擾項不存在自相關。此外,又因為RESID(-1)和RESID(-2)對應的P值分別為0.8711和0.8101,都大于顯著性水平,也說明該模型不存在一階和二階自相關,因此不需要對其進行修正。綜上,本文修正后的模型為: 5.5 經濟意義檢驗 進一步對模型參數估計量在經濟意義上的合理性進行檢驗。文章估計的參數β3=0.075891,表示國內游客每增加1萬人,國內旅游收入增加0.075891億元,說明游客數量對旅游收入的影響力度不大。β4=-3.271604表示當住宿和餐飲業增加值每增加1億元,則旅游收入會減少3.271604億元。說明旅游市場競爭激烈,投入過于飽和,反而會降低旅游業的收入。β5=2.440327表示居民消費水平每增加1元,會帶動旅游收入增加2.440327億元,說明消費對國內旅游收入的拉動作用很明顯。 5.6 擬合優度檢驗 文章中可決系數0.999032和調整后的可決系數0.998809都比較高,說明該模型擬合的較好,即國內旅游收入的變動99.88%可以用國內游客人數,住宿和餐營業增加值,居民消費水平作出解釋。 5.7 統計意義檢驗 可以看出F統計量的值為4473.347大于臨界值F0.05(3,13)=3.41,故模型總體是顯著的。但是這并不表示模型中每個變量的影響都是顯著的,因此,有必要對每個解釋變量進行顯著性檢驗,即t檢驗。模型中X3,X4,X5的t統計量分別為5.012425,-18.24872以及7.332611,它們的絕對值都大于臨界值t0.025(13)=2.1604,并且它們對應的P值分別為0.0002,0.0000,0.0000小于給定的顯著性水平α=0.05。因此這幾個解釋變量都通過了t檢驗,說明國內游客人數X3,住宿和餐營業增加值X4,居民消費水平X5都對國內旅游收入Y具有重要影響,應保持在模型中。 5.8 模型預測 為了進一步檢驗該模型的準確性,本文利用我國旅游業2015—2016的數據進行預測,并與實際值進行比較。結合表1可以發現我國2015—2016年的旅游收入保持增長的趨勢,并在2015,2016年分別達到33514.02億元與37381.15億元,這與實際值較為接近。因此該模型可以被認為是有效的并可以用來預估未來幾年的旅游收入。 6 結論及建議 文章利用多元線性回歸模型來研究我國旅游收入的影響因素并得到相關結論。 (1)國內游客人數,居民消費水平都與旅游收入呈現正相關的關系,而住宿和餐飲營業增加值則顯示負相關,這顯示了旅游業競爭激烈化,投入冗余的現象。 (2)鐵路營運里程,就業人數,城鎮人口這3個變量對旅游收入沒有重要影響。因此各個省市在制定旅游業發展計劃時可以降低在這些方面的投入。 (3)模型Y=-4415.391+0.075891X3-3.271604X4+2.440327X5對國內旅游收入具有較好的擬合效果,可以為相關人員在未來進行旅游收入預測時提供參考。 當然本文還存在一些不足之處,如由于數據缺失而使得研究僅限于進行到2016年,期望相關人員在今后可以收集到更多數據從而使得研究更加深入。 參考文獻: [1]黃芬芬,胡宏昌.中國旅游收入影響因素分析——基于主分量曲線回歸[J].統計與管理,2015(2):46-48. [2]甘俊偉,楊龍,李進軍.基于DEMATEL的川藏旅游產業競爭力影響因素研究[J].干旱區資源與環境,2017(3). [3]申鵬鵬,周年興,張允翔,等.基于DEA-Malmquist指數二次分解模型的江蘇省旅游產業效率時空演變及影響因素[J].長江流域資源與環境,2018. [4]王兆峰,霍菲菲.基于VAR模型的湖南武陵山片區旅游產業生態效率影響因素分析[J].中南林業科技大學學報,2018,38(11):142-150. [5]宋淑麗,齊偉娜.基于多元線性回歸的農村剩余勞動力轉移研究——以黑龍江省為例[J].農業技術經濟,2014(4):104-110. [6]付倩嬈.基于多元線性回歸的霧霾預測方法研究[J].計算機科學,2016,43(Z6):526-528. [7]張朋遠.基于多元線性回歸模型下的工資及其提升空間確定的內部影響因素——以474位職員的工資為樣本數據庫分析為例[J].經貿實踐,2018,240(22):46-48,50. [8]張福旺,苑會娟.基于多元線性回歸的空腹血糖影響因素分析方法[J].計算機科學,2018,45(S2):555-557 [9]白娜.影響現代旅游業發展的因素分析[J].中國市場,2016(25):233-234. [10]劉超.區域旅游業競爭力評價模型的構建和影響因素研究——以北京市為例[J].中國市場,2015(29):59-63. [11]張婷婷,李宏勛.基于因子分析法的我國沿海各省市旅游業競爭力比較研究[J].甘肅科學學報,2016,28(2):126-131. [12]時浩楠.中國省域旅游業與城市化協調發展研究[J].合肥:安徽大學,2016. [13]范恒瑞.中國省域旅游業主導性分析[J].南京:南京大學,2012. [14]袁宇杰.中國旅游經濟影響的省際差異與區域特征[J].山東青年政治學院學報,2012,28(1):114-119. [15]王苡安.中國國內旅游業總收入的影響因素分析[J].中國集體經濟,2019(2):14-16.