楊小芬
(西南大學數學與統計學院,重慶400715)
近年來,旅游業對各國的經濟發展,環境保護等有著重要的影響. 隨著我國社會經濟的高速發展,國際地位的顯著提高,我國更加注重旅游業的發展,旅游業已經成為我國第三產業的重要組成部分,許多城市也希望借助旅游業的發展帶動整個社會經濟的發展. 旅游人數是旅游業的重要環節之一,科學準確地預測旅游需求,能夠準確把握其發展趨勢,從而制定相應的政策來確保旅游業健康持續發展,進一步提升我國的綜合實力和國際影響力,同時也促進我國各地區的經濟發展和文化交流.
目前,國內外旅游需求預測的主要方法包括回歸模型、時間序列、BP 神經網絡、灰色模型,指數平滑法、組合模型等,但是哪種方法更好尚無定論,因此要結合實際問題綜合考慮模型的選擇,以達到較高的預測效果. 由于灰色GM(1,1)模型的預測圖形是一條平滑的指數型曲線,所以它不能充分提取數據的波動性,因而對波動性較大的數據序列擬合較差,且預測精度較低. 而馬爾科夫模型的研究對象是一個隨機變化的動態系統,它是根據狀態之間的轉移概率來預測系統未來的發展情況,轉移概率反映了各種隨機因素的影響程度,反映了各狀態之間轉移的內在規律性[1]. 所以,把兩者進行組合,形成一個灰色馬爾科夫模型,其中GM(1,1)模型用來揭示數據序列的發展變化趨勢,而馬爾科夫模型用來確定狀態的轉移規律,從而組合后的模型能充分提取數據中的信息,提高擬合和預測精度.
灰色馬爾科夫模型已經在糧食產量預測,客流量預測,房價預測等方面得到了廣泛應用,但是多數學者在使用灰色馬爾科夫模型時并沒有對用來劃分狀態的序列進行平穩性檢驗和馬氏性檢驗,缺乏嚴謹性. 關于旅游需求的預測,我國學者主要集中在對我國入境游客量或某一地區旅游人數預測的研究,而對國內游客量的預測研究甚少.因此,本文基于灰色馬爾科夫模型,對我國國內游客數進行預測研究,并且在方法的使用上更為科學嚴謹.
選取我國2004-2015 年國內游客數據建立模型,利用2016年和2017年的數據檢驗模型的預測精度,全部數據來源于國家統計局.
1.1.1 灰色GM(1,1)模型
(1)原始數據的檢驗及處理[2]
建立灰色模型之前,首先要對原始數據進行級比檢驗和光滑度檢驗.
設原始數據序列為:

計算光滑比:

對我國2004-2015年國內游客數據進行級比檢驗和光滑度檢驗,發現級比并沒有全部落入(e)=(0.8574,1.1663)范圍之內,且光滑比不是k 的減函數,因此原始數據沒有通過級比檢驗和光滑度檢驗,如表1所示.

表1 2004-2015年原始數據級比檢驗和光滑度檢驗
對我國2004-2015 年國內游客數據做開方處理,并對開方數據進行級比檢驗和光滑度檢驗,級比全部落入(=(0.8574,1.1663)范圍之內,且光滑比是k 的減函數(見表2),兩種檢驗都通過,可進一步對開方數據建立灰色模型.

表2 2004-2015年開方數據級比檢驗和光滑度檢驗
(2)建立灰色GM(1,1)模型
根據灰色模型的理論,利用R編寫程序,對我國2004-2015 年國內游客開方數據建立灰色GM(1,1)模型,并對模型進行殘差檢驗,后驗差檢驗和模型預測.結果如表3所示.

表3 對2004-2015年開方數據建立灰色GM(1,1)模型結果

其中X?(0)(1)=X(0)(1).
②殘差檢驗中,平均相對誤差為1.2668%,模型精度為98.7332%,模型精度較高;后驗差檢驗中,小誤差概率P=1 >0.95,方差比C=0.0770 <0.35,參照表4,可得模型精度等級為優;再計算關聯度r=0.6031 >0.6,模型較好. 所以該灰色GM(1,1)模型通過了三種檢驗.

表4 后驗差檢驗判別參照表
將灰色GM(1,1)模型的擬合值還原后,與真實值比較,利用平均相對誤差計算公式:

計算擬合平均相對誤差為2.5350%,模型精度為97.4650%,模型精度較高.
(3)灰色GM(1,1)模型預測精度的檢驗
利用灰色GM(1,1)模型預測我國2016年和2017年國內游客數據的開方值,并將其還原后和真實值比較,計算預測平均絕對殘差為182.986 4(表5).

表5 灰色GM(1,1)模型預測精度的檢驗
1.1.2 無偏灰色模型
灰色GM(1,1)模型的參數估計值為:

計算無偏灰色模型的參數值為:

則無偏灰色模型的序列預測方程為:

利用無偏灰色模型擬合我國2004-2015年國內游客開方數據,并將擬合值還原,利用式(3)和(4)計算擬合平均相對誤差為2.5316%,模型精度為97.4684%,模型精度較高.
利用無偏灰色模型預測我國2016 年和2017 年的開方值,將預測值還原后和真實值比較,計算預測平均絕對殘差為182.357 0(表6).與灰色GM(1,1)模型相比,降低了0.629 4.

表6 無偏灰色模型預測精度的檢驗
1.1.3 灰色馬爾科夫模型
灰色馬爾科夫模型是利用馬爾科夫模型對灰色模型的預測值進行修正,從而提高擬合和預測精度.具體步驟如下:
①對原始數據建立灰色模型,并求出擬合值X?(0)(k),計算殘差的相對值:

②馬爾科夫模型要求用于劃分狀態的數據序列具有近似平穩的過程,因此,對殘差相對值序列進行平穩性檢驗.
③當殘差相對值序列的平穩性檢驗通過后,對其進行狀態劃分,并確定原始序列所處的狀態.
④計算轉移頻數矩陣和一步轉移概率矩陣,并對序列進行馬氏性檢驗.
⑤如果序列沒有通過馬氏性檢驗,則不能建立馬爾科夫模型;反之,則計算n步轉移概率矩陣來確定下一時刻所處狀態.
⑥利用式(6)修正灰色模型的擬合預測值.

其中,X?(0)(k)為灰色模型的擬合預測值,ε1(k)和ε2(k)分別取序列值所處狀態區間的左端點值和右端點值.
(1)傳統灰色馬爾科夫模型
①利用灰色GM(1,1)模型擬合我國2004-2015年國內游客開方數據,根據式(5)計算出殘差相對值序列.
②利用ADF 方法檢驗得殘差相對值序列為平穩序列(α=0.05),所以可以對該序列進行狀態劃分,如表7所示.

表7 差相對值序列平穩性檢驗(傳統灰色馬爾科夫模型)
③殘差相對值序列的狀態劃分為:E1=(-3.1%,-1%],E2=(-1%,1%],E3=(1%,3%],表8為殘差相對值序列所處狀態.

表8 殘差相對值序列所處狀態(傳統灰色馬爾科夫模型)
④根據殘差相對值序列所處狀態,計算得轉移頻數矩陣和一步轉移概率矩陣分別為:

對序列進行馬氏性檢驗,首先計算邊際概率值:


表9 邊際概率值
表10 統計量χ2=2計算表

表10 統計量χ2=2計算表
狀態1 2 3合計fi1| |||| |||ln pi1 p?1 1.212 3 0.597 8 0.087 0 1.897 1 fi2| |||| |||ln pi2 p?2 0 1.502 3 0.087 0 1.589 3 fi3| |||| |||ln pi3 p?3 0.200 7 0.310 2 0.200 7 0.711 6合計1.412 9 2.410 3 0.374 7 8.395 9
⑤利用式(6)對灰色GM(1,1)模型2004-2015 年開方數據的擬合值進行修正,將修正值還原后,利用式(3)和(4)計算得擬合平均相對誤差為0.8978%,模型精度為99.1022%. 可見,與灰色GM(1,1)模型相比,模型精度提高了1.6372%;與無偏灰色模型相比,模型精度提高了1.6338%.
⑥利用傳統灰色馬爾科夫模型預測我國2016年和2017 年國內游客數,預測平均絕對殘差為11.022 3(表11). 與灰色GM(1,1)模型相比,減少171.964 1;與無偏灰色模型相比,減少171.334 7.

表11 傳統灰色馬爾科夫模型預測精度的檢驗
2016 年和2017 年國內游客數計算的具體步驟如下:
①2015 年的殘差相對值所處狀態為1,故初始向量為v0=(1,0,0),由一步轉移概率得到2016 年的狀態分布為:

由灰色GM(1,1)模型預測出2016年的開方數據為67.875 94,對該值進行修正得:

將此修正值還原后,得到我國2016年國內游客為4 424.840 8百萬人次.
②計算兩步轉移概率矩陣. 因為殘差相對值序列平穩,所以可以視為齊次馬氏鏈,n步轉移概率矩陣就是一步轉移概率矩陣的n次方.
計算得兩步轉移概率矩陣為:

由兩步轉移概率得到2017年的狀態分布為:

所以2017 年所處的狀態為max(0.5556,0.1111,0.3333),即為狀態E1:(-3.1%,-1%].
由灰色GM(1,1)模型預測出2017年的開方數據為72.102 91,對該值進行修正得:

將此修正值還原后,得到我國2017年國內游客為4 993.114 5百萬人次.
(2)無偏灰色馬爾科夫模型
①利用無偏灰色模型擬合我國2004-2015年國內游客開方數據,根據式(5)計算出殘差相對值序列.
②利用ADF 方法檢驗得殘差相對值序列為平穩序列,所以可以對該序列進行狀態劃分,如表12所示.

表12 殘差相對值序列平穩性檢驗(無偏灰色馬爾科夫模型)
③確定劃分狀態為:E1=(-3%,-1%],E2=(-1%,1%],E3=(1%,3%],表13 為殘差相對值序列所處狀態.

表13 殘差相對值序列所處狀態(無偏灰色馬爾科夫模型)
④根據殘差相對值序列所處狀態,計算得轉移頻數矩陣和一步轉移概率矩陣分別為:

⑤利用式(6)對無偏灰色模型2004-2015年開方數據的擬合值進行修正,將修正值還原后和真實值比較,利用式(3)和(4)計算擬合平均相對誤差為0.8838%,模型精度為99.1162%. 與傳統灰色馬爾科夫模型相比,模型精度提高了0.0140%.
⑥利用無偏灰色馬爾科夫模型預測我國2016年和2017年國內游客數(計算方法同傳統灰色馬爾科夫模型),預測平均絕對殘差為7.101 6(見表14).與傳統灰色馬爾科夫模型相比,減少了3.920 8.

表14 無偏灰色馬爾科夫模型預測精度的檢驗
通過比較各模型的精度,擬合平均相對誤差和預測平均絕對殘差,選出相對最優模型為無偏灰色馬爾科夫模型(表15).

表15 各模型精度比較
繪制無偏灰色馬爾科夫模型的擬合預測圖,發現擬合值與真實值幾乎完全重合,無偏灰色馬爾科夫模型充分提取了原始數據中存在的波動性.利用無偏灰色馬爾科夫模型預測我國2018-2020年的國內游客數分別為5 639.366 8 百萬人次,6 363.854 百萬人次,7 181.415 7百萬人次,表明我國未來三年國內游客數仍呈現增長趨勢(圖1).
在對我國2004-2015年國內游客數據建模的實例中,與灰色GM(1,1)模型和無偏灰色模型相比,傳統灰色馬爾科夫模型和無偏灰色馬爾科夫模型的建立,都取得了非常高的擬合和預測精度. 尤其是無偏灰色馬爾科夫模型,模型精度為99.1162%,擬合平均相對誤差為0.8838%,它充分提取了數據的發展趨勢和波動性;同時也取得了較高的預測效果,預測平均絕對殘差為7.101 6. 因此,在預測旅游人數時可以考慮該模型;同時在研究人口問題,或是數據序列波動比較大的問題時,都可以嘗試擬合灰色馬爾科夫模型來充分提取已知數據中的信息,還可以對其進行修正以獲得更高的擬合和預測精度,從而更好地掌握和解決實際問題.

圖1 無偏灰色馬爾科夫模型擬合預測圖
從預測結果來看,我國2018-2020 年的國內游客數分別為5 639.366 8 百萬人次、6 363.854 百萬人次、7 181.415 7 百萬人次,數據呈現增長態勢. 國家統計局最新公布的2018年國內游客數為5 540百萬人次,2018 年的模型預測值比實際值高99.366 8 百萬人次,相對誤差為1.7936%. 因此,無偏灰色馬爾科夫模型的實際預測效果很好.