摘要:目前,中國滑雪人口已超過了一千萬,滑雪市場給我國旅游業帶來了一個新經濟增長點,旅游經濟也得到了迅速的發展。尤其遼寧省滑雪旅游產業的已初具規模,滑雪旅游也成為帶動遼寧省發展經濟的重要經濟增長點。但是對于未來滑雪旅游經濟預測研究甚少,而且人們對更先進的預測方法也越來越感興趣。因此,本文提出了基于深度卷積長短記憶神經網絡對旅游需求進行預測。首先利用季節性趨勢自回歸綜合移動平均模型剔除長期線性趨勢,然后利用深度卷積長短記憶神經網絡訓練殘差數據進行短期預測。結果表明,提出的模型具有較好的預測性能。
關鍵詞:滑雪旅游經濟;深度卷積長短記憶神經網絡;自回歸綜合移動平均模型;短期預測
1.引言
隨著全球國際化的影響,滑雪旅游業也處于快速發展的狀態。眾所周知,滑雪旅游業對一個國家的經濟和社會發展的影響是巨大的。它不僅可以商業、貿易和資本投資,而且也為員工創造就業和創業精神和保護文化遺產和文化價值觀[1]。因此,一個可靠的經濟預測模型是必要的,并在旅游規劃中發揮重要作用。準確的預測為更好的旅游規劃和管理奠定了基礎。因此,需要在旅游需求研究中采用更有效的預測技術。
近年來,統計學被廣泛應用于正在研究的滑雪旅游經濟中。在統計方法中,時間序列預測是預測的一個重要領域。它可以分為兩類:線性方法和非線性方法。最常用的線性方法是樸素模型、指數平滑(ES)模型和自回歸綜合移動平均(ARIMA)模型。神經元網絡被許多專家認為是一種很有前途的時間序列預測技術。因此,在過去的幾十年里,已經發表了2000多篇關于神經網絡預測的文章,涵蓋了廣泛的應用[2]。
由于神經網絡的廣為人知,許多作者轉向使用神經網絡來預測時間序列數據。隨著科學的進步,越來越多的方法被使用。組合模型是其中最常用的方法。此外,還提出了支持向量回歸和新型混合系統[3]等方法。他們在優化問題和預測問題上取得了很大的成就,但數據預處理和后期參數選擇問題相對復雜。
在本文中,將最先進的線性模型和深度卷積長短記憶神經網絡結合在一起。比較結果表明,在滑雪旅游需求預測方面,新模型比其他DNN模型表現得更好。
2.提出的滑雪旅游經濟預測模型
時間序列模型解釋了一個變量關于它自己的過去和一個隨機干擾項。近四十年來,時間序列模型被廣泛應用于旅游需求預測。
2.1 ARIMA模型
在將ARIMA模型擬合到原始數據時,ARIMA模型涉及以下四個步驟:
1)識別ARIMA (p, q, d)結構;
2)未知參數的估計;
3)估計殘差的擬合優度檢驗;
4)基于已知數據預測未來結果。
應與正態隨機變量獨立同分布,均值為0,常方差為 。 和 的根都在單位圓之外。根據相關經驗ARIMA模型[14-15]至少應使用50或100個觀測值。
2.2 深度卷積長短記憶神經網絡
在深度卷積長短記憶神經網絡中[4],我們采用預測編碼網絡(PredNet)作為基準骨干架構。PredNet架構由四個主要模塊組成:輸入卷積層、遞歸層、預測層和錯誤表示層。圖1展示了這個體系結構。
RNN允許像存儲內存一樣存儲前一個輸入的效果,并影響下一個步驟的輸出輸入數據必須從預測數據中減去,以在網絡的每一層產生輸出。網絡每一級的減法值作為預測誤差計算,并用反向傳播方法更新網絡的權值。這些誤差值被認為是同一級別卷積LSTM層的輸入,并作為當前級別的輸出或后續級別的網絡輸入。卷積LSTM層由其輸出、卷積LSTM層的下一層輸出和網絡各層的誤差值提供。這個卷積LSTM層將其輸出給卷積層,在網絡的每一層生成預測數據。最后對網絡進行訓練,以減少計算誤差。網絡各層關系的數學公式如式3-6所示。
網絡中所有卷積層、最大池化層和卷積LSTM層的內核大小為3×3。卷積層的步長是1,而max-pooling層的步長是2。每個交叉網絡訓練在150個epoch完成。epoch<75的學習率是0.001,當epoch>75,下降到0.0001。網絡的權值采用Adam算法進行優化。所有實驗都是在Python中使用Keras進行的,硬件平臺是一臺配備了英特爾Core i-7-6700、16GB RAM和NVIDIA GeForce GTX TITAN X GPU的計算機。
3結果及分析
由于經濟的快速增長和滑雪旅游的促進,冬季來遼寧滑雪旅游的人數逐年大幅增加。這里選取2010年11月至2014年11月入境游客。數據集的處理過程:輸入旅游時間序列,描述一個序列圖表,檢查自相關和偏相關,本文網絡模型,給出結果。采集的數據分為兩組:訓練數據和測試數據。
3.1 評價方法
一些定量統計指標如歸一化均方誤差(NMSE)、絕對誤差百分比(APE)、相關系數(R)等。用NMSE和APE來衡量預測值與實際值之間的偏差。NMSE和APE值越小,表示預測值與實際值越接近。采用度量R來測量實際值與預測值的相關性[5]。
3.2 實驗結果
對于具有顯著季節性周期性變化的數據,本文采用SARIMA模型消除線性趨勢。并使用AIC來測試哪一代是最好的。通過SARIMA模型得到沒有線性趨勢的數據,分別用DNN模型和提出的模型對數據進行訓練。我們可以得到DNN模型和提出的模型的結果如下。
如表1所示,我們可以看到本文模型的結果比DNN模型的結果要好得多。為了深入評價DNN模型和SA-D模型的性能,我們計算了測試數據集的APE、NMSE和R,如表2所示。可以看到,本文模型的NMSE、APE和R都比DNN模型好得多。
4 結論
在本研究中,我們提出了一種新的深度卷積長短記憶神經網絡模型,它結合了SARIMA模型。首先,利用遼寧省滑雪旅游組織收集的數據,比較了本文模型和DNN模型;結果表明,本文模型能較好地擬合和預測時間序列數據。并與其他作者的模型進行了對比,驗證了模型的有效性,得到了預期的結果。
參考文獻
[1]H. Song and G. Li, "Tourism demand modelling and forecasting-a review of recent research," Tourism Management,vol. 29, no. 2, pp. 203-220, 2008.
[2]Lin Teng, Hang Li and Shahid Karim. DMCNN: A Deep Multiscale Convolutional Neural Network Model for Medical Image Segmentation [J]. Journal of Healthcare Engineering, 2019.
[3]S. F. Crone and P. C. Graffeille, "An evaluation framework for publications on artificial neural networks in sales forecasting," in Proceedings of the International Conference on Artificial Intelligence (IC-AI '04), pp. 221-227, Las Vegas, Nev, USA, June 2004.
[4]J. Teixeira and P. Fernandes, "Tourism time series forecast with artificial neural networks," Tekhne, vol. 12, no. 1-2, pp. 26-36,2014.
[5]張永安,顏斌斌. 一種股票市場的深度學習復合預測模型[J]. 計算機科學, 2020, v.47(11):263-275.
項目編號:省社科聯2021年度遼寧省經濟社會發展研究課題(2021lslwzzkt-055).
作者簡介:賀佃忱,男(1981—),遼寧沈陽人,沈陽師范大學體育科學學院,講師,博士,研究方向,體育教學。