李崇實,樊金拴
(西北農林科技大學,陜西 楊凌712100)
生態旅游是二戰以后旅游業中增長最快的部分,已成為當今世界旅游業發展最快的熱點,世界各地區和國家都在積極發展生態旅游,中國生態旅游發展時間較短,但近幾年取得了巨大的發展。然而,隨著生態旅游業的蓬勃發展,與之形成反差的是旅游管理質量和水平的落后,其中一個關鍵性衡量指標就是旅游預測與發達國家相比還處于學習階段。所以生態旅游的需求預測應該是且必須是今后研究的一個重要課題。如何建立科學的可操作性的生態旅游預測模型,準確地把握生態旅游需求的發展趨勢,以制定適合生態旅游調控政策,對生態旅游的持續健康發展具有重要意義。
由于旅游具有很強的易波動性,故而很難從宏觀上把握其發展趨勢。因此在研究旅游需求趨勢時必不可少地需要使用數學方法與運用模型。國外專家學者對旅游需求的預測主要以定量分析為主,分析方法包括回歸模型法、時間序列法、計量經濟學模型、德爾菲法等等,這些傳統的技術分析方法取得了較大的成就。但是當系統具有較強的非線性時,這些方法的適應性卻是有限的,在實際的預測環境中常常失去效用,因此用這些傳統的預測方法解決這類問題十分困難。為此,本文采用BP神經網絡模型,通過改進算法,提出收斂性較快、網絡泛化能力強的神經網絡模型,并對太白山保護區未來10年來的旅游數據進行了預測分析,這對于全面深刻了解太白山保護區生態旅游需求,充分挖掘潛在客源市場,深化生態旅游消費市場的開拓有所裨益,同時也可以為太白山生態旅游的發展提供依據。
人工神經網絡[1,2](Artificial Neural Network)常常簡稱為神經網絡(ANN),是以計算機網絡系統模擬生物神經網絡的智能計算系統,是對人腦或自然神經網絡的若干基本特性的抽象和模擬,是智能控制領域的一個新的分支,為解決復雜的非線性、不確定性、不確知系統的控制問題開辟了一條新的途徑。它因為具有函數近似、數據聚集、模式分類、優化計算、概率密度函數估計等功能,在工程領域得到較多的應有。而目前,人工神經網絡可以用來解決模式信息處理和模式識別、控制優化、信息的智能優化處理、復雜控制、信息控制、故障診斷這幾類問題。
反向傳播網絡[3](Back-Propagation Network,簡稱BP網絡)是1986年由Rumelhart和McCelland為首的科學家小組提出,將W-H學習規則一般化,對非線性可微分函數進行權值訓練的多層網絡。BP網絡能學習和存貯大量的輸入-輸出模式映射關系,而無需事前揭示描述這種映射關系的數學方程。它的學習規則是使用最速下降法,通過反向傳播來不斷調整網絡的權值和閾值,使網絡的誤差平方和最小。BP神經網絡模型拓撲結構包括輸入層(input)、隱層(hide layer)和輸出層(output layer)(圖1)。

圖1 BP神經網絡結構示意圖
如圖1所示,一個BP神經網絡由輸入層、輸出層和至少一個隱層組成,各層包含一個或者多個神經元,相鄰兩層神經元之間通過可調權值相連接,且各神經元之間沒有反饋。BP算法由信號的前向計算(正向傳播)和誤差信號的反向傳播2個過程構成。正向傳播時,傳播方向為輸入層→隱層→輸出層,每層神經元的狀態只影響下一層神經元。若在輸出層得不到期望的輸出,則轉向誤差信號的反向傳播流程。誤差的反傳是將輸出誤差以某種形式通過隱層向輸入層反傳,并將誤差分攤給各層的所有單元,從而獲得各層單元的誤差信號并將其作為修正各單元權值的依據。通過這2個過程的交替進行,在權向量空間執行誤差函數梯度下降策略,動態迭代搜索一組權向量,使網絡誤差函數達到最小值,從而完成信息提取和記憶過程。
2.1.1 旅游者人數 旅游者人數是指旅游目的地國家或地區在一定時期內所接待的旅游者總人數,主要用來衡量旅游者對旅游產品的需求總量狀況。
2.1.2 旅游者停留天數指標 旅游者停留天數分為旅游者停留總天數和旅游者人均停留天數。旅游者停留總天數是指一定時期內旅游者人次與人均過夜數的乘積;旅游者人均停留天數是指一定時期內旅游者停留天數與旅游者人次的除數。
2.1.3 旅游者消費指標 旅游者消費指標分為旅游者消費總額和旅游者人均消費額。旅游者消費總額是指一定時期內旅游者在旅游目的地國家或地區的全部貨幣支出,如旅游者在旅游過程中支出的餐飲費、住宿費、交通費等;旅游者人均消費額是指一定時期內旅游者消費總額與旅游者人次之比。
衡量一個地區旅游需求狀況,可以從該地區的旅游需求總量和旅游消費總額2個指標考慮。因此,本文選擇反映旅游需求的基本指標是以上山游客人數作為預測對象,其余預測方法同理。
2.2.1 傳遞函數的選擇 BP網絡通常有一個或多個隱含層,該層中的神經元均采用sigmoid型傳遞函數,輸出層的神經元則采用線性傳遞函數,整個網絡的輸出可以取任意值。通過訓練BP網絡時發現,傳遞函數使用tansig函數時要比logsig函數的誤差小。于是在以后的訓練中隱層傳遞函數改用tansig函數,輸出層傳遞函數仍選用purelin函數。
2.2.2 結構模型
(1)網絡的層數。已經證明:三層BP網絡可以實現多維單位立方體Rm到Rn的映射,即能夠逼近任何有理函數。這實際上給了一個設計BP網絡的基本原則。增加層數可以更進一步降低誤差,提高精度,但同時也使網絡復雜化,從而增加網絡權值的訓練時間。所以一般情況下,應優先考慮增加隱含層的神經元個數。本研究采用一個隱含層的3層BP模型。
(2)各層的神經元數。神經網絡的輸入層和輸出層的節點數是由求解問題本身以及數據的表示方式綜合確定的。根據旅游需求的已有數據,確定輸入層的神經元個數為2,輸出層的神經元個數為1。
網絡訓練精度的提高,可以通過采用一個隱含層而增加神經元數的方法來獲得,這在結構的實現上要比增加更多的隱含層簡單得多。但是隱層節點數對網絡的泛化能力有很大的影響。節點數太多,傾向于記住所有的訓練數據,包括噪聲的影響,反而降低了泛化能力;節點數太少,不能擬和樣本數據,沒有較好的泛化能力。所以我們要選擇合適的節點數。通過多次試驗,確定隱含層結點個數為8。
(3)數據的獲取。本文數據來自《太白山自然保護區生物多樣性研究與管理》《太白山自然保護區(2011—2020)十年總體規劃》及太白山保護區各保護站生態旅游數據,見表1。

表1 太白山自然保護區1998—2010年生態旅游人數
為了提高訓練速度和靈敏度以及有效地避開激活函數的飽和區域,一般要求輸入數值在0—1之間。如不對數據進行預處理,預測結果誤差較大,訓練時間過長。本課題將對數據乘以10-4做歸一化處理,所得結果如下:
p=[0.138 0 0.167 0 0.366 0 0.506 0 0.570 0 0.523 0 0.552 0 0.600 0 0.650 0 0.573 0;0.167 0 0.366 0 0.506 0 0.570 0 0.523 0 0.552 0 0.600 0 0.650 0 0.573 0 0.490 0]
(4)網絡設計。在進行建模時,根據采樣方法,將數據分為11組,構成訓練和測試樣本集,其中前10組為網絡訓練樣本集,后一組為網絡測試樣本集。用1998—1999年、1999—2000年、2000—2001年……2007—2008年的數據作為神經網絡的輸入,用2000年、2001年、2002年……2009年的數據作為理想輸出,組成樣本集對網絡進行訓練,直到網絡設置的誤差預期為止,然后保存網絡并用網絡預測隨后幾年的旅游人數。

圖2 訓練誤差曲線
即輸入層節點2個,輸出層節點為1個。根據實驗,確定隱含層節點為8個,因此,BP網絡結構為:2-8-1。用MATLAB神經網絡工具箱中的函數TRAINGDM進行訓練,當訓練到570次的時候,誤差達到要求,如圖2所示。
為了檢驗網絡對未知樣本的預測效果,也就是網絡的泛化能力,把2008—2009年的數據輸入訓練好的網絡中得到預測值,見表2。

表2 2010年太白山自然保護區生態旅游人數實際值與預測值的比較
由對照表中的實際值和預測值可以看出,神經網絡給出的預測結果很接近實際值,絕對誤差4.45%,誤差較小,驗證了該模型的可行性。
利用已建立好的神經網絡模型預測未來幾年太白山保護區生態旅游發展趨勢,并將結果反歸一化,如表3。

表3 太白山自然保護區未來10年旅游發展趨勢
4.1 以太白山自然保護區生態旅游建立預測模型得出未來10年生態旅游的發展趨勢,為日后的管理決策提供了依據。
4.2 采用BP神經網絡建立的預測模型,要對輸入的原始數據做預處理,這樣能夠加快收斂速度,縮小誤差范圍,從而得到更好的預測效果。
[1]徐麗娜.神經網絡控制[M].哈爾濱:哈爾濱工業大學出版社,2003
[2]朱大奇.人工神經網絡研究現狀及其展望[J].江南大學學報:自然科學版,2004(1):103-110
[3]周政.BP神經網絡的發展現狀綜述[J].山西電子技術,2008(2):50-54