韓燕妮
(咸陽職業技術學院財經學院,陜西 咸陽 712000)
國家產業結構調整和國民收入的逐步提升讓旅游產業成為國民經濟中的重要組成部分[1]。農業觀光旅游作為一種面向現代城市人的新興旅游方式,各級地方政府都對其投入了大量資源。面對農業觀光旅游產業的發展,如何客觀有效地對農業觀光旅游景點進行競爭力評價顯得尤為重要。戴湘毅等[2]從政策支持、經濟情況、歷史文化、基礎設施建設、產業規模5 個角度來構建農業觀光競爭力評價指標。冼煒軒等[3]通過SPSS 軟件,運用最鄰近距離分析法、核密度估計空間分析法和數理統計方法對密云區鄉村休閑旅游的競爭力進行評價。Wardana 等[4]采用問卷調查法并使用SEM-PLS 進行數據分析,得出政策支持是鄉村旅游競爭力的重要因素。Jia等[5]研究基于修正邁克爾波特鉆石模型的城鎮級鄉村旅游經濟力評價與發展分類模型。國內學者目前對農業觀光旅游競爭力評價的研究大多數還處于比較初級的階段,采取的方法也多是調查問卷和數理統計方法,旅游競爭力評價指標設計也大多采用傳統旅游業的競爭力評價指標,不能展示農業觀光旅游的特點。針對這些不足,本研究用一種改進的遺傳神經網絡來構建競爭力評價模型,并引入7 種綜合指標來構建農業觀光旅游競爭力評價體系,以期提高評價的客觀性和準確性。
遺傳算法具備很強的隨機性,在解決變量較多且混合整數非線性規劃特征的問題時容易陷入局部最優解,收斂質量差,離散變量多次變化[6]。針對以上問題,本研究對傳統遺傳算法進行改進:擴大種群規模并提升種群多樣性;采用自適應交叉、變異分布指數以提升算法收斂性;采用二階段求解方式簡化問題,降級計算難度。擴大種群數量可以有效提升種群多樣性,改善算法收斂精度低和收斂速度慢的問題。首先對標準遺傳算法所有個體變量進行歸一化處理,見式(1)。在式(1)中,xmax、xmin分別為該變量的最大值、最小值。

此時整個種群的離散程度見式(2)。

式(2)中,D是整個種群的離散程度,為歸一化后變量x在j節點的權重,i、j分別是輸入層和輸出層的節點個數,x*ij是輸入層到輸出層的權重,n為變量的個數,NP是種群的數量。
設交叉分布指數為ηc,其取值和種群離散程度相關。由于初始種群是均勻分布的,此時種群離散程度D0最大,對應ηc,min,隨后,ηc與D成反比。在極端情況下,全部個體都收斂于全局最優解,此時D=0,對應ηc,max,每次迭代都會對D進行更新,最終的自適應交叉分布指數見式(3)。

為了加大現有搜索范圍,還要進行變異操作,變異分布指數見式(4)。

二階段求解方法將時間劃分為4 個相等的片段,在第一階段,將時間片段1 和時間片段3 視為一個時間片段進行聯立求解,得到第一階段的最優解。以此來構建出時間片段2 和時間片段4 的初始種群,然后再將時間片段2 和時間片段4 視為一個時間段,以第一階段的最優解作為初始種群進行聯立求解,見式(5)。

式(5)中,βnt是0~1的隨機數,xtn是第t個時間片段的第n個變量,σt是根據分布式變化大小設置的偏置變量,以保證初始種群能靠近最優解。此時再利用自適應遺傳算法進行二階段求解,即T2 和T4聯立求解,最后將2 個階段的解結合,就能得到最優解。二階段求解方法將求解次數減少1/2,且在二階段求解時能節約大量迭代時間,加速求解。根據整個改進算法流程,收斂條件的判斷條件為迭代次數是否大于m代以及歷史最優個體是否保持n代不變。由于在極端情況下,生成的某個個體會非常接近最優解,會導致在初始n次迭代都不能產生更加優秀的個體而結束流程,因此必須設置一個迭代次數m。將2 種收斂條件結合能夠有效提升最優解的上限并能節約計算時間。增加遺傳算法的種群數量能夠增強算法的性能,但會大幅度增加計算時間,而二階段求解法并不能完全解決這一問題。為了減少計算時間,還需要對遺傳算法進行并行處理。遺傳算法具有天然并行性,并行機也比較普及。常見的并行模型有主從模型、孤島模型、領域模型和混合模型[7]。此次研究采用混合模型,對多核架構性能的評價主要是用加速比,求加速比的方式是用串行時間除以并行時間。目前的評價模型主要為固定任務模型和固定時間模型[8]。假設有p個并行機組成1個性能更高的并行化運行平臺,每個運行節點的性能為1,p個節點所創建的串行性能為perf(p)。加速比見式(6)。

式(6)中,T1是串行計算機的時間,Tp是該算法在p個處理機組成的并行機上的運行時間,Sp為加速比。假設問題為w,每個計算節點執行任務的時間見式(7)。

并行化運行平臺的基本執行時間見式(8)。

將式(8)代入到式(6),可得式(9)。

設perf(p)=c,c為常數,可得式(10)。

當c= 1 時,系統功效提高的程度和總時間及執行方式有關,見式(11)。

在式(8)至式(11)中,f是并行處理部分在整個系統的占比,1-f是串行處理部分在整個系統的占比。m是并行處理機數量,Speedup是加速比。主從模型的加速比呈現線性增長,在負載固定的情況下適用。當群體規模固定且子群體的規模和數量成反比時,孤島模型的加速比和主從模型的加速比趨勢相同。
農業觀光旅游產業競爭力指標體系的構建原則是要將旅游產業和農業的特點結合[9]。由于農業觀光旅游產業具有時節性、區域性、獨特性、市場性、不可復制性等特點,其競爭力綜合性很高,“軟”實力和“硬”實力都具備。因此,在選取評價指標時要遵循科學性、系統性、區域性和季節性、代表性和滾動型五大原則[10]。根據以上原則,確定了7 個指標,第1個指標是政策支持指數P,當某鄉村的政府給予該地區旅游項目政策優惠時,P= 1,否則,P= 0。第2個指標是交通便利指數G,交通便利指數的計算公式見式(12)。

式(12)中,tij是鄉村i到最近的城區j的最短時間距離,ti是城市內部交通阻力,Pj為當地人口總數。第3 個指標是旅游業影響指數A,指該地區旅游業在所有產業中的影響力。其計算公式見式(13)。


式(14)中,BI、VI、WI、LI、EQI分別為生物豐富程度、植被覆蓋率、水網密度、土地退化程度、環境質量指數。第6 個指標反映了該地區在線旅游的發展情況,用T表示,該數據在中國在線旅游發展的大數據報告中查看。第7 個指標是人文和歷史資源指數,用H表示,它采用官方公布的歷史文化旅游資源評價體系進行計算,通過對該地區歷史文化資源進行加權計算得到。具體評價體系見表1。

表1 歷史文化旅游資源評價體系
由表1 可知,此評價體系給歷史文化體系定下3個指標,分別是固有價值、旅游價值和歷史文化感。固有價值是資源本身具有的價值,例如存在的時間夠長,具有文化、民族或地域特點,有一定科研價值。而旅游價值指游客能夠通過欣賞該資源獲得的滿足,從美學角度、體驗角度和教育角度3 個角度來評價。歷史文化感指賦予給該資源的主觀看法,主要從地區的整體風貌格局、歷史文化和傳統文化3 個角度來詮釋其具有的文化感。
通過搜集中國已經投入運營的農業觀光旅游景點的數據,隨機篩選出100 個景點樣本作為神經網絡的訓練樣本,仔細挑選5 個樣本作為預測樣本,預測樣本數據如表2 所示。使用的數據來源于中國統計局發行的各省份《統計年鑒》和各省市政府官網公布的相關數據,通過上述的評價體系計算得到最終值。
由表2 可知,樣本1—3 號具備政策支持,而4—5 號沒有政策支持;在交通便利指數上5>1>4>2>3;在地區旅游業影響指數上,1、3、5 號樣本具有較高影響力,都占據40%以上,2 號樣本不到30%,而4 號樣本幾乎沒有;在特色產業規模指數上,3 號樣本為1.2%,而1 號樣本只占0.2%,2 號和5 號樣本為0.4%左右,4 號樣本有0.6%;在生態環境指標上,由于選取的樣本都屬于開發程度不高的鄉村,差距都不大,1 號和2 號樣本具備較大的優勢;在線旅游發展指數上,1—3 號樣本發展較好,4—5 號較差;歷史資源指數方面,除5 號樣本幾乎不具備歷史資源,其他4 個樣本都有一定的歷史資源。

表2 預測集樣本數據
當研究的對象不是線性問題時,在選擇傳遞函數時多采用Sigmoid 函數,該函數在預測分類問題時只需要一個隱藏層。因此神經網絡層數的隱含層為一層。神經網絡的輸入樣本為100 個,每個樣本由7個節點(即農業觀光的7 個評價因素),最終輸出有5個節點,分別為極優(1,0,0,0,0)、優(0,1,0,0,0)、良(0,0,1,0,0)、中(0,0,0,1,0)、差(0,0,0,0,1)。深度堆疊神經網絡是目前的主流,在進行相關研究時通常使用三層網絡結構,隱含層節點設定不能太多也不能太少,太多會導致神經網絡泛化能力差,太少會導致無法產生足夠的連接權組合。根據Kolmogorve 原理及類似研究的試驗成果[11],本研究的隱含層節點數設置為14 個。由于數據經過歸一化處理,本研究的輸出值被限定在(0,1),輸出層的傳遞函數最好是logsig 函數,隱藏層的傳遞函數最好是正切函數tansig 函數[12]。設置的最大迭代次數為10 000,目標誤差設置為0.001。種群數量為50,交叉概率為0.6,變異概率為0.05,中間結果周期為50。常用的神經網絡訓練函數有Traingd 函數、Traincgf函數、Trainlm 函數和Traingdx 函數等,依次采用這4種訓練函數進行訓練。根據訓練結果,Traincgf 函數和Trainlm 函數在迭代300 次左右趨于收斂,收斂后波動較小,具備較強的收斂性,但它們在收斂后陷入了局部最優解,迭代10 000 次結果無法達到期望的誤差值;Traingdx 函數無論是收斂性和最終結果都不如其他3 種訓練函數。Traingd 函數收斂性較低,但誤差下降速度很快,且在9 000 多次迭代后達到預期的誤差。經過綜合考慮,本研究選擇Traingd 函數作為神經網絡訓練函數。至此,模型需要數據和參數都準備完畢。
將100 個訓練數據歸一化處理后,用Traingd 函數對改進遺傳算法和標準遺傳算法進行訓練,選取適應度作為評價指標,統計50 個中間結果周期的性能追蹤曲線,改進遺傳算法由于擴大了種群規模,在10 個周期前的適應度是低于標準遺傳算法的。在經過多次迭代后,在10 個周期左右反超,且在15 個周期前就趨于穩定,能搜索到更優的權值閾值,而標準遺傳算法趨于穩定的周期在20 個周期左右。相比標準遺傳算法,改進遺傳算法適應周期縮短30%左右,適應度提升10%左右。由于訓練樣本的7 種指標的量級和單位差別很大,在進行計算時會影響網絡的收斂性,所以需要將數據進行歸一化處理,以節省神經網絡訓練時間。將訓練樣本的100 個數據分別輸入標準遺傳神經網絡和改進遺傳神經網絡,將競爭力評價分為極優、優、良、中、差5 個等級,100個訓練樣本的結果如圖1 所示。

圖1 標準遺傳神經網絡和改進遺傳神經網絡訓練數據對比
由圖1 可以看出,標準遺傳神經網絡在訓練集中的評價和實際評價有較大差距,明顯誤差在15%~20%,甚至有個別評價和實際評價出現評級差距。而改進遺傳神經網絡對于訓練集樣本的評價基本符合實際評價,即使有少部分存在誤差,但沒有產生評級差距。為了進一步展示2 種遺傳網絡的差距,使用“2.1”中仔細挑選的5 個樣本作為預測集,使用訓練后的2 種遺傳網絡進行競爭力評價。結果如圖2 所示。

圖2 標準遺傳神經網絡和改進遺傳神經網絡預測數據對比
由圖2 和表2 可以看出,樣本1、2、3 號的7 種指標各有優劣,且數值差距不大,此時,標準遺傳神經網絡無法對它們的旅游競爭力進行客觀評價,只能將它們分到同一級,而改進遺傳神經網絡評價和實際評價相同。4、5 號樣本和1、2、3 號樣本存在明顯差距,且4、5 號之間的側重點也有明顯差異,所以2種遺傳神經網路都能將它們正確分類。
在中國推進供給側結構性改革的浪潮下,農業觀光旅游作為旅游業的新寵卻在競爭力評價指標上問題頻出。本研究將深度學習引入農業觀光旅游競爭力評價,并構建出一種綜合考慮自然、人文、經濟、政治等多方面的評價體系,讓旅游競爭力評價更加客觀準確。在遺傳算法優化方面,通過遺傳算法并行的方式解決擴大種群規模后遺傳算法效率降低的問題,整體效率相較于標準遺傳算法提升30%。并采用二階段求解方法,改進遺傳神經網絡的權值,有效規避遺傳神經網絡陷入局部最小值的困境。重新設定遺傳網絡的閾值,提高了遺傳神經網絡在處理分類問題上的性能。本研究的不足之處在于選取的訓練樣本數量較少,樣本地域相對集中,不能代表全國的情況,在以后的研究中,應增加樣本的數量和地域范圍,以期獲得更好的結果。