謝聰穎,胡衛偉,黃康
(浙江海洋大學經濟與管理學院 舟山 316000)
近年來,隨著陸海統籌與海洋強國建設的不斷深入,我國海島縣(市、區)(以下簡稱海島縣)依托獨特的地理位置和豐富的人文資源大力發展旅游業。據統計,我國12個海島縣2013年的旅游總收入僅424.24 億元,全年旅游人次為5 228.14 萬人次;2019年的旅游總收入已上升為1 389.83億元,較2013年增長69%,旅游總收入占海島縣GDP達40.5%,全年旅游人次達12 638.7 萬人次,近2013年的2.5 倍。然而目前我國海島縣的開發程度不盡相同,旅游發展狀況有明顯差異,如2019年舟山普陀的旅游總收入達570.82億元,是大連長海的35.5倍。評價海島縣旅游競爭力不僅可以了解海島發展狀況,還可以對未來發展決策提供實踐參考,有助于在保持海島縣現有發展水平上進一步挖掘其潛在動力,促進我國海島縣的均衡發展,助力海洋強國建設。
目前對旅游競爭力的評價研究主要集中在指標體系構建與指標權重確定2個方面。在指標體系構建方面,現有研究大多基于比較具有代表性的4種旅游競爭力評價指標體系,并向生態環境[1]、產業發展[2]、基礎設施等角度延伸。在指標權重確定方面,層次分析法[3]和熵值法[4]等主客觀評價法被廣泛應用。隨著研究的深入發展,旅游競爭力評價涉及的影響因素逐漸增多,各因素之間存在明顯的非線性關系,因此有學者提出神經網絡法[5],利用非線性映射的優勢求解多因素評價等復雜問題;但神經網絡法會破壞特征的可解釋性,甚至為了保證性能而使特征變得毫無意義。
海島旅游是國內外學者研究的熱點領域,包括旅游規劃與管理[6-7]、旅游生態[8]、旅游安全[9]、旅游資源開發[10]、可持續發展[11]等方面。部分國內學者對我國海島縣旅游發展進行研究:李澤[12]和劉曙光等[13]分別從旅游資源開發潛力以及旅游資源利用效率的角度對我國海島縣旅游發展進行研究;鄭遼吉[14]通過競爭力GEM-ANP模型構建海島競爭力評價指標體系;王明舜[15]采用因子分析法對海島縣旅游競爭力進行分級評價。
綜上所述,目前對于海島縣旅游競爭力的研究較少,且研究方法較為單一。隨機森林算法不僅可以規避主客觀評價法以及神經網絡法的缺陷,提高預測正確率,而且該算法對數據噪聲和異常值不敏感,可大大降低決策樹過擬合的概率。本研究構建海島縣旅游競爭力評價指標體系,應用隨機森林算法、熵值法確定各指標權重,測算我國12個海島縣的旅游競爭力,有針對性地分析海島縣旅游發展存在的問題;利用反距離權重插值法估計海島縣周邊海島的旅游競爭力,旨在豐富旅游競爭力與海島旅游理論研究,并為海島縣提高旅游競爭力提供建議。
1.1.1 隨機森林算法
隨機森林算法于2001年被首次提出,現主要應用于自動化技術與計算機軟件領域。隨機森林算法是基于分類和回歸而開發的集成算法,可用于分類問題以及回歸問題[16]。該算法采用袋裝法、自助法組合多個互不相關的決策樹,基于多種決策樹組合,通過投票或取均值的方法得到預測結果并輸出[17]。具體來說:從原始樣本集中進行N輪有放回地隨機抽取訓練樣本,選出N個子樣本集;隨機選取K個特征,利用選出的特征及樣本建立決策樹;重復上述2個步驟,生成M棵決策樹,形成隨機森林。
隨機森林算法是決策樹的集成學習實現,目前決策樹模型常用的算法包括ID3、C4.5、CART 以及其他類似算法[18]。本研究使用的決策樹算法為CART,其與C4.5 較為相似,二者的區別在于CART 為二分支,且CART 使用的Gini系數為不純量[19]。假設某特征在某棵決策樹上的節點n向下分裂,分裂前的Gini系數為GI,分裂后左、右分支的Gini系數分別為GIL和GIR,即可得出變量的重要性評分(VIM),即VIM=GI-(GIL+GIR)。將所有求得的N個特征重要性評分進行歸一化處理,從而得到重要性評分。
1.1.2 熵值法
熵值法是利用指標的變異程度確定指標權重的客觀賦權法,能避免權重確定的主觀性以及多指標變量之間信息的重疊性[20],被廣泛應用于經濟金融領域。我國學者劉澄等[21]首次將熵值法與決策樹理論相結合,為本研究奠定理論基礎。
采用熵值法計算指標權重的具體步驟為:
(1)數據標準化處理。由于評價指標體系中各指標的原始單位、量級及屬性各不相同,為消除上述因素對評價結果的影響,采用均值法對各項指標的原始值進行標準化處理。
式中:Yij和Xij分別為第i年第j個指標的標準化數值和初始數值;n表示樣本的個數。
(2)計算信息熵:
(3)根據信息熵計算差異性系數:
(4)利用差異性系數計算指標權重:
(5)計算綜合得分:
Ui越大,綜合得分越高,評價結果越有利。
1.2.1 數據來源
本研究對象為我國12個具有獨立行政區劃的海島縣,即長海縣、長島縣、崇明區(2016年7月撤縣設區)、洞頭區(2015年7月撤縣設區)、玉環市(縣級市)、定海區、嵊泗縣、普陀區、岱山縣、平潭縣(政區合一)、東山縣、南澳縣。需要說明的是,2020年6月山東省長島縣撤縣,并與原蓬萊市合并為蓬萊區,但因本研究僅選取2013—2020年各海島縣的面板數據,故未將其排除在外。本研究數據來自2013—2020年各海島縣及其相關上級行政區國民經濟與社會發展統計公報、統計年鑒以及EPS統計數據庫等,個別年份的缺失數據采用多重插補法補齊。
1.2.2 評價指標體系
波特鉆石模型為旅游競爭力評價模型的發展奠定基礎。當前國內外具有代表性的旅游競爭力評價指標體系中的共性內容包括旅游吸引物、旅游設施、旅游環境、旅游安全等。王苧萱[22]將海岸線長度、交通旅客運輸量等納入區域海洋旅游競爭力評價指標體系;付智等[4]在全域視角下構建旅游競爭力評價指標體系,并以旅游收入與接待游客數表征旅游市場力,以旅行社數、星級飯店數、客運周轉量表征旅游服務力,以財政總收入表征旅游發展力;耿松濤等[23]根據旅游收入占GDP的比重、城鎮居民可支配收入等構建濱海城市海洋旅游競爭力評價指標體系。基于此,本研究選取25個指標構建海島縣旅游競爭力評價指標體系(表1)。
表1 海島縣旅游競爭力評價指標體系Table 1 Evaluation index system for tourism competitiveness of island counties
本研究共有2 400條數據,借助Anaconda軟件中的Python語言,依托機器學習開源工具包Scikitlearn中的分類器Random Forest Classifier構建隨機森林模型。重要參數設置為:決策樹數量(n_estimators)=200,隨機種子(random_seed)=44,隨機森林種子(random_forest_seed)low=1、high=230,訓練集大小(test_size)=0.2。
在25個指標中選取與旅游相關的指標即全年旅游人數(AT)、旅游總收入(TR)、星級酒店數(NH)、旅行社數(TRA)作為因變量,利用隨機森林算法進行特征重要性評估,得出不同指標對單一因變量的貢獻程度。為避免主觀因素的影響,引入熵值法確定上述4個旅游指標的權重,最后采用線性加權法確定各指標最終權重(表1)。
根據隨機森林算法,旅游總收入(TR)、全年旅游人數(AT)、星級酒店數(NH)、旅行社數(TRA)的Pearson相關系數依次為0.886、0.893、0.715、0.859,均達到強相關及以上;根據經驗法則,均方根誤差越小表明模型預測數據效果越好,且均方根誤差為0.2~0.5表明模型能夠較好地預測數據,4個指標的均方根誤差分別為0.228、0.156、0.213、0.159。由此說明,本研究采用隨機森林模型的結論可靠。
此模型在運行過程中自動刪除對所設指標無影響的指標即海岸系數(CC)。根據模型運行結果,旅游總收入(TR)、全年旅游人數(AT)、客運周轉量(PPK)、一般公共預算支出(GE)、人均GDP(GC)5個指標的重要性大于0.10,其中旅游總收入、全年旅游人數2個指標的重要性均大于0.80,表明其對海島縣旅游競爭力有較大影響,客運周轉量、一般公共預算支出、人均GDP3 個指標的重要性為0.12~0.25,遠大于其他指標,表明其對海島縣旅游競爭力有一定的影響(圖1)。根據指標最終權重,客運量的權重達0.040 8,與客運周轉量(0.047 0)極為接近,因此客運量也被納入重要指標。
圖1 重要性指標的分布情況Fig.1 Distribution of importance indicators
根據海島縣旅游競爭力評價結果,我國海島縣旅游競爭力總體呈上升趨勢。以南澳為例,除2020年受新冠疫情影響,旅游競爭力下降到2017年水平外,其他年份旅游競爭力均穩步提升(表2)。
本研究根據2013—2020年12個海島縣的旅游競爭力進行排序(表3)。由于各海島縣在不同年份的排序不同,為合理比較海島縣的總體旅游競爭力,依據統計學四分位差原則,將海島縣劃分為4個層次,每個層次均有3個海島縣。
根據各海島縣在不同層級出現的頻次,對2013—2020年12個海島縣的總體旅游競爭力進行劃分。第一層級(旅游競爭力強)包括長海、長島、東山、南澳,第二層級(旅游競爭力較強)包括玉環、定海,第三層級(旅游競爭力一般)包括普陀、嵊泗、岱山,第四層級(旅游競爭力較差)包括洞頭、平潭、崇明。
從宏觀角度分析,由隨機森林算法與熵值法綜合確定的重要指標決定海島縣旅游競爭力的評價結果,因此對各項重要指標進行深入分析有助于總結各海島縣旅游競爭力差異的形成機理,由此提出更有針對性的建議,助力海島縣旅游發展(表4,數據均經無量綱化處理)。
表4 12個海島縣重要指標的具體數據Table 4 Details pertinent information for the 12 island counties
2.3.1 旅游產業規模是旅游競爭力差異的首要原因
王苧萱[22]認為旅游總收入、全年旅游人數可以代表海島縣旅游產業規模,基于旅游總收入、全年旅游人數2個指標在最終權重中占比最大,旅游產業規模對海島縣旅游競爭力的影響最大。由此可以推斷,旅游產業規模是海島縣旅游競爭力產生較大差異的首要原因。
2015年初平潭自由貿易試驗區成立,“自貿區+實驗區”優勢疊加,加上“藍眼淚”的自然奇觀吸引大量國內外游客,擴大了平潭的旅游產業規模,2019年平潭的旅游產業規模位居12個海島縣之首,加之其適游期較長、旅游資源豐富,2019年平潭的旅游競爭力躍至首位,展現良好的發展前景。與平潭相比,嵊泗和岱山的客源較少,游客大多來自周邊地區,缺乏消費動力,且旅游淡旺季明顯,導致旅游產業規模較小。
2.3.2 經濟發展水平未必導致旅游競爭力差異
學界普遍認為,人均GDP可以代表當地經濟發展水平。由于2020 年各海島縣人均GDP 差異較大,為便于分析,選取2020年數據對各海島縣經濟發展水平進行深入分析。岱山的海域面積約為4 915 km2,是名副其實的海洋大縣,但常住人口僅約21 萬人,因此2020 年岱山的人均GDP 極高(1.881);嵊泗的人均GDP 較低,但其旅游競爭力(1.859)大于岱山(1.791)(表3)。因此,雖然人均GDP對海島縣旅游競爭力有一定影響,但其是否導致海島縣旅游競爭力的差異值得商榷。
2.3.3 交通發展水平導致旅游競爭力差異
客運周轉量、客運量可以反映海島縣交通發展水平[24]。根據2013—2020 年12 個海島縣客運周轉量、客運量的平均數據,超過3年2項指標均高于平均值的有岱山(4次)、嵊泗(4次)和長海(4次),超過3年2項指標均低于平均值的有東山(5次)、玉環(5次)和南澳(4次)。雖然交通發展水平沒有直接導致海島縣旅游競爭力產生明顯差異,但綜合2013—2020年海島縣旅游競爭力,長海整體高于東山、玉環和南澳(表3),因此交通發展水平對海島縣旅游競爭力差異有一定的影響。進一步分析,舟山擁有普陀山機場,嵊泗和岱山毗鄰上海,交通發達,2017年舟岱大橋開工進一步完善岱山、嵊泗的“海陸空”交通格局;玉環雖然有良好的區位條件,但交通發展極為緩慢,直至2018年樂清灣大橋及其連接線工程通車,才結束“輪渡去溫州”的時代。
2.3.4 公共設施建設水平促進旅游競爭力差異
一般公共預算支出可大致反映縣級區域的公共設施建設水平。因公共設施建設資金投入較少,洞頭旅游業發展受限;在溫州市政府、洞頭區政府的大力支持下,洞頭公共設施建設水平顯著提升,2020年數據達1.548,是2013年的2.5倍,對提高旅游競爭力產生較大影響。同樣因為公共設施建設水平提高促進旅游發展的還有南澳,南澳作為城市近郊海島,自2000年開始大型旅游配套服務設施的興建使其旅游總收入和全年旅游人數逐年增加[24]。
我國海島數量眾多,但大多數海島數據可獲得性差,難以展開針對海島旅游的實證研究。本研究在12個海島縣旅游競爭力數據的基礎上,采用反距離權重(IDW)插值法的相似相近原理,估計海島縣周邊海島的旅游競爭力,為海島縣旅游競爭力研究提供思路。
利用Arcgis軟件,采用IDW 插值法對2020年海島縣數據進行分析,發現海島縣的整體旅游競爭力不代表所有海島的旅游競爭力。例如:2020年長海整體旅游競爭力較差,但其東南方向海島的旅游競爭力卻很強;長島縣與原蓬萊市合并成蓬萊區后,整體旅游競爭力顯著加強,但其北方數個海島的旅游發展還存在問題;舟山群島有2 000余個海島,各海島的旅游競爭力有明顯差距,呈現北強南弱的發展特點,表明舟山海島旅游存在較大的發展失衡問題;同樣存在發展失衡問題的還有洞頭(東北方向弱、西南方向強)、東山(西弱東強)和南澳(西強東弱)。各海島縣周邊海島的旅游競爭力分布情況不一,東山與南澳海島旅游競爭力的分布規律甚至完全相反,由此推測地理位置對海島旅游競爭力可能存在影響,但仍需進一步結合實際情況具體分析。
本研究根據海島縣發展的實際狀況,構建獨具海洋和海島特色的海島縣旅游競爭力評價指標體系,利用隨機森林算法對全國12個海島縣旅游競爭力進行評價,規避各因素之間的非線性關系以及保證特征的可解釋性,并通過引入熵值法保證指標權重測算的客觀性。在評價各海島縣旅游競爭力的基礎上,利用IDW 插值法估計海島縣周邊海島的旅游競爭力,豐富無數據統計的海島旅游實證研究。研究結果表明:由于旅游產業規模、經濟發展水平、交通發展水平、公共設施建設水平等方面的情況不同,海島縣旅游競爭力可劃分為4個層次。其中,長海、長島、東山、南澳發展均衡,無明顯短處,綜合旅游競爭力強;玉環、定海各有優勢,但在某些方面存在問題,綜合旅游競爭力較強;普陀、嵊泗、岱山發展水平有限,在不同方面存在不同程度的問題,綜合旅游競爭力一般;洞頭、平潭、崇明早年旅游業發展較差,近年來在各方推動下發展迅速,但總體而言綜合旅游競爭力較遜色。
旅游產業規模對海島縣旅游競爭力起決定性作用,交通發展水平、經濟發展水平以及公共設施建設水平對海島縣旅游競爭力有一定影響。因此,海島縣應不斷提高當地經濟和交通發展水平,完善公共基礎設施和公共服務建設,滿足游客出行需求,從而擴大旅游產業規模,進而增強綜合旅游競爭力。
(1)科學擴大旅游產業規模,合理整合旅游資源,因地制宜發展本土特色旅游品牌,結合當地特色民俗文化以及海洋和海島元素推出獨具特色的文創產品和旅游產品,全方位提高旅游服務質量,規范營商環境,保證消費者利益,以達到吸引游客并促進游客積極消費的目的。
(2)重點建設島內景區之間的交通網絡,改善島內道路情況,規劃便民、短時的游玩路線;加強海島與陸地之間的交通建設,在科學、合理的基礎上豐富交通工具種類,建設“海陸空”立體交通網絡,適當增加來往航線,緩解旺季游客擁堵問題;發展特色旅游交通工具,既方便游客出行,又實現觀光游覽功能。
(3)海島公共設施建設與游客的衣、食、住、行等基本問題密切相關,為海島旅游提供全方位的后勤保障服務[11]。目前各海島縣星級酒店和旅行社數量差異較大,但總體而言星級酒店缺乏,且旅行社資質存在一定問題。例如:經對洞頭游客的簡單調查,大多數游客無過夜需求,主要原因在于當地酒店質量參差不齊,消費者難以辨別并選擇合適的住宿地點。因此,應加快發揮酒店品牌效應,提高酒店服務質量,滿足不同游客需求,保證旅行社規范運營。
為解決采用主客觀評價法評價旅游競爭力存在的問題,豐富海島旅游競爭力評價研究,本研究采用隨機森林算法預測各指標對海島縣旅游競爭力的貢獻程度。雖然隨機森林算法的泛化能力、預測精度在機器學習方法中較高,但其子集中不太重要的特征數量較多,可能產生較大的泛化誤差,降低模型精度。同時,對于通過隨機森林算法得到的重要指標,今后還有待進行更加深入的研究,以便形成更加科學完善的評價指標體系。