何世群,翁 冉,宋卓遠,楊秀璋,羅子江
(貴州財經大學信息學院,貴州 貴陽 550025)
近年來,隨著我國物質文化生活水平的不斷提高,人民群眾對于精神層次上的追求越來越豐富。而旅游出行作為一種開拓眼界、放松身心、陶冶情操、享受生活的最佳活動,也逐漸成為人們所青睞的一種生活方式。在相關政策的引導下,旅游產業帶來的經濟效益對于獨具喀斯特地貌和山地民族特色的貴州省而言具有十分重要的意義。據統計,2017年貴州省的旅游總收入占貴州全年GDP的11%以上,這說明旅游業為貴州省的經濟發展與扶貧、減貧工作作出了巨大貢獻?!笆濉币詠?,貴州省人民政府《關于貴州省“十三五”旅游業發展規劃的批復》(黔府函〔2017〕64號)、貴州省人民政府辦公廳《關于支持畢節市加快旅游業發展的意見》(黔府辦發〔2019〕6號)等文件中均有提及對全省的旅游產業升級改造,依托獨特的喀斯特地理風貌和獨具特色的山地民族風情優勢[1],打造“多彩貴州”的獨立旅游品牌,因此貴州省各地市州加快旅游產業轉型升級和服務質量的提升刻不容緩。本文通過構建關鍵詞矩陣,利用主題聚類分析等方法,及時挖掘貴州省旅游的研究熱點與主題分布,以期從中有效發掘出潛在的價值信息,為貴州旅游研究提供一種新的分析視角。
本文的研究對象來自中國知網文獻數據庫,檢索主題為“貴州旅游”,并采用高級檢索模式,檢索條件為“中文核心+CSSCI”,檢索時間為2021年9月10日,總共獲取文獻310篇。經過數據預處理與人工篩選工作,剔除通訊、會議、人物訪談等無效文獻,最終獲取有效文獻304篇。
傳統的文獻計量就是將數學和統計學的研究方法加以結合,以所獲取的研究文獻為研究對象,主要有發文量分析、引文分析、詞頻分析、基金項目分析、發文機構分析、期刊分析和關鍵詞分析等方法。本文通過研究最終獲取的304篇有效文獻的外部特征,定量地分析貴州旅游研究的相關文獻,并描述、評價、預測科學研究的現狀與發展趨勢[2],并將所獲取數據間的關系繪制成網絡知識圖譜與主題挖掘圖譜,從而梳理貴州旅游領域的關注焦點。本節將以布拉德福定律和齊普夫定律為理論基礎,采用Gephi、Python等軟件和計算機語言技術,生成可視化知識脈絡圖,主要包括研究熱點圖譜、關鍵詞共現頻次表、關鍵詞聚類圖譜以及主要機構和主要作者發表文獻數量圖譜[3]。
關鍵詞往往代表著一篇文章的主要研究方法與研究對象,可以讓讀者直接了解文章的主題,本文主要通過構建高頻關鍵詞相似矩陣并將其導入Gephi軟件中,繪制相關的知識圖譜,呈現可視化結果。共詞分析也就是將各個關鍵詞聯系起來,如某一關鍵詞在相關文獻中出現的次數較多,就說明該關鍵詞代表的研究內容或者主題就是關注度較高的研究點,從而反映出某個研究領域的研究現狀、熱點與趨勢[4]。本文的亮點在于,不僅將共詞分析技術用于文獻分析,還將其用于在線用戶評論的分析當中。
通過對“貴州旅游”主題文獻相關發文量及其變化情況進行統計,可以分析評價該主題領域的研究水平及發展特點。本文使用Excel 2019,將最終獲得的304篇有效研究文獻按照年份統計并繪制成相關文獻數量分布圖,如圖1所示。

圖1 年發文量分布圖
從上圖中可以看出,從1993年起才出現與貴州旅游相關的高質量研究,根據上圖的發文量可以將該主題的相關文獻發展分為三個階段。1)萌芽期(1993—2003年),這一階段我國對于貴州旅游的高質量研究才正式開始,由于當時也正處于社會主義市場經濟探索初期,所以整個研究領域都處于一個摸索的階段,也是向文獻大規模增長的過渡時期,每年平均文獻產出約3篇,文獻產出增長較少且不穩定。2)井噴式增長期(2004—2011年),這一階段隨著“旅游產業化”與“扶貧開發”工作的全面推進,貴州省的旅游品牌知名度不斷地提升,再加上貴州省擁有極具特色的旅游資源,這也就導致相關的研究者將研究重心轉移到該研究領域,此階段文獻產出進入井噴式的增長階段,其中2010年和2011年以年刊載文獻29篇,達到文獻產出歷史的最高峰。3)衰退期(2012—2021年),這一階段旅游產業化逐漸完善,同時各個景點的商業化也不斷深入,導致相應的研究也就隨之減少,雖然有部分時間的文獻產出情況有所反復,但整體仍然處于一個明顯的下降趨勢??傮w而言,“貴州旅游”主題研究整體呈現“幾字型”分布趨勢,根據普賴斯文獻分布規律,說明該研究領域已經趨于成熟的瓶頸階段,未來如果能與新興的熱點事物相結合,才有可能從新的角度和研究方向產生活躍的研究。
作者合作網絡分析,即根據所獲取的有效文獻,分析貴州旅游研究領域所發表文獻主題和作者之間的合作關系,將其作為研究主題與研究團隊影響力區分的重要途徑。本文使用Python將304篇有效文獻的作者構建相似共現矩陣,由于貴州旅游研究領域的文獻較少,故將發文量大于1篇的作者都定義為非邊緣作者。將構建的作者共現矩陣導入Gephi軟件中,去除極度邊緣位置的作者,生成論文作者合作關系知識圖譜,如圖2所示。
從圖2中可以發現主要作者團隊共9個,其中處于研究中心的作者團隊有4個,邊緣作者團隊5個,此外獨立作者數量較多,大部分處于關系網絡邊緣位置。3人及3人以上的作者團隊為6個,其中以楊洋、殷紅梅團隊,胡北明、孫德亮團隊和楊建春、陳志永團隊表現最為突出,主要研究方向為旅游經濟產業化、生態旅游以及民族村寨旅游等,代表著作有《旅游發展背景下民族村寨居民地方性感知測度及影響因素研究——以貴州雷公山地區為例》《高鐵對區域旅游生態關系影響的定量評價研究——以貴廣高鐵貴州段為例》《金融支持旅游產業發展的動態效應比較——以貴州、浙江兩省為例》等。并且以上三個團隊的團隊成員之間合作密切,相互聯系,都處于網絡核心位置,這表明上述團隊是貴州旅游研究領域的主要研究產出來源。但是其他作者大部分處于相互獨立和網絡邊緣的位置,如蘇潔、吳倩、李強等,說明大部分作者的研究方向與重心都比較分散,差異較大。由此可見,貴州旅游研究領域最為核心的研究產出團隊關聯性較高,且這些研究團隊的研究主題有一定的聯系,這也就使得該領域的研究關系網絡也呈現集中化發展的趨勢。

圖2 作者合作關系知識圖譜
研究機構分析,即根據有效文獻的作者所屬機構,分析貴州旅游研究機構之間的合作關系與主要研究主體,將其作為研究中心的重要途徑。本文使用Python將304篇有效文獻的發文機構構建相似共現矩陣,由于貴州旅游研究領域的文獻較少,固將發文量大于1篇的機構都定義為高產機構,表1為部分研究機構。

表1 貴州旅游主要研究機構(部分)
再將研究機構構建的共現矩陣導入Gephi軟件中,去除極度邊緣位置的研究機構,生成研究機構發文量知識圖譜,如圖3所示。

圖3 研究機構發文量知識圖譜
從表1和圖3都可以看出,主要的機構絕大多數都是貴州省內高校以及科研機構,并且貴州師范大學和貴州財經大學分別以47篇和41篇的文獻產出,成為該領域最為核心的研究機構,說明貴州省內的高校成為了“貴州旅游”研究產出的主要動力;并且從發文量來看,可以發現對于貴州旅游的研究并不僅僅局限于貴州省內的研究機構,例如四川大學、西南民族大學、中南財經政法大學等。對于貴州旅游的發展高度重視,說明針對民族山地地區的旅游發展研究至關重要,不僅關系到貴州當地相關產業的發展,也為經濟產業化、扶貧、減貧研究提供了研究的案例。
對學術論文的期刊分布進行分析可以了解該領域主要受到哪些學科、地域以及作者的關注。統計貴州旅游研究領域的文獻產出核心期刊群,可以便于學者選擇資料獲取平臺與文章發表途徑[5]。由于在實際統計中存在大量論文數量排名并列的期刊,此處將采用布拉德福期刊區域劃分規則來確定貴州旅游研究領域核心期刊發文量。經統計主要期刊發文量如表2所示。

表2 主要期刊發文量
本研究領域的304篇有效文獻分布在99種期刊中,其中《貴州民族研究》和《貴州社會科學》分別以81篇和39篇的文獻產出量占據文獻產出的絕對核心區,兩者共占總發文量的39.47%,是貴州旅游研究領域發文與交流最為核心的期刊。從論文發表數量來看,主要期刊位于貴州、安徽、北京、四川、福建等地區,說明貴州旅游研究在全國范圍內都受到了廣泛的關注??傮w而言,所篩選的期刊主要集中于經濟學、社會學、管理學、民族學等學科領域,這表明貴州旅游研究不僅僅是管理學領域的研究熱點,也是社會學、經濟學、民族學等諸多領域的重要研究方向。
關鍵詞是論文和期刊中的重要組成部分,通常伴隨著論文摘要出現,文獻計量領域可以通過關鍵詞的出現頻率來把握論文的主題、內容、對象、方法等。通過某一領域的關鍵詞,可以把握該領域的研究方向與研究熱點[6]。本節通過Excel 2019進行統計,共獲取關鍵詞764個。再用Python進行數據預處理,對所有相同關鍵詞進行合并處理,如關鍵詞“貴州省”與“貴州”就是明顯的意義重復詞語,將其出現頻次進行合并處理。剔除無意義和無效的關鍵詞,最后從304篇有效文獻中共獲取關鍵詞749個。此處將使用普賴斯公式來界定高頻關鍵詞,該公式最早用于確定高被引論文,進而確定某研究領域內的核心作者。因該方法相較于高低詞頻界定公式更簡單,比自定義法更科學,逐漸被學者接受用于不同研究領域中[7]。
此處采用普賴斯公式計算高頻詞閾值[8],公式如下:

式(1)中,Nmax為最大發文量的發文數,計算得出高頻詞閾值M約為6,即取關鍵詞詞頻大于等于6的為高頻關鍵詞,共計20個,如表3所示。

表3 高頻關鍵詞詞頻
由表3可以看出在貴州旅游的研究過程中,“貴州”“鄉村旅游”“旅游開發”“旅游資源”“民族村寨”“旅游扶貧”等關鍵詞出現的頻次較高且部分關鍵詞含義相類似,說明該領域的學者們對于貴州旅游研究的研究主題、對象、內容等方面存在較大的共識,研究熱點與方向呈集中態勢,主要集中在貴州本地的少數民族與地貌特色上,說明學者們在發揮貴州特色以及旅游開發上的焦點趨于一致。此外,“生態旅游”“可持續發展”等關鍵詞也相繼出現,說明研究者將研究重心放在旅游產業化的同時,也開始將目光轉向了環境保護方面等對立面的問題。
共詞分析法最早是由Michel Callon等提出的,主要用于分析不同文獻之間的內在聯系,從而挖掘其中的規律與研究焦點。具體是指當兩個關鍵詞經常出現在同一篇文獻時,就說明這兩個關鍵詞有一定的內在聯系,共現次數越多,則兩者的內在聯系就越密切[9]。關鍵詞是作者對論文主題的高度提煉和概括,能夠準確地反映論文內容的核心和精髓,通過高頻關鍵詞來考察一個學科領域的研究熱點和前沿具備很強的代表性[10]。通過Python將本文選取的20個核心關鍵詞構建出20*20的高頻關鍵詞共現矩陣,由于篇幅有限,此處僅列出部分高頻關鍵詞,如表4所示。

表4 高頻關鍵詞共現矩陣(部分)
為了從更深層次挖掘出貴州旅游研究領域內關鍵詞的內在關系,本節將共詞分析法與社會關系網絡分析法結合起來,將生成的共現矩陣導入Gephi軟件并繪制相應的高頻關鍵詞科學知識圖譜,如圖4所示。從而以可視化的效果梳理出貴州旅游研究領域的研究焦點與基本情況,為下一步的研究引導方向。從圖4中可以發現三個存在明顯內部關聯的網絡。第一是以“旅游業”“旅游產業發展”“旅游大省”三個關鍵詞為主題詞的紫色主題關系網絡,反映出該主題主要聚焦于旅游產業化以及貴州省豐富的旅游資源等相關研究內容。第二是以“旅游總收入”“旅游形象”“多彩貴州”等關鍵詞為主題詞的橙色主題關系網絡,該網絡的研究焦點是針對整個貴州的旅游質量以及獨立品牌的研究,反映出整個貴州研究領域在持續關注著貴州旅游產業的口碑以及打造特色品牌工作進程,本文的研究也屬于此種類型,旨在通過分析在線用戶評論的文本數據來探究游客們對貴州省旅游產業的質量滿意程度,進而為貴州旅游研究添磚加瓦,為推動貴州旅游產業的高質量發展貢獻一份力量。第三是以“鄉村旅游”“鄉村旅游發展”等關鍵詞為主題詞的綠色主題關系網絡,該主題以“鄉村振興”發展戰略為基礎,深入研究貴州獨具特色的民族村寨、鄉村風情,但是圖中也很直觀地反映出,該網絡的關鍵詞處于該圖譜的邊緣地帶,且關鍵詞的字體較小,說明綠色網絡關鍵詞的聚焦度相比其他兩個網絡要小,其內在聯系與研究文獻也都較少。

圖4 高頻關鍵詞共現圖譜
本文介紹了主要的研究技術與方法,如文獻計量方法、共詞分析技術以及LDA主題挖掘法等。并使用文獻計量的方法,詳細講述了爬取中國知網的文獻數據、發文量分析、期刊分析、關鍵詞矩陣構建以及高頻關鍵詞知識圖譜的過程,梳理了貴州旅游研究領域相關的研究重點與線索,發現貴州旅游研究領域的整體研究趨于成熟,研究產出核心團隊相對固定,且主要產出作者聯系密切,關注度較高,以此為后續的研究提供引導,旨在為貴州旅游研究領域添磚加瓦,為貴州旅游高質量發展貢獻一份力量,助力鄉村振興。