999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于文本相似度算法的特色旅游線路開發研究

2021-10-21 02:39:29宦正東朱曉菲李翛
科教創新與實踐 2021年32期
關鍵詞:開發

宦正東 朱曉菲 李翛

摘要:本研究將蘇州市內43個景點資料作為待處理文本,利用jieba分詞對其進行了分詞、去停用詞、提取特征項、計算特征項權重的處理,繼而用空間向量模型實現非結構化信息向數字化信息的轉變,最后采用k-均值聚類方法,通過計算各文本間的相似度,確定類別數得出景點特征分類結果。繼而利用分類結果設計出了5條蘇州市特色旅游線路。

關鍵詞:文本相似度算法;旅游線路;開發

一、研究背景和意義

隨著經濟的發展和技術的進步,人們的休閑時間與時俱增,恩格爾系數與時俱減,人們可支配收入大幅度增加,生活水平提高了,對旅游的需求也越來越大。旅游已經成為現代人生活中重要的部分,并且旅游者已不滿足傳統的旅游產品,越來越傾向于選擇個性化的,具有鮮明特色的休閑度假旅游產品。旅游收入在國內生產總值中的占比越來越大,加快旅游業發展成為推動我國經濟發展的重要方式之一。中國旅游業發展已進入爆發式增長期,大眾旅游時代即將全面來臨。旅游業發展與周邊產業緊密聯動。科技與創新是旅游發展的主要推動力,在線預訂、電子旅游信息、社交網絡等的廣泛應用改變了原有旅游業的面貌,同時旅游業的發展也促進了科技技術的創新。旅游業不僅促進文化產業發展,文化更是旅游產品的靈魂,沒有文化的旅游是不存在的。旅游業的發展還直接促進了與其相關的餐飲業、服務業和零售業的發展。當前的旅游線路產品參差不齊,文化內涵不夠深厚,趨同性較高,品牌建設意識淡薄。

蘇州市旅游資源豐富,旅游景點眾多,但開發程度有待提高的問題明顯。運用全新的旅游線路開發思路,將文本相似度算法應用到旅游線路開發中,通過描述景點的文本信息,分析得出景點的特征,將具有相同特征的景點歸為一類,結合地理位置的特征將同類型的景點設計在一條線路中形成特色旅游線路。線路開發具有可行性且具有現實意義。旅游業較低的資源消耗、高度的產業關聯、緊密的地域聯系、顯著的富民效應,在京津冀協同發展中占有重要的地位。豐富人們的休閑娛樂生活,提高居民幸福感。隨著大眾旅游時代的到來,使旅游成為人們在緊張的工作學習之余的首選;人們生活水平的提高、帶薪休假的增加及對生活品質的追求,高質量旅游線路的設計是及其重要的;上班族在快節奏的生活下,需要釋放壓力,放松心情,才能更好地投入工作;老年人退休好,講究健康養老,康養旅游正當時;年輕學生朝氣蓬勃,更需要感受祖國大好河山的錦繡壯麗,激發愛國主義情懷,將來投身到祖國建設中來。如何針對現有的旅游資源進行有效的整合,打破現階段“單打獨斗”的狀態,在充分利用蘇州市古城區旅游資源的同時,進行資源整合,從而推動蘇州市旅游業的整體發展,促進文旅深度融合。如何規劃游覽這些分散在蘇州大街小巷中的古跡、有效地安排旅游線路、提升游客的旅游質量和旅游效率,在智慧旅游的設計中十分必要。特別是在散客時代,只有特色旅游線路的推出才能更好地滿足游客的需求。

二、基于文本相似度算法的特色旅游線路的開發方法

(一)文本處理

文本通常是具有完整、系統含義的一個句子或多個句子,屬于自然語言,是非結構化的信息。若要計算文本間的相似度,需要把這些非結構化的信息即文本,轉化成計算機能夠識別和計算的數字化的表示形式,這樣才能計算出文本間的相似度。計算文本相似度前期需要完成的過程主要包括分詞,去停用詞、提取特征項、計算特征項權重,度量相似度等。文本預處理過程包括分詞和去停用詞。將要分析的內容為蘇州市市內43個景點的文本信息。43個主要景點涵蓋了蘇州市古城內的主要蘇州園林、博物館、寺廟、古城門、歷史文化名街。一個景點的信息為一個文本,其中包含著基本信息、歷史、建筑特點、作用地位等,內容豐富全面,但是整個一句話,計算機是無法識別的,要實現文本相似度的計算,首先需要將文本進行預處理,就是將一句一句的話分成具有獨立意義的詞語。文本在預處理后得到幾百甚至幾千個具有獨立意義的詞語,要想對文本特征有比較準確的把握,就需要對能顯著體現文本特征的詞語賦予高權重,對出現頻率較低的詞語賦予低權重,這樣更能體現出景點的特征。但并不是每個詞語都是有用的,都能代表景點特征,接下了的首要目的是提取能夠代表景點特征的詞語,一般意義上講,文本中出現頻率越高的詞語,對文本的重要性越大越能在一定程度上代表文本的特征。提取出文本特征項之后就是計算特征項的權重,選用應用最多的、經典的TF-IDF 權重計算方法。這個權重計算方法的中心思想為:如果某個詞語在整個文本中出現的頻率高。然后利用k 均值聚類算法對需要的文本預處理、特征項提取及其權重的計算過程,之后將43個景點的文本信息進行分類。

(二)基于高頻詞的景點特征分析

首先將全部43個景點的資料作為待處理文本,調取 jieba 分詞模塊進行分詞和去停用詞的預處理。將預處理之后的文本進行生成高頻詞的操作,調用 jieba.analyse 包,對完成上述預處理后的文本提取出現頻率最高的前 20 個詞作為該文本的高頻詞。保存軟件生成的景點的高頻詞,分析各景點的特征。接下來,將所有景點文本信息中的高頻詞整合在一起,從 wordcloud 包中調取Word Cloud 模塊生成高頻詞詞云,設置最大詞量為 1000,出現頻率最高的詞大小設置為 40。分析生成全部景點的高頻詞詞云,這樣能夠更直觀得體現出這景點的總體特征。

(三)基于K-均值聚類的景點特征分析

上述43個景點文本信息完成了分詞與去停用詞的文本預處理,接下來,提取能夠代表文本獨特性和具體性的特征項,根據對各景點高頻詞的分析,可以得出,高頻詞能夠作為各文本的特征項;用 TF-IDF 方法計算特征項的權重以降低文本表示模型的維度;用空間向量模型表示文本,完成文本為非結構化信息向計算機能夠識別、計算的數字化信息的轉變。最后調用 sklearn.cluster 包中的 KMeans 模塊,用 k-均值聚類方法計算各文本間的相似度。在聚類的過程中,類別數設置的越大,同一類別里的景點數相對越少,景點之間的特征就越接近。經過反復計算,設置不同的類別數分析得出的景點之間特征的形式情況,設定類別數為 5,即將個景點分為5 類。利用 k-均值聚類方法將包括 43 個文本的集合劃分為 5類,實現過程包括,隨機選出 5個文本作為初始聚類中心點,之后計算還剩下的38 個文本與選出的這 5個點的距離,并把與中心點距離近的歸為同一類,然后重新隨機選取中心點,迭代計算上述過程,直至聚類中心點不再發生改變。分析各類別中包含的景點可以得出類別內部的特征,其中部分類別特征在一定程度上與高頻詞具有一定的聯系。從側面體現出算法具有科學性且與現實情況相符。

三、特色旅游線路開發——以蘇州市為例

通過文本相似度算法得到了 5 類具有不同特征的景點分類結果,將各類別的特征確定為線路主題。在線路設計的過程中,為突出蘇州市特色景點,只保留了蘇州市內交通方便、歷史文化內涵豐富、旅游設施相對完善、游客數較多的部分景點。最后,結合地理位置特點,設計出下列 5條蘇州市內特色旅游線路。以 “韻存千秋·大美昆曲” 為主題,從中國昆曲博物館到蘇州昆劇傳習所,再到江蘇省蘇州昆劇院,了解了昆曲的歷史和文化;以 “匠心獨妙·蘇作天工”為主題,從蘇州博物館到蘇州工藝美術博物館,再到蘇州民俗博物館,以“一玉一木一錦,一燈一扇一繡”為主線,觀賞出的玉雕、木雕、宋錦、燈彩、蘇扇、蘇繡,感受蘇作工藝的匠心獨妙;以 “康乾南巡·駐蹕姑蘇” 為主題 ,結合《康熙南巡圖卷.第七卷.無錫至蘇州》、《乾隆南巡圖卷.第六卷.駐蹕姑蘇》的背景,從閶門出發,經過胥門、江蘇巡撫衙門舊址、蘇州府學,最終到蘇州織造署舊址,了解康熙與乾隆南巡駐蹕蘇州的歷史故事;以“狀元故里·文脈尋根” 為主題,從懸橋巷的洪鈞故居出發,經過臨頓路來到鈕家巷“狀元博物館”,再到十全街的狀元第,最后到達三元坊,了解“中國歷史上惟一的狀元外交官”、“蘇州門第最顯赫的狀元”、“祖孫狀元”、“連中六元狀元”的故事;以 “光輝之路˙紅色遺跡” 為主題,游覽張冀牖故居、中共蘇州獨立支部舊址、五卅路紀念碑、上海戰役指揮機關舊址等紅色遺跡,重溫蘇州革命歷史。

參考文獻:

[1] 張志雄、費理源、廖宇. 基于蟻群算法的蘇州古城徒步旅游線路規劃[J].看世界,2020(21)

[2] 黃文彬、車尚錕.計算文本相似度的方法體系與應用分析[J].情報理論與實踐. 2019(11)

基金項目:2021年度蘇州經貿職業技術學院院級課題“基于大數據的情感分析技術在蘇州旅游網絡評價中的應用研究”,項目編號為701K703。2021年江蘇省高等學校大學生創新創業訓練計劃項目“基于大數據的情感分析法在蘇州旅游網絡評價中的應用研究” 。

猜你喜歡
開發
軟件開發信息管理系統的設計與實現
淺談動力總成騾子車開發方法
汽車科技(2016年5期)2016-11-14 08:04:56
高中歷史教學中對歷史圖片的開發及實際應用
考試周刊(2016年85期)2016-11-11 01:57:37
在線投稿與編輯系統的設計與開發
河南方言文化資源的保護及其開發利用的研究
遵義紅色旅游開發對策研究
基于J2EE和Ionic的ITer學習APP設計與開發
單片機在電子技術中的應用和開發
主站蜘蛛池模板: 小说 亚洲 无码 精品| 国产网友愉拍精品| 欧美成人a∨视频免费观看| 亚洲av日韩av制服丝袜| 亚洲色图欧美视频| 国产精品亚洲va在线观看| 亚洲人人视频| 四虎成人精品| 欧美a级在线| 欧美a√在线| 天天综合网色| 666精品国产精品亚洲| 久久久久免费看成人影片 | 日韩欧美高清视频| 日本在线视频免费| 亚洲AV人人澡人人双人| 综合色婷婷| 欧美色伊人| 日韩欧美网址| 一级香蕉人体视频| 久久综合色天堂av| 国产麻豆aⅴ精品无码| 一边摸一边做爽的视频17国产 | 在线观看免费AV网| 国产手机在线观看| 国产成人无码AV在线播放动漫| 国产精品久久久久久搜索| 91啦中文字幕| 国产日本一线在线观看免费| 亚洲精品欧美重口| 亚洲精品动漫| 2019年国产精品自拍不卡| 一区二区欧美日韩高清免费| 91精品国产丝袜| 国产尤物在线播放| 77777亚洲午夜久久多人| 亚洲精品欧美日本中文字幕| 国产一区二区网站| 美女被操黄色视频网站| 丁香亚洲综合五月天婷婷| 色婷婷色丁香| 国产福利在线观看精品| 亚洲视屏在线观看| 日韩精品亚洲精品第一页| 欧美啪啪视频免码| 99久久精品国产自免费| 一本大道香蕉中文日本不卡高清二区| 最新亚洲人成无码网站欣赏网| 又猛又黄又爽无遮挡的视频网站| 都市激情亚洲综合久久| 亚洲男人天堂网址| 国语少妇高潮| 青青青视频免费一区二区| 在线观看国产精品日本不卡网| 国产99在线| 国产成人亚洲精品无码电影| 99精品国产电影| 99久久精品国产精品亚洲| 69综合网| 午夜一级做a爰片久久毛片| 国内精品视频区在线2021| 中国精品自拍| 国产精品偷伦在线观看| 日韩午夜伦| 青草视频在线观看国产| 欧美精品亚洲精品日韩专区| 亚洲男女天堂| 欧美激情伊人| 免费视频在线2021入口| 國產尤物AV尤物在線觀看| 亚洲中文在线看视频一区| 国产精品嫩草影院视频| 真人高潮娇喘嗯啊在线观看| 精品一区二区三区自慰喷水| 婷婷综合亚洲| 国产精品主播| 国产成人毛片| 国产真实二区一区在线亚洲 | 国产精品任我爽爆在线播放6080 | 亚洲成人77777| 亚洲欧美综合精品久久成人网| 人妻精品久久久无码区色视|