陳建敏 徐蘇麗
摘要:隨著計算機網絡的飛速發展,大數據、人工智能等技術的逐漸成熟,人們對旅游的需求發生了變化,不再滿足于傳統的旅游方式,總是希望在有限時間里能瀏覽到最喜愛的旅游路線和得到更舒適的旅游體驗。本文從大數據、人工智能技術出發,利用人工智能中的機器學習和深度學習,并使用Python爬蟲機器獲取各種旅游行為等數據,構建出基于人工智能的智慧旅游大數據分析模型。旨在推動智慧旅游的快速落地,帶給旅游者舒適的旅游體驗,為旅游服務者節約成本提高效率。
關鍵詞:人工智能;大數據;智慧旅游;個性化;需求
中圖分類號:TP311 文獻標識碼:A
文章編號:1009-3044(2019)11-0189-02
隨著時代的發展,已經進入了技術引領的時代。旅游等服務行業需求也越來越精細化,信息化的發展給游客的衣食住行帶來了巨大的便利,但是旅游不能僅僅只依靠便利的技術,其關鍵在于旅游者的需求,如何滿足游客日益增長的個性化需求成為了社會研究的熱點。
1 智慧旅游的研究背景及其意義
歐盟早在2001年就開始實施“創建用戶友好的個性化移動旅游服務”項目。2005年,智慧旅游的最早提出國家之一的美國,斯丁波滑雪推出的游客定位裝置反饋系統就是智慧旅游。我國國家旅游局將2014年確定為了“智慧旅游年”,將大數據引入到旅游市場上來,改變了傳統的旅游模式,迫使旅游經營模式改革,大大促進了旅游產業的建設,誕生了以大數據為背景的智慧旅游新模式。
在2008年IBM“智慧地球”的背景下提出“智慧旅游”。智慧旅游的發展其關鍵在于服務本身,那么,對于旅游行業以及旅游者的各類行為以及趨勢分析成為發展智慧旅游的關鍵,獲取的信息數據越全名,數據分析得越精確,越能抓住旅游者的需求。在人工智能以及5G時代背景下,基于人工智能的智慧旅游大數據分析顯得尤為重要,從而從本質上去促使智慧旅游的高速發展。
2 技術路線
智慧旅游,智慧是前提,離不開高尖端的技術支持。利用大數據、人工智能等技術以及硬件,實現旅游行業信息和旅游者行為信息的實時動態收集,整合并分析出用戶個性化的需求以及設計出適合旅游者的各類旅游方案。從旅游數據的收集到分析出旅游者的需求到數據整合、數據清理、數據分析、深度學習以及設計出合適的旅游方案,整個過程涉及到了大數據、人工智能等相關技術。
2.1 大數據以及Hadoop
按照麥肯錫全球研究所給出的定義,大數據通常情況下指的是其數據規模大到在獲取、存儲、分析、處理等超出了傳統數據管理工具能力的范疇的數據集合,其數據結構包括結構和和非結構化。大數據只是為了實現某些企業或者其他利益群體的特定目標或者運營策略而聚集的海量數據。大數據技術在于將這些海里數據經過專業的處理,得出具有價值的信息。
大數據需要得到處理,提取信息,首先需要解決的問題就是數據存儲問題,Hadoop工具具有HDFS分布式文件系統,其設計初衷就是為了可以橫跨成百上千臺機器用以存儲大量數據,HDFS為我們提供了管理。解決了數據存儲問題,接下就是考慮如何處理海量數據。對于海量數據如果在單機上跑1P數據的話,需要跑幾天或者幾周的時間,為解決該問題,Hadoop建設初期引入了MapReduce框架,僅使用Map、Reduce兩個計算,然后它們中間由Shuffle串聯。Map階段,成百上千臺機器同時讀取我們需要處理的大數據文件的各個部分,所有機器都按照同樣的方法去處理產生結果。緊接著這些機器又啟動Reduce處理,最終能讓成百上千臺機器同時為我們操作,并按照Map針對每個步驟處理,然后Reduce又把所有結果匯總一起得到最終的結果。
自從用Hive分析數據過后,發現在Hive上跑MapReduce很慢,Spark框架應運而生,其最重要優點就是快,使用MapReduce計算時候,MapReduce任務需要多次迭代,迭代產生的結果每一次都需要保存到HDFS中,而HDFS本質上也是占用硬盤空間的,也就是相當于每次都將結果都存儲到了計算機硬盤上。而Spark不同,他每次運行的結果都存放在內存中,在內存中進行迭代運算,速度比MapReduce更快。
2.2 人工智能以及Python
人工智能(Artificial Intelligence),英文縮寫是AI,研究關鍵著眼于人的思維、意識,并將人的這些行為通過數學工具運算與分析讓機器模擬實現。人工智能包含常用機器學習和深度學習兩個很重要的模塊,而Python擁有Matplotlib、Numpy、Sklearn、Keras等大量的庫,像Pandas、Sklearn、Matplotlib這些庫都是做數據處理、數據分析、數據建模和繪圖的庫,基本上機器學習中對數據的爬取(Scrapy)、對數據的處理和分析(Pandas)、對數據的繪圖(Matplotlib)和對數據的建模(Sklearn)在Python中全都能找到對應的庫來進行處理。
本文建立的模型對于數據的獲取,除了來自企業之外,其他數據均需要通過Python爬蟲技術從網絡上去爬取,這就需要利用Python中的Requests、Scrapy、Selenium、BeautifulSoup等庫。爬取數據之后才能進行機器學習和深度學習,機器學習和深度學習以及整個人工智能領域所有模型和算法大部分使用Python為基礎語言的。
3 構建基于人工智能的智慧旅游大數據分析模型
智慧旅游為的是給旅游者提供更加舒適的旅游體驗、更加滿足自己的旅游產品以及更加便捷的配套。為使得旅游能更加智慧化,滿足旅游者的個性化需求,以大數據、人工智能等技術為基礎,構造如圖1所示的基于人工智能的智慧旅游大數據分析模型。
4 模型分析
基于人工智能的智慧旅游大數據分析模型分為硬件資源層、數據處理層、大數據分析層、人工智能層、應用服務層以及基礎云服務的五層兩級結構。
4.1 硬件資源層
主要是為信息采集、構建Hadoop集群、數據分析等提供硬件保障。
4.2 數據處理層
分為三個部分:Python爬蟲爬取數據、數據清洗、數據預處理,Python爬取用戶對于旅游、需求以及各大論壇中的信息數據進行爬取和匯總,對提取的數據進行清洗,去粗存精,最好按照最后深度學習模型需要,將所有數據預處理完成。
4.3 大數據分析層
是預處理之后的數據分析,基于Python,利用Pandas、Sklearn、Matplotlib、Numpy等庫對現有數據的特征、分布以及基礎信息進行分析。
4.4 人工智能層
根據不同景區和不同旅游地域,構造出不同的深度學習模型,構造訓練集和測試機,利用訓練集數據對模型進行調參和調優。
4.5 應用服務層
利用深度學習模型運行之后,對需要分析的數據動態給出兩個應用服務,分別是:用戶需求分析服務和個性化旅游資源服務,為旅游服務提供者、旅行社、酒店、景區以及最核心的旅游者提供了各類智能化的服務。
4.6 整個模型
整個模型分為兩級,一級是整個數據構建、分析、建模、深度學習過程,一級是基礎云服務支持。基礎云服務為最終結果的產生提供了高速和精確的保障。
5 與傳統的方法比較
對比傳統的方法,利用數據挖掘的方法去實現智慧旅游,并不能完全發掘出旅游者的真正需求,同時也不能完全挖掘出整個旅游資源的合理整合,對于支付、交通等帶來的無限便利的同時,人們對服務有了更高的追求。傳統的方法對于服務上無法滿足所有顧客,旅游路線、旅游產品的設計僅僅依靠經驗和少量數據得出的,需要投入大量的人力物力,結果并不一定讓旅游服務提供者和旅游服務體驗者都滿意。隨著人工智能技術的不斷成熟和發展,基于人工智能的智慧旅游大數據分析模型的構建,能解決以上問題,能合理地高效地將旅游資源整合,為旅游者提供最優最舒適的旅游服務。
6 結語
構建基于人工智能的智慧旅游大數據分析模型,旨在促進旅游服務的個性化和旅游資源的最優化利用。隨著人工智能不斷發展,5G網絡的快步“落地”,旅游者的實地體驗模式,會增加猶如實體店試衣服一樣可以隨時隨地體驗旅游,配套更加智能化,服務更加精細化,這個將作為下一步研究的課題。
參考文獻:
[1]Loris Fichera,Fabrizio Messina,Giuseppe Pappalardo,Corrado Santoro. A Python framework for programming autonomous robots using a declarative approach. Elsevierjournal,2017.
[2]馮琬婷. 基于文字識別視角分析人工智能機器學習中的文字識別方法. 電子技術與軟件工程[J],2017(13).
[3]孫彬,王東.文明旅游的大數據體系建設研究.中南林業科技大學學報(社會科學版),2017(05).
[4]唐穎,張鎰,柯彬彬.大學生窮游行為偏好及特征研究[J].嶺南師范學院學報, 2017(03).
【通聯編輯:唐一東】