張占昭,宋漢珍,衡軍山,牟學鵬,王立萍
(承德石油高等專科學校 計算機與信息工程系,河北 承德 067000)
?
智慧旅游信息系統中大數據技術的應用
張占昭,宋漢珍,衡軍山,牟學鵬,王立萍
(承德石油高等專科學校 計算機與信息工程系,河北承德067000)
智慧旅游信息系統一端連接數據中心,另一端連接各種終端,為其提供各種與智慧旅游相關的服務信息。顯然在智慧旅游信息系統中,大數據技術起著基礎和關鍵的作用。在對傳統數據和大數據以及大數據技術進行研究的基礎上,進而著力分析了大數據技術在智慧旅游信息系統中的具體應用,力求為智慧旅游提供可行的研究思路和方法。
智慧旅游;大數據技術;信息系統
智慧旅游是將物聯網技術、通信技術、互聯網技術、大數據技術、云計算等現代先進技術運用到旅游的相關領域中,如旅游參與者、旅游產業、旅游行政管理部門等,其中大數據是實現智慧旅游各項功能的基礎,起著至關重要的作用。智慧旅游信息系統一般由服務器端和客戶端構成,而服務器端的重要支撐是大數據中心,服務器從數據中心獲取數據,通過物聯網、互聯網、無線通信網等傳輸技術向客戶端傳送數據信息,用戶通過數據信息在旅游中做出智能判斷和決策,使旅游出行更加方便快捷。
1.1傳統數據和大數據
數據承載的信息量小、信息處理能力低下、數據分析技術和軟件有限是傳統數據的重要標志,同時數據采集手段單一,導致隨機采樣分析在整個數據的處理過程中顯得更加重要,這種數據分析方法是對少量數據進行隨機采樣,然后通過分析這少量數據來獲取盡可能多的信息,信息本身和數據量沒有多大關系。這種分析數據的方法不可避免地會出現致命問題,如隨著數據量的不斷增加,分析工作越來變得越困難;隨著數據不斷深入分析,分析結果誤差越來越大,甚至出現錯誤;隨著新數據的不斷涌現,需要對新數據進行重新采集、處理、分析,這顯然不能滿足現代信息社會發展的需要。
隨著物聯網產業以及感知技術的迅猛發展,數據的內涵發生了本質的變化,大數據不僅僅是大量數據的簡稱,還包含了數據類型多、數據處理速度快、采集手段多樣、數據存儲和分析技術高效等相關內容。
1.2大數據技術
大數據技術的核心內容是將時間上、空間上產生的海量數據、非結構數據進行收集、分析、轉換、存儲、管理、挖掘、創新、利用等,其中為海量數據搭建數據倉庫是數據存儲的必要環節,然后按照各個信息系統的不同要求設計相應的數據庫,進而形成每個信息系統的數據中心,為信息系統每個模塊的智能決策提供支持[1]。數據倉庫技術是大數據技術的核心技術,主要包括數據源的相關技術和海量數據存儲兩部分內容,而數據倉庫的內涵是數據創新。
在大型信息系統中,數據的來源十分復雜,致使數據存儲形態多樣,所以存儲之前要對數據進行有效的整合,數據整合技術是通過對海量數據(包括空間數據、屬性數據、動態數據)進行集成,使之與不同的信息系統相對應,旨在通過數據整合,大大增加數據的利用效率,最大限度減少信息孤島的出現[2]。空間數據主要包括采集和測量的數據、地圖信息數據、地名和地址數據等,整合時需要將所有信息用諸如GIS通用軟件將其轉換成數字信號;對矢量數據進行數據格式整合,可以用FME等軟件進行轉換;數據坐標的優化可用點線面數學模型進行轉換;數據屬性格式化操作可采用編碼方式將屬性和地理位置一對一或一對多進行對應;動態數據如流量的測試、視頻的監控等要利用物聯網技術、互聯網技術向指定服務器上傳,服務器獲取后用軟件技術和算法進行存儲,最后供管理人員進行如景區規劃、景區建設、景區管理等方面決策時提供保障。
1.3數據挖掘Apriori算法
數據挖掘Apriori算法的設計思路是利用遞推方法和逐層迭代搜索找到所有層次的頻繁集,條件是支持度大于最小支持度,然后用找到的頻繁集生成滿足置信度的關聯規則。其中迭代函數主要任務是生產i層候選集,方法是通過連接i-1層頻繁集,候選集大大減少了數量的原因是判斷頻繁集的非空子集,方法是判斷該超集項中所有 i-1 子項是否完全包含于 i-1層頻繁集中,如果完全包含則該項為 i層候選集項,不包含就刪除該超集項。
2.1智慧旅游中數據的流程
在智慧旅游信息系統中,由于與旅游數據相關的實體種類繁雜,導致旅游數據具有多樣性,這些數據要經歷采集、分析、歸類、挖掘、選取、裝載等過程,這也是大數據技術具體運用的整個流程[3]。
數據采集就是將與旅游相關實體如吃住行游購娛等進行數據收集的過程,該過程既可以用傳統方式如照相機、錄像機、掃描儀、檢測儀等進行采集,也可以用與物聯網相關的感知技術如傳感器、GPS等進行采集;數據分類和選取不僅要對傳統格式數據如文字和圖像進行歸類選取,也要將超媒體和多媒體信息融入到信息系統中去,選取后還要進行屬性的劃分;數據挖掘不是直接采集的數據,不能停留在數據表達的表層意義,要對旅游數據進行選取和分類后進行,是對現有數據利用數據挖掘技術進行的二次、三次分析,這樣的數據可以給旅游管理部門提供智能決策支持;數據倉庫構建符合智慧旅游相關數據結構和關系的數據中心;數據處理是利用相關軟件對數據倉庫中的數據進行規范化處理,包含的內容有數據格式的統一、誤差的消除、編碼的唯一性、精度的提高等;數據加載是將處理好的數據裝入到關系數據庫中去的過程,如oracle數據庫。
2.2智慧旅游信息系統中數據倉庫的設計
智慧旅游信息系統的主要是向旅游參與者、旅游行政管理人員等提供智能決策功能,對數據信息提出了更高的要求,如對多樣性的數據、實時動態數據、數據的準確性、數據格式的規范性等方面都提出了新的要求,這些要求也促使與大數據相關的技術也得到迅速發展。如數據分析技術由傳統的采樣分析轉變為海量數據分析,由于分析結果基于全部數據,致使預測結果有著先天優勢,為智慧旅游做出更可靠決策提供保證;數據處理技術由傳統的單一計算機轉變為云計算,使對海量數據、非結構數據等的處理成為了現實;數據存儲技術則包含了數據倉庫技術、數據存儲結構和算法、視頻數據的維護、磁盤陣列的設計等內容,目前海量存儲技術的關鍵是用文件系統來構建共享的數據系統。
數據倉庫是大數據技術在智慧旅游信息系統中最重要的應用,信息系統中每個子模塊的數據流程都與數據倉庫的設計內容、方法、結構有直接關系,影響數據中心中數據的利用效率。數據倉庫的搭建是建立在不斷對信息系統需求深入分析、不斷細化,對數據主體不斷抽象基礎之上,進而加載到每個模塊的關系型數據庫中去,數據庫的構建結構上力求功能齊全,如滿足基本的增刪改查詢等功能。而數據倉庫的著力點應在每個子模塊的功能上,多從實際用戶需求方面考慮結構該如何設計,將數據需求劃分成不同的子模塊,同時為了方便數據加載,也需要將數據庫分成不同的子數據庫,目的是滿足功能的同時提高數據利用效率。總體來講,我們可以將智慧旅游數據倉庫設計成如圖1所示。
總之大數據技術將海量數據進行處理后,為旅游者、旅游管理部門、旅游產業等相關者提供高效、準確、規范的數據支持,在智慧旅游信息系統中,運用數據倉庫技術和大數據整合技術等可以為構建智慧旅游提供數據基礎,為信息服務和智能決策提供幫助,加強智慧旅游的內涵建設。
[1]馬建光,姜巍.大數據的概念、特征及其應用[J].國防科技,2013(2):10-17.
[2]劉智慧,張泉靈.大數據技術研究綜述[J].浙江大學學報,2014,48(6):957-972.
[3]張欣.智慧旅游感知體系和管理平臺的構建[J].江蘇人學學報(社會科學版),2013,13(6):67-75.
Analysis on Application of Big Data Technology in Intelligent Tourism Information System
ZHANG Zhan-zhao, SONG Han-zhen, HENG Jun-shan, MU Xue-peng, WANG Li-ping
(Department of Computer and Information Engineering, Chengde Petroleum College, Chengde 067000, Hebei, China)
The wisdom of tourism information system is connected with one end of a data center, and the other end is connected with a variety of terminal, to provide various service information related to intelligent tourism. Obviously in intelligent tourism information system, big data technology plays a fundamental and critical role. Based on the traditional data and big data as well as big data technology research, this paper focuses on the analysis of the specific application of big data technology in intelligent tourism information system, and strives to provide feasible research ideas and methods for intelligent tourism.
intelligent tourism;big data technology;information system
河北省高等學校自然科學青年基金項目(物聯網技術在承德智慧旅游系統的應用研究):QN2016262
2016-03-08
張占昭(1978-),男,河北保定人,承德石油高等專科學校計算機與信息工程系講師,碩士,主要研究方向為物聯網技術、嵌入式系統。
F59
A
1008-9446(2016)04-0049-03