程彩霞+段雪+李曉倩
摘 要 隨著互聯網科技的迅速發展,旅游住宿信息不斷增多,呈指數形式上升。目前,旅游住宿資源信息量大,內容紛雜,使得人們很難從中挑選滿足其需求的信息,影響了游客的旅游體驗。隨著智能化的進一步應用,旅游住宿也在不斷地朝智能化方向發展,在對比“游客的需求”和“互聯網提供的旅游信息”后,考慮到游客的實際住房需求和現實情況,簡要分析研究“隨游而安”智能推薦系統。
關鍵詞 智能推薦系統;旅游住宿;數據挖掘
中圖分類號 TP3 文獻標識碼 A 文章編號 1674-6708(2017)191-0044-02
隨著“互聯網+”的興起,越來越多的服務業及其輔助業務通過互聯網進入電子商務行業,他們的進入使得互聯網信息不斷增長,信息的暴增為用戶提供更多樣化服務的同時,也給他們帶來了困擾,無法在短時間內篩選出有價值的信息。這為智能推薦系統的發展提供了機遇。智能推薦系統可以抓取分析用戶的需求,為他們推送個性化的信息,用一種實用并且友好的方式解決客戶困擾,減少其在信息的搜集和篩選上花費的時間。
智能推薦系統為:通過搜索以及分析客戶的需求及愛好,為其推薦符合其需求愛好的個性化信息,將處理后的數據利用互聯網分享給客戶,并提出建議幫助客戶解決怎么搜索信息,怎么進行刪選等問題的系統。在處理過程中,系統會模擬客戶在整個互聯網中進行搜集以及處理信息。因為其推薦的個性化,研究人員也將智能推薦系統成為個性化推薦系統[1]。
1 “隨游而安”智能推薦系統
“隨游而安”給用戶提供一個平臺,在這個平臺中,游客可以發布自己需求,如:地點、住宿條件、愿意接受的價格范圍等來選擇自己的住宿地點;從游客角度來講,打破了原來被動接受商家制定的價格的局面,同時有了更多及更便宜的選擇。我們的第二個用戶群以能提供住宿的景點周圍居民為主,在游客發布求房信息的同時,當地居民的房子恰好空出來,也許家里孩子上學有一間臥室空出來,也許只有一個空沙發。這時供方與求方就需要一個交流的平臺,“隨遇而安”提供這樣一個平臺更方便供方和求方的交流。
在目前旅游行業借助各種現代化信息技術基礎上,“隨游而安”智能住宿推薦系統不斷添加各類各樣的旅游元素,并且將智能推薦定位核心,通過詳細科學的整合、分析網絡上大量的旅游資源信息,不斷豐富系統服務功能,從而為大家提供各式各樣的旅游需求和體驗,進一步增加旅游業的新穎性和經濟價值。
2 數據挖掘
“隨游而安”智能住宿推薦系統在整個運行過程中,并不需要消費者提供自己精確的消費需求。通過用戶已有的歷史行為針對用戶興趣建模,從而讓信息呈現對它感興趣的用戶面前,同時幫助新的用戶尋找發現對其有價值的信息,最終實現信息生產者和消費者二者之間的雙贏。
數據挖掘利用分類技術,在網上找到潛在客戶,確定目標客戶,對客戶進行細分,并動態的向客戶展示產品,引導客戶進在合適的時間進行合適的產品消費,為客戶提供個性化服務。利用數據挖掘不僅能夠很好的預測趨勢發展,還能檢測誤差和描述概念,從整個數據庫查找數據,這些數據就能夠很好的進行預測。
2.1 顯示反饋和隱式反饋
將系統建立在強大的數據基礎上,是實現推薦信息和用戶需求高度貼合的基礎,在智能推薦系統中,用戶的一般行為稱為顯式反饋和隱式反饋。顯式反饋能夠體現用戶明確表示對某一產品內容的喜好,而隱式反饋則不能夠明確的反應用戶的喜好[2]。從正負反饋來看,前者都有,后者只有正反饋。在用戶登錄瀏覽“隨游而安”后,記錄用戶點擊、瀏覽、停留、跳轉、關閉等隱式反饋數據。后期,顯式反饋數據密集以后,對用戶歷次入住的地點、時間、住宿方式等深度挖掘達到智能推薦的目的。
從用戶興趣來看,顯式反饋的數據相對于隱式反饋比較明確;從數據的數量和儲存來看,顯式反饋的數據較少且存在數據庫中,隱式反饋的數據較為龐大。基于此,我們應充分利用隱式反饋數據,疊加用戶的點擊數據,通過判斷加成后的隱式反饋數據和用戶點擊信息,以降低在隱式反饋數據處理過程中造成的誤差。
2.2 靜態數據與動態數據
靜態數據是指用戶由于前一時間段的行為而產生的對接下來的行為造成影響的數據。動態數據指在用戶在產生行為時系統捕捉的瞬時數據。在租客和房主進行注冊時就可以對其所在地、住宿條件、和年齡、性別等靜態數據進行首次的獲取。動態數據則是在用戶產生進行點擊、搜索、瀏覽等行為時獲取。靜態數據是動態數據的基礎,動態數據是對靜態數據進一步的解析。
3 數據處理
3.1 數據預處理
運用一定的數據挖掘算法(分類算法,聚類算法決策樹等),首先收集Web服務器數據和用戶數據的,對數據問題進行判定,然后用一定的基準衡量數據,對有用的數據進行提取,沒用的數據進行去除,最后得到最終數據。對數據進行進一步挖掘,進行分類,聚類。然后將選出的數據進行預處理,為之后的數據分析奠定有效的數據基礎。數據預處理包括數據清洗、數據集成、數據選擇和數據變換4個方面[3]。
數據清洗是對景區景點資源、房屋住宿資源等進行加工處理和組織重構,為下一步數據處理過程提供基礎平臺,并對數據進行分析、調整。例如把天津市的所有待租房屋信息的相關數據列出,再根據客戶需求:北辰區、一張沙發、?50/晚,對讀取、抽取、過濾等操作,選擇出客戶滿意的結果。
數據集成是將多組原始數據源通過匹配相似信息合并成一致的數據存儲,例如有三組原始數據,數據1:天津北辰區某小區的單間,?150/晚;數據2:天津市北辰區某小區某單元房客廳沙發,?30/晚;天津市北辰區別墅一套,?800/晚;可以通過關鍵字“天津市北辰區”將以上3個數據統一管理;數據選擇是修整刪除冗余數據,選擇性的壓縮信息;數據轉化是通過規范化等方法將旅游點的住房及租客等信息轉換成適合檢索挖掘的形式。
3.2 靜態數據和動態數據處理
針對租客進行搜索過程中靜態與動態數據處理如下:系統首先綜合房主所在地、住宿條件價格等靜態數據,通過抓取關鍵詞進行分類打包,存于數據庫中。根據租客進行搜索點擊過程中產生數據對包中的數據進行更正。針對房主來說,靜態數據和動態數據的處理如下:系統綜合租客的性別、年齡、所在地等靜態數據,根據關鍵字進行分類打包,存于數據庫中,根據房主提供的租住信息等對包中的數據進行修正。
4 推薦結果處理
4.1 推薦結果的展示
智能推薦系統中,數據經過預處理后并不直接推薦給用戶,而是將推薦結果通過關鍵字權重值進行排序后,將排序完畢的數據在網頁上依次展現給用戶。
4.2 推薦結果的測試
推薦結果的優劣程度,我們從兩個方面進行判斷:覆蓋率以及準確性。準確性是指推薦系統產生的推薦和用戶真實需求之間的契合程度,即正確推薦結果的程度,覆蓋率是推薦系統包含可能被用戶需要的推薦結果的能力。通過用戶對推薦結果的點擊率,停留時間以及進行再次搜索的頻率對準確性和覆蓋率進行判斷。也可進行網上調研問卷的形式得到更有效的判斷數據,進而對系統進行修改完善。
5 結論
隨著人類社會信息化的不斷深化發展以及互聯網的廣泛應用,智能應用系統將有更加廣泛的需求,總而言之,“隨游而安”智能推薦系統的誕生,不僅滿足了人們對各種旅游資源的需求與體驗,使得用戶獲得信息更加明確和精準,節約了用戶資源,同時,也為旅游行業開辟了更加廣闊的發展空間。實現了基于新一代信息技術,滿足游客個性化需求的智能住宿推薦系統,主動感知旅客住宿要求相關信息,從而達到對旅游住宿的智能推薦,提供高品質、高滿意度、高效率的服務。
參考文獻
[1]沙志強.數據挖掘技術在智能推薦系統中的研究與應用[D].北京工業大學,2005.
[2]趙茜.IPIV智能推薦系統的設計與研究[D].廣州:華南理工大學,2015.
[3]張晗.旅游服務智能推薦系統的研究與設計[D].2006,22(15):170-171.