鐘櫟娜
在旅游大數據研究人員和企業一起研討的會議上,經常出現的現象就是,科研人員分享的成果,企業界的人員往往會覺得同類研究他們已經在做了,而且可能更深入。畢竟這個時代科學轉化太快,如果說之前還是研究-知識-價值三點一線,現在幾乎是研究-價值的短線條了。企業在某些方面走在學術界的前端,這對學術界的人來說,是常有的事情,而這往往也意味這一領域,對研究人員是一個巨大的挑戰和研究轉型的提示。那么,在旅游大數據研究領域,企業已經做了很多深入的挖掘開發和實踐應用,我們作為研究人員如何避免重復跟隨研究,轉而提出真正能夠引領行業、為行業創造新價值的新的科學方向呢?改進原來的思維模式可能是關鍵的一環。
首先,研究人員應該建立更具全局觀的大數據應用思維。和商業企業更多關注的用戶導向性不同,研究人員并沒有這個局限,因此思維和視野可以是面向更廣的層面。旅游大數據的研究者可能不一定能夠在數據挖掘的關鍵技術上做出更新,但是可以在應用層面研究更為廣泛。通過廣泛地觀察和研究大數據技術在其他領域的應用,以期為旅游大數據研究提供借鑒。大數據在金融、商業服務、交通等方面的應用都已經相對深入,有很多角度或者應用是為現在的旅游大數據研究所忽略的,比如大數據應用在金融行業非常重要,就是根據個人的信用消費進行征信評估,但是目前并沒有針對旅游者消費習慣和偏好的旅游者深度分類研究;再比如大數據在商業服務方面很重要,就是智能交通出行推薦,但是相應的,在旅游目的地或者在旅游景區內根據游客流量的智能線路推薦研究都是缺乏的。從更廣闊的背景來看,大數據在旅游行業可能的應用,會為研究者提供很多新鮮有趣的角度,而在這些角度上的研究突破會反向促進企業更商業化和針對性的研究與開發,這樣可以為旅游大數據的深入研究拓展出新的空間。
其次,旅游研究者應該學會跳出大數據技術的局限,分析問題不應從大數據開始,而是從對人、世界、產品或者旅游商業行為的本質認識入手,尋找并設計實際的旅游問題然后去大數據中尋找答案。著名數據科學家、2014圖靈獎獲得者Michael Stonebraker 2016年在微軟大會上提出:“用大數據進行應用研究,不能只看數據,也不必簡單執著于技術手段本身,更不能讓技術和思維來制約研究的想象,更重要的是通過合理的實驗設計從數據還原真實的場景。”他認為大數據研究的本質是盡可能用數據去還原真實的場景。所以,大數據研究,說簡單點,就是在統計學上應用機器學習,讓機器找出那些我們無法找到的東西。問題最關鍵的部分在于——應該讓機器去尋找什么。找出來之后如何解讀,這是領域專家應該知道的,只有對行業有充分的了解,才能從數據之中發現有價值的聯系。所以,旅游大數據專家一定先是旅游領域專家,要對旅游領域內需要解決的問題有充分的認識,發現問題,學會設計實驗,熟悉數學和統計,知道如何應用大數據現有技術獲取資料以及得到自己預期的結果。
大的方法論明晰了,具體到研究設計上,很多大數據科學家都分析過,大數據研究主要在三個層次:描述性分析(發生了什么)、預測性分析(可能發生什么)、指導性分析(選擇做什么)。所以,放到旅游研究的情景下,基于大數據的旅游研究設計也可以進一步細化為以下六個層次:
1. 現狀描述。現狀描述指的是利用各種大數據資料分析,來評估旅游組織/旅游者/旅游產品/旅游決策的現狀或者再進一步進行。這方面的研究目前是最多的,也是商業化最成熟的部分。研究者應該關注的就是哪些研究方法可以用于更好,或者更精確地還原場景。比如目前的一些商業統計和現狀描述所選取的描述和評價指標是否合理,能否通過更為合理易得的指標選擇,提供更為準確的現狀描述,從而避免因為輸入數據的誤差而導致的描述結果誤差。比較好的方式是使用大數據研究后,再通過小樣本的研究進行比較分析,通過三角驗證看看基于大數據的現狀描述研究是否能夠充分地反映現實。
2. 預測。很多旅游研究者都在從依賴大規模的調研轉而依賴更大規模并且可得的大數據,從原來的線性模擬、時間模型、神經網絡模擬等傳統數據方法轉移到混合頻率、網絡分析方法等非線性非傳統的方法來進行預測,最近的研究都顯示出比以往更加精確的預測結果。未來的預測研究將繼續利用可得的更加豐富的大數據,包括但不局限于社交數據、交通數據、搜索引擎數據,以及傳感器、手機數據等,依托于更新的分析技術,設計和選擇出更好的預測模型。
3. 行為解讀。根據大數據來分析游客的行為,理解行為的動機,從而為商業機構做出有利于未來的策略也將是重要的研究方向。旅游者行為分析是旅游研究的重要內容,在大數據時代,旅游者不斷地創造和產生新的數據,比如地理位置、消費數據、評價數據等,通過分析這些數據,可以比以往任何時代都能更好地去記錄旅游者的行為,去解讀不同旅游者行為背后深層次的原因,并根據這一深入分析做出更好的商業決策。例如,利用景區內游客移動的數據,可以分析游客在景區內移動的路徑以及原因,發現一些空白區域或者重要的聯結點,可以通過補充新的吸引物,從而豐富整個旅游景區的體驗。
4. 推薦。推薦是基于歷史資料,將廣告或商品推薦給潛在消費者。更好的推薦算法一直是計算機管理信息系統的研究熱點。一些比較好的算法或者成果,也可以適用到旅游推薦。目前,消費者和供給方來看,適用于最新推薦方法的研究都是不足的。從消費者來看,可以基于海量用戶消費結果進行旅游推薦研究,基于用戶個人消費特征進行旅游推薦研究,基于用戶自定義特征進行旅游推薦研究。從供給方來看,可以通過海量的瀏覽數據考察不同推薦產品和不同的推薦方法最終產生的點擊率以及轉換率,以尋找最優商業價值的推薦匹配等。
5. 決策優化。以往的旅游決策往往都是建立在人工的基礎上,不論對于旅游者還是商業機構都是一個費時費力的過程。因為大數據的產生和機器學習算法的使用,現在旅游研究已經進入可以通過程序自動建議產生參數,為游客和旅游企業提供解決方案的階段。比如,對于游客的決策優化,可以利用海量的旅游線路,讓機器選擇某一特定目的地在時間約束和約束內的最佳旅行線路,從而解決了游客自行設計線路的很多問題。對于企業來說,可以通過大量的數據輸入,去分析新的酒店、餐廳應該開設在哪一個地點會有更好的盈利,或者某一區位的地理特征,根據大數據的匹配選擇和分析,最適宜進行的旅游開發等。
總的來說,社會科學研究是一門發現、解釋和預測社會發展變化的學科。研究的核心在于引領社會的發展,讓社會行業的發展更加符合科學的原理。在這個快速改變的大數據時代,旅游研究要走在社會的前沿,需要研究者更廣泛地關注社會各個行業,發現可以在新數據和新技術條件下被解決或者可以被更好解決的問題。在如潮水般涌出的數據中,大浪淘沙,找出最關鍵和有價值的數據,來解讀和解決實際的問題,從而引領整個旅游行業更好地使用大數據,更好的發展。
(作者系該中心主任;收稿日期:2017-04-16)endprint