李君軼+張妍妍
隨著客觀世界各領域信息化的不斷發展,多元化數據的指數級增長趨勢愈加明顯,大數據(big data)概念應運而生,它代表著人類認知過程的進步,是繼云計算、物聯網等技術之后的又一次偉大變革。大數據中有相當一部分源于人類的生產和生活,而傳感技術的進步使得理解人類的活動成為了可能,人們開始嘗試使用計算機技術理解和運用人類社會的自然語言,情感計算應時而生,其相關理論及技術得到不斷提升和完善。
旅游是人類的一種生活方式,情感貫穿于旅游活動的始終。旅游前游客通過搜索目的地信息進行旅游決策、旅游預訂,旅游中游客可以基于地理位置分享即時的情感(積極或消極情感體驗),旅游后游客會對旅游整個過程進行滿意或失望的評述(博客、旅游虛擬社區)。這些基于Web2.0,通過移動互聯網進行信息的發布,用戶創造內容構成了旅游大數據的主要數據源,在情感計算等技術的支撐下,挖掘旅游大數據所包含的情感成為了旅游研究的新方向。
一、大數據視角下旅游情感研究的路徑
對于大數據的分析和應用,需要不同領域專家建構分析模型,這些模型能夠為情感理論的拓展和情感實踐的延展分析提供有效的分析工具。總結來說,大數據視角下的情感研究遵循“數據——情感計算——情感分析模型——理論和實踐工程”的路徑展開。
1. 大數據:旅游情感研究的數據源
大數據是連接物理空間(physical space)、信息空間(cyberspace)和人類社會(human society)三元世界的紐帶,其數據源涵蓋科學研研究、社交網絡、電子商務、物聯網、移動通信等多個領域,蘊含巨大的社會價值。尤其是Web2.0 環境下,搜索引擎、社交媒體、電商平臺迅猛發展,非結構化數據、異構內容、個性化內容呈指數級增長,用戶自生成內容(UGC)成為了一種新興的網絡信息資源創作與組織模式,其內容涵蓋娛樂、商業、社交、興趣、輿論等類型。旅游大數據源包括Facebook、Twitter、微博、旅游虛擬社區等社交媒體產生的各類的短評和游記,在旅游電商平臺(OTA)購物后留下的評論信息等多種類型。這些UGC內容中蘊含著豐富的情感信息,為深入挖掘用戶情感提供了海量數據。以文本形式呈現的UGC成為了情感分析和觀點挖掘(sentiment analysis and opinion mining)的重要來源,尤其是UGC用戶創造的大量主觀文本和復雜交互式文本,具有更多的主觀能動性、多樣性和情感的復雜性。
2. 情感計算:旅游情感研究的推動力
近年來,“情感”也引起了學者們越來越多的關注,尤其是在大數據背景下,越來越多的學者開始嘗試利用不斷發展的計算機技術對情感進行量化研究。其中,“情感計算”概念的提出對于情感研究來說具有里程碑式的意義,其目的是賦予計算機識別、理解、表達和適應人的情感的能力,使邏輯計算與感性情感實現有機融合,使計算機具有更高的、全面的智能。通過強大的存儲和計算能力,計算機可獲取各種設備上的海量情感信號,建立情感數據庫,標注情緒并提取反映情感狀態的特征,訓練識別情感的模型,進而映射外在情感表現,理解并反饋情感狀態,進而達到情感交流的目的,即情感信號的獲取、情感狀態的識別、情感理解和反饋以及情感表達。國內外也已經有了很多的關于情感計算的模型和軟件,這些都為情感分析提供了有力的工具,推動著基于大數據的情感計算和分析。
3. 情感分析模型:理解情感行為的鑰匙
情感研究的終極目標是理解人類的情感體驗和情感行為,量化后的情感數據為進一步的研究提供了基礎性資料,因此在游客情感計算的基礎上,更為重要的任務是構建游客情感分析的框架和模型,這是游客情感研究的核心所在。情感分析模型是在情感計算基礎上是對數據的深層次挖掘。不同領域的專家利用量化的情感數據,根據研究和應用目的,構建領域內的情感分析模型,這些模型包括游客情感體驗時空分析模型,游客情感—滿意度分異模型,游客情感的影響因素分析模型等,通過這些應用和理論模型的分析,可以揭示游客情感體驗的規律,分析影響因素,最終理解游客的情感行為。
二、大數據游客情感體驗研究的展望
1. 游客情感計算及其模型的進一步優化
在計算機科學、心理學、生理學、神經科學、認知科學等學科的共同推動下,情感計算取得了較為豐碩的成果。但情感計算是一個高度綜合化的領域,如何提高計算機感知情境、進一步理解人類情感和意圖仍是情感計算面臨的巨大挑戰。情感是一個多成分的復合過程,包括內在體驗、外顯表情和生理激活三種成分,且情感狀態與情感信號之間存在復雜的映射,雖然多模態信息融合技術可使計算機同步分析視頻、音頻、生理指標等多種信息,但情感的變化受到具體情境和個人因素的影響,因此如何針對不同情境和不同群體進行情感計算建模,如何處理個性和共性之間的矛盾成為情感計算亟待解決的問題。尤其是針對UGC文本的“情感分析技術”,主要涉及兩種方法,分別為基于機器學習的方法和基于情感詞典的方法。針對游客這一類特殊群體的情感計算不僅具有一般的共性特征,同時也有其特殊之處,因此專門針對游客情感計算的機器學習和情感詞提取以及計算規則的研究是游客情感計算的核心所在。同時,不同語境之下情感詞具有不同的情感意義,因此精確提取情感詞的特征仍有待進一步優化,如機器學習算法的精進,情感詞典的自動構建等仍需要進一步的深化研究。
2. 構建基于大數據的情感——滿意度分析模型
情感要素不僅影響游客目的地選擇決策,而且影響游客在旅游體驗過程中的滿意度判斷。情感對于分析滿意度必不可缺,因而構建情感——滿意度的判斷模型勢在必行,可以利用大數據直接進行滿意度的分析,省時省力。通過對微博、游客點評、游記、評論等旅游大數據的分析,研究游客在旅游活動過程中體驗到了哪些類別的情感(積極或消極),其典型情感與游客之間以及滿意度之間的關系,構建情感滿意度分析方法和模型。
3. 情感時空的縱深拓展
流動性是旅游活動的一個重要特征,尤其是游客情感貫穿于旅游活動的始終,并隨旅游者的時空轉移而不斷發生變化,產生諸如愉悅、興奮、驚奇、疑惑、憂愁、恐懼、憤怒等多種情感,這些情感會隨著旅游的動態過程而呈現出多樣化和易變性的特點。游客情感研究的傳統方法——“感官日志”法,無論對研究者還是被調查者來說均是一種毅力的挑戰,但微博、游記等社會化媒體數據,具有典型的時空特征。通過挖掘上述旅游大數據,可以分析不同時空尺度下游客情感體驗的波動規律,不同主題類型旅游目的地(景區)游客情感體驗的變化,不同游客群體的情感時空對比,研究游客時空情感變化的影響因素及其變化機制。
4. 情感研究的隱私保護
大數據蘊藏著巨大的社會價值,但對其挖掘和分析人存在一個不可避免的挑戰,這就是個人隱私。在旅游領域,對承載著游客豐富個人情感的旅游大數據的分析,可能會遇到更多的隱私問題。首先,游客情感數據本身的非公開性。其次,游客在旅游過程中的表演性行為問題,即語言、文字、圖片、視頻等并未展示游客的真實情感,那么如何探析這些情感的真實性,如何讓游客不認為研究者在窺探其隱私的情況下,剖析非語言行為和難以被表達的情感。最后,獲取情感數據的原則和監管機制的構建,即如何在保密的原則下,嚴謹、客觀地獲取數據,如何歸屬個人數據的法律責任,如何監督個人數據的使用,制定完善的監管機制成為未來的重要挑戰。endprint