茅雙雙 關海怡 郝志成


[提要] 我國高鐵旅游市場發展迅速,高鐵逐漸成為我國國民的主要旅游出行方式,旅游客群也日漸成為高鐵客運市場的重要組成部分,了解和引導高鐵游客的旅游行為,對旅游目的地的產業配置模式及旅游業發展具有重要的意義。本文借鑒用戶畫像概念,基于移動大數據挖掘分析和問卷調查,采集七大高鐵客流站點的25項數據指標,并將其劃分為7個維度,構建高鐵游客群畫像,力求掌握高鐵游客的來源省市、人群構成、景區偏好、酒店選擇、交通喜好、購物傾向等特征,為高鐵旅游發展提出可行性建議。
關鍵詞:高鐵旅游;大數據挖掘;問卷調查;游客畫像
中圖分類號:F713.52 文獻標識碼:A
收錄日期:2020年1月13日
近年來,我國高鐵的飛速發展逐漸改變了人們的出行方式,以交通為基礎要素的旅游業也正全面迎來高鐵旅游新時代。高鐵旅游客群成為人們研究的重點,但是傳統的問卷調查、實地調研并不能全面、精準的掌握高鐵客群的特征,基于數據的用戶畫像分析則可以有效地構建游客畫像,掌握高鐵旅游客群的顯著特征,推動高鐵旅游的發展。
一、用戶畫像研究現狀
“用戶畫像”起源于交互設計之父艾倫庫珀提出的“Persona”概念,即通過數據來分析用戶目的、行為以及觀點差異,以此為依據將用戶分成具有不同典型特征的類型,并給每種類型取名、賦予可視化照片、一些人口統計學要素和場景描述,形成一個人物原型。大數據技術的發展與成熟為基于數據的“用戶畫像”提供了技術基礎,廣泛地運用于各個領域中,用戶畫像逐漸成為國內外學者的研究熱點。
國內對于用戶畫像的研究已經深入電子商務、教育、移動網絡、企業營銷、扶貧等多個領域。張長浩等人基于國網商旅信息數據,基于人們出差過程中出行方式的優化選取以及酒店住宿的偏好,構建一種用戶畫像框架技術,創建了基于雙層XGBoost的多視角融合模型,提升分類精確率,實現快速、準確識別敏感客戶群體。劉超等人采用Hadoop框架,應用DPI深度挖掘和分布式爬蟲等技術,快速準確地獲取用戶的手機號碼和終端類型,將家庭用戶的行為偏好相關聯,最終塑造固網寬帶下的家庭畫像,從整體上洞悉用戶的需求,做到精準營銷,改善用戶體驗質量。黃山將學生畫像技術運用于高校學生事務管理領域,這有利于學生事務管理理念的轉變、學生評價機制的完善,還能讓個性化思想政治教育成為可能。劉海鷗等人基于用戶畫像視角,構建了融合圖書館用戶基本信息標簽、內容偏好標簽、互動標簽、會話標簽、情境標簽的圖書館用戶畫像模型,并引入情境化推薦方法為讀者提供精準的個性化知識推薦服務,為提升我國圖書館的大數據知識服務水平提供了新的研究視角。陳冬玲等人通過對貧困人口的行為痕跡數據進行搜集、整理、分析,形成貧困對象大數據畫像,為提升脫貧成效提供數據支撐。
國外對于用戶畫像的研究相對較少,主要在其內涵、產品研發等方面。Chikhaoui、Wang和Xiong等人提出了一種基于因果關系的用戶畫像模型,利用序列聚類算法、概率后綴樹、標準化互信息(NMI)度量抽取用戶行為特征,從而實現單個用戶識別和活動預測。Trusov、Ma和Jamal將用戶畫像視為是用戶通過在線活動所表現出來的興趣和偏好的特征集合。Lerouge、Ma和Sneha等人以中國老年慢病用戶群體為例,通過焦點小組訪談法、采訪法、實地觀察法收集用戶數據構建老年慢病用戶畫像,并根據這類用戶的需求特征,研發面向老年慢病用戶的應用程序。
從現有研究來看,首先基于大數據的用戶畫像研究相對較少,多數研究是在一些理論的支持下,結合研究者的知識和經驗來描繪用戶的屬性差異,從而抽取用戶特征?,F有的大數據畫像研究也主要運用機器學習方法,例如決策樹、邏輯回歸等方法進行研究,尚未深入融合大數據技術。其次,用戶畫像在旅游領域內的研究相對較少,尤其是在高鐵旅游方面幾乎為零。與高鐵旅游經濟相關的成果已經有所發表,但對于高鐵旅游客源群體等微觀領域內的研究相對較少,特別是基于大數據的分析更是較少,且研究方法單一,已有研究中主要以傳統的問卷調查和分析方法進行研究,缺乏統計分析、數理模型等的定量化的分析方法,從而難以較準確地表征高鐵游客的多維度特點。本研究將基于用戶畫像這一概念,運用大數據分析與挖掘技術并結合問卷調查數據,聚焦高鐵旅游客群這一微觀主體,刻畫出高鐵游客群體的基本特征、行為特征及偏好等,建立高鐵旅游客群多源數據的分析與應用框架,研究相關措施,促進高鐵旅游的發展。
二、研究方法
本文主要采用移動數據分析法和問卷調查數據法,根據研究目標綜合考慮數據可獲得性,分析意義等,從游客實際行為特征和心理需求特征兩個方面對高鐵游客進行七大維度的畫像分析。實際行為特征包含高鐵游客客源市場特征、人口統計學特征、社會經濟特征、旅游行為特征及移動應用使用特征,心理需求特征包含需求偏好特征及群體差異特征,如表1所示,其中前5個維度由移動數據分析,后2個維度由調查問卷數據分析。(表1)
(一)移動數據分析法。移動數據分析法就是使用大數據采集與分析技術,即LBS、APP、LBS融合APP以及業務規則融合機器學習等人工智能技術,基于海量移動大數據,從多方面刻畫高鐵游客畫像,分析高鐵旅游客群的基本特征,涉及客源市場特征、人口統計學特征、社會經濟特征、旅游行為特征、移動應用使用特征五個維度。對2019年1月份和8月份北京南站、哈爾濱西站、鄭州東站、上海虹橋、貴陽北站、廣州南站和成都東站7個高鐵站點的高鐵游客進行移動數據的游客畫像分析,涉及性別、年齡、婚姻狀況、資產、活動等方面。移動數據內容包含游客的GPS軌跡、基站定位數據、公交卡軌跡、WIFI定位數據等,還包括移動社交網絡中簽到軌跡、帶有GPS標記的圖片軌跡數等。
1、數據采集?;谠O備識別技術和地理位置分析算法,在終端用戶授權情況下對7個選定的高鐵站點游客進行相關數據的挖掘和分析,共計5個維度22項數據指標1,178,908個樣本。這種不需要埋點的偵測最大限度保證了數據采集中對于設備產品的保護,有效地實現了數據安全的系統性要求。
2、數據處理。數據處理過程總體上均為將各種數據源數據進行清洗,在去重、去噪以及一致性處理等后,根據各種采集指標的要求,基于LBS數據、APP數據、POI數據以及第三方數據等進行綜合處理。LBS數據是通過電信移動運營商的無線電通訊網絡(如,GSM網、CDMA網)或外部定位方式(如,GPS)獲取移動終端用戶的位置信息(地理坐標或大地坐標),并在GIS(地理信息系統)平臺的支持下,為用戶提供相應服務的一種增值業務;APP數據指用戶移動設備中下載安裝的手機應用數據,以此分析游客的某些行為特征;LBS和APP融合數據處理能夠綜合游客的位置行為信息與APP所體現的用戶行為特征信息,從而分析出游客的地點選擇。對于無法直接獲取的游客特征,則通過業務規則融合機器學習等人工智能技術進行分析。具體處理方式如表2所示。(表2)
(二)問卷調查法。調查時間為2019年12月9日~15日,從需求偏好特征及差群體性異特征入手,以專業性旅游研究網絡社群、城市規劃網絡社群、親子旅游媽媽網絡社群、旅游達人網絡社群、空港工作人員網絡社群、旅游自媒體網絡社群、短視頻網紅主播社群、攻略網站旅行家社群、高校教師和學生網絡社群、網絡優惠信息分享社群、社區業主社群、自駕旅游信息溝通群等為主展開調研。調查內容涉及游客對高鐵旅游認知、行為意愿、行為模式、旅游決策、需求偏好、國內外高鐵旅游評價以及發展建議等方面。
1、數據采集。采用線上調研方式,受訪者涉及我國31個省及直轄市,既包括高鐵骨干網上的北京、上海等,也包括重要區域支線上的四川、重慶和安徽等,同時也有城際高鐵的天津、南京和長春等。同時,為了防止出現結構性偏差(即受訪者均來自于高鐵網絡所在省市),還面向未形成高鐵網絡的地區收集了樣本,線上共回收2,945份問卷。
2、數據處理。經過對回收問卷的檢查和刪選,最終獲得有效問卷2,207份,有效率為74.9%,并依據需求偏好特征及差群體性異特征進行分類,包含選乘高鐵出游態度、出游動機、高鐵票價偏、高鐵乘車時長偏好、高鐵乘車時間偏好、對高鐵列車的服務需求、對高鐵站點的服務需求、對高鐵官方APP的服務需求、不同月收入群體差異、不同學歷群體差異和不同婚育狀況群體差異,共計11項數據指標。
此外,本文還運用了實地調研方法。對總公司、鐵路局、鐵路旅游公司和高鐵旅游乘客進行調研訪談,明確高鐵旅游發展現狀及存在的問題,建立高鐵旅游經濟的應用研究體系框架。研究提出高鐵旅游產品設計、市場開發與經營模式等相關方案,以促進高鐵旅游發展。
三、高鐵游客畫像結果分析
(一)客源市場特征方面。各城市的高鐵客源省份主要以周邊中近程省份及主要高鐵線路沿線省份為主,哈爾濱的高鐵游客主要來自京哈高鐵沿線省份;廣州的高鐵游客則主要來自京廣、貴廣高鐵沿線;成都的高鐵游客則多來自西成高鐵、成渝高鐵及相應延長線的沿途省份,北京、上海、鄭州三座城市,由于是高鐵樞紐城市,集中著多條高鐵線,其高鐵游客來源省份則更為分散,且經濟發達省市是高鐵目的地城市的重要客源地,未來在品牌宣傳及廣告投放時,應重點關注這些城市的游客需求。
(二)人口統計學特征方面。人口統計學特征主要是從性別、學歷、年齡、婚姻以及有無子女方面開展調查的,調查顯示高鐵游客主要呈現以下特征:(1)男性居多;(2)年齡以16~35歲為主,中青年居多;(3)已婚游客占比較大且無子女人數較多;(4)學歷普遍較低。對此未來高鐵旅游在服務升級、產品創新等方面需要多方兼顧,盡量照顧到每一代人、不同類型人的需求。
(三)社會經濟特征方面。資產方面,由于各地區、各城市的收入水平不盡相同,所以無法以絕對收入數值界定收入檔級。本處對于高、中、低收入的劃分,是以多個維度并參考樣本常住城市的整體收入水平綜合判斷??傮w來看,高鐵游客中低資產等級占比約四成;與此同時,中高資產人群占比則接近六成,高鐵游客的購買力度相對較強,在高鐵旅游產品創新和業態升級方面需注重品質及性價比。
(四)旅游行為特征方面。涉及吃、住、行、游、娛、購,即旅游六要素方面。飲食方面:自助餐、燒烤烤肉、火鍋、咖啡酒吧茶館飲品、川湘菜等類型的占比較大,總體而言高鐵游客去往各目的地時多會選擇當地最有特色的餐飲類型,如東北的烤肉、廣式的甜品及粵菜、川黔的火鍋及川菜等。住宿方面:游客對住宿的選擇更趨于個性化,民宿、公寓式酒店等成為高鐵游客的新選擇。此外,經濟越發達的城市對星級酒店的傾向度越高,反之則低。交通方面:游客更傾向于選擇高效快捷和耗時短的交通方式,鐵路交通尤其是高鐵成為多數人的選擇。游玩方面:各城市的高鐵游客都比較傾向于去其周邊的主要城市,最感興趣的旅游景點類型是主題樂園,其次是古代遺跡和歷史建筑,山水風光和現代街區也是很重要的部分,且大學生團體和親子游團體在這兩個時間段呈現出較大的群體優勢。購物方面:高鐵游客的資產水平還是處于較優的水平,其旅游消費能力相對較強,城市氛圍、品牌形象、產品品質等對高鐵游客購物有一定影響。娛樂方面則偏好短時、高頻、近程的周末游玩。因此,在設計高鐵旅游產品時要盡量參照游客食、住、行、游、購、娛方面的偏好特征,因人制宜。
(五)移動應用使用行為方面。游客經常使用的APP,一是可以反映其上網偏好;二是可以根據熱門APP來制定廣告投放計劃。從各城市高鐵游客的APP使用偏好來看,社交軟件(微信、微博等)的使用頻率最高,其次是綜合商城(淘寶、京東等)和短視頻(抖音、快手等)類APP。此外,在線視頻(愛奇藝、騰訊視頻等)、拍攝美化(美圖、美顏相機等)等APP也有較高的使用頻率景區與相關鐵路部門可以依據游客APP的使用偏好特征進行信息的推送及服務平臺的拓展。
(六)需求偏好特征方面。近八成的受訪者對于選擇高鐵作為外出游玩的主要交通方式這一問題持積極正面的態度。探親訪友或回鄉、休閑度假和觀光游覽是高鐵出行的三大主要動機。有關游客對高鐵旅游服務需求的主要是涉及高鐵站點、高鐵列車和官方APP。高鐵站點方面,游客最希望的是優化換乘,實現無縫接駁;高鐵列車方面,游客最希望的是加強高鐵與目的地聯動,實現憑高鐵票享景區優惠門票;高鐵官方APP方面,游客最希望的是增加高鐵行程展示地圖,實現個性化的高鐵行程可視化。
(七)群體性差異方面??傮w而言,不同月收入、不同學歷和不同婚育狀況的群體在高鐵旅游偏好和需求方面具有明顯的差異。
四、結論及建議
(一)結論。通過大數據分析和問卷調查數據,從7個維度刻畫了高鐵游客群的行為特征和需求偏好的畫像,得出以下結論:(1)經濟發達地區是高鐵游客的主要客源地,這些游客傾向于便捷、快速、銜接良好的交通體系。(2)高鐵游客偏好具有當地特色的旅游產品,希望獲得一站式的個性化服務并獲取相關優惠。(3)高鐵游客偏好網絡APP獲取相關資訊,分享、便利自己的生活。
(二)建議
1、選定目標客群,開發產品。不同地區、性別、年齡、學歷等的高鐵游客有著不同的行為特征以及需求,每個高鐵旅游目的地首先需要明確重點的客源市場,了解、掌握目標客群的需求才能進行精準營銷。如,應對大學生團、親子游興盛的現象可以開發研學旅游、夏令營等高鐵旅游產品,針對老年團則設計夕陽紅高鐵旅游產品。
2、創新“高鐵+”旅游新業態。充分利用好“高鐵+旅游”的優勢,加強高鐵與目的地的聯動,推出多種高鐵旅游產品新業態。如,針對高鐵游客關注的憑高鐵票享景區優惠門票的問題,開發打造“高鐵+景區”的新模式,與目的地景區合作,為游客提供門票等優惠。
3、完善高鐵旅游接駁服務設施。加快高鐵與其他交通工具的組合方案,推動“高鐵+飛機”、“高鐵+租車”、“高鐵+地鐵”、“高鐵+公交”等交通運輸組合,構建特色交通旅游產品組合,對內銜接以高鐵為核心,實現高鐵站場到旅游目的地的換乘無縫對接。比如,設置從高鐵站到市中心及主要旅游景點的旅游交通大巴專線,在高鐵站或網上購票。
4、利用網絡APP進行營銷推廣。隨著互聯網技術的發展,越來越多的游客選擇在網絡平臺上獲取相關資訊,高鐵旅游目的地可開發官方APP,實時向游客提供最新資訊,包括實時景觀視頻、優惠策略等,并增加高鐵行程展示地圖,實現個性化的高鐵行程可視化。此外,與時下流行的網絡平臺如微博等合作投放廣告,推廣高鐵旅游。
主要參考文獻:
[1]張長浩,余志勇,周振,石瑞杰,王新勇.基于國網商旅大數據融合背景的用戶畫像構建[J].電信科學,2019(12).
[2]劉超,劉馨璐,王攀,張麗娜.基于DPI和大數據分析的寬帶家庭畫像[J].計算機技術與發展,2018.28(12).
[3]黃山.學生畫像技術在高校學生事務精準管理的運用[J].科學咨詢/教育科研,2019(13).37.
[4]劉海鷗,姚蘇梅,黃文娜,張亞明.基于用戶畫像的圖書館大數據知識服務情境化推薦[J].圖書館學研究,2018.443(24).
[5]程冬玲,聶燕敏,韓素芬.基于大數據畫像的精準扶貧服務研究[J].無線互聯科技,2019(22).
[6]Chikhaoui B,Wang S,Xiong T,et al.Pattern-based causal relationships discovery from event sequences for modeling be havioral user profile in ubiquitous environments[J].Information Sciences,2014.285(11).
[7]Trusov M,Ma L,Jamal Z.Crumbs of the Cookie:User Profiling in Customer-Base Analysis and Behavioral Targeting[J].Marketing Science,2016.35(3).
[8]Lerouge C,Ma J,Sneha S,et al.User profiles and personas in the design and development of consumer health technologies[J].International Journal of Medical Informatics,2013.82(11).
[9]馮英杰.高鐵時代背景下的城市居民出游行為研究[D].南京:南京大學,2012.
[10]方敦禮.高鐵背景下長三角地區發展慢旅游的思考——基于旅游者行為模式的視角[J].經濟研究導刊,2013(16).
[11]Lederman.Track-monitoring from the dynamic response of an operational train,Mechanical Systems And Signal Processing,2017.15(2).