999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于用戶畫像下的在線旅游行程攻略推薦方法

2019-10-21 07:31:14陳浩昕謝雅丹
科學與財富 2019年32期
關鍵詞:大數據

陳浩昕 謝雅丹

摘 要:隨著互聯網技術的發展,在線旅游已擁有最大的旅游市場,如何為龐大的用戶群描繪用戶畫像,從而推薦與之匹配的旅游服務,是在線旅游企業進行精準營銷的重要技術手段。本文將構建基于大數據的旅游用戶畫像,為在線旅游行程攻略推薦提供行之有效的可操作方法。

關鍵詞:大數據;用戶畫像;在線旅游

引言

“大數據”一詞最早于2008年9月在《Nature》出版的專刊“Big Date”[1]提出,一面世便受到了學術界、各國政府與各企業的廣泛關注。Google、Facebook等企業最先在大數據分析領域進行了研究,根據用戶基礎行為數據,提出了一系列算法與模型,使大數據分析可以在多個領域的廣泛應用變為可能。

隨著社會的發展,旅游業已成為全球經濟中發展勢頭最強勁和規模最大的產業之一。如何將大數據與旅游發展相結合,是在線旅游企業的研究重點。本文將基于大數據下用戶畫像,給予在線旅游行程攻略推薦的幾種方法。

1基于在線旅游軟件的獨特用戶畫像構建

用戶畫像一詞,最早由Alan Cooper在《軟件創新之路》(1988)一書中提出。他認為,用戶畫像是根據用戶人口統計信息、社交關系、偏好習慣和消費行為等信息而抽象出來的標簽化畫像,是真實用戶的綜合原型[2]。傳統的基于用戶畫像的旅游情景化推薦,將基層用戶數據輸出為用戶畫像標簽,采取協同過濾方法,結合用戶情景信息建立了不同景點的推薦模型。

但旅游行程攻略不同于簡單的景點,需要對用戶(推薦主體)與行程(被推薦對象)進行標簽化,再進行標簽間的相關性分析。由于用戶畫像是基于大數據技術的實際應用,在構建用戶畫像前,就必須建立相關的基層數據庫。

1.1建立用戶畫像的數據庫:DMP

DMP(Data Management Platform),即數據管理平臺,是一個全面的數據收集、加工、整合的平臺,是對大數據的一個分析工具。其核心是通過平臺層的相關性算法,通過分析用戶的個體數據、行為數據等基層數據,將用戶的信息、偏好等轉換成數據標簽,再將數據標簽進行劃分和整合,形成一個個的用戶群特征,最終輸出為可視化的分析結果。

利用建立的DMP平臺,互聯網企業便可建立自己的數據庫與標簽庫,根據構建的算法與邏輯來計算出一系列用戶標簽,建立自己的用戶畫像與用戶群。因此標簽庫的整理與建立工作是構建用戶畫像模型的基礎。

1.2在線旅游用戶畫像標簽庫的構建

這里我們初步以構建靜態標簽庫和動態標簽庫的方式構建在線旅游用戶的用戶畫像。

1.2.1靜態標簽庫

靜態標簽能夠通過用戶提供的信息、能夠獲取的基本信息和通過外部渠道獲取的信息,如用戶實名制信息、地理位置信息等。靜態標簽庫精確性較高但表征性不明顯,只能給用戶興趣做一個初步判斷,比如年輕的都市女性,往往有較高的消費能力,在推薦策略上可以推薦高規格的一些內容。

①默認采集的設備信息 =(用戶手機型號,聯網方式,用戶IP地址與MAC地址,語言,地理位置)

②用戶的基本信息=(用戶的虛擬ID,姓名,性別,電話,生日,身份證號,所屬單位,郵箱,職業)

值得一提的是,用戶關聯的網絡信息,如微信、QQ、微博、支付寶等相關賬號,應作為關聯信息而不是靜態標簽進入數據信息系統之中。

1.2.2動態標簽

與靜態標簽相對的動態標簽可以分為兩類:一級標簽是支配用戶行為的淺層特征,二級標簽是決定用戶行為背后的深層邏輯,即具有向量特征的結構化和半結構化數據集[3]。

1.2.2.1動態標簽庫一級標簽

一級標簽是根據淺層用戶行為信息簡單總結得出的標簽,取決于用戶點擊、搜索某關鍵詞的頻率。關鍵詞的標簽庫在添加被推薦對象時往往可以通過上傳者、編輯、審查手動添加。因此,只需給出評估旅游行程攻略的幾個維度,就可作為關鍵詞庫,與一級標簽一一對應。

旅游行程攻略關鍵詞庫=(旅游目的地,交通方式,時間因素,點擊量,酒店品質,價格水平,目標群體,休閑程度,旅途風格,特征)

在構建旅游行程關鍵詞庫之后,便可根據用戶點擊、瀏覽的關鍵詞頻率來建立動態標簽庫一級標簽:

一級標簽=(自我評定信息,會員屬性,瀏覽與點擊,喜愛與收藏,喜歡與討厭,主動搜索或多次點擊的內容,關注的內容)

1.2.2.2動態標簽庫二級標簽

建立二級標簽的目的,是根據標簽將用戶歸納、總結到某個理想化的“虛擬人格”中,最終建立用戶畫像模型。在建立二級標簽庫之前,需要根據人格理論建立理想化的虛擬人格,再利用基于相關性分析的一級標簽所屬關鍵詞來評定虛擬人格幾個方面的相關特質,建立用戶的二級標簽。

人格特質模型中運用較為廣泛的是“大五人格”理論模型,在多次實驗中體現了穩定性(Goldberg,1981[4];Peabody,1987[5]),可以作為衡量人格特質的基礎依據。國內學者張雨青、林微等證明“大五模型”在中國同樣具有適用性[6]。

在參考五大人格量表之后,本文分別在神經質(Neuroticism)、外向性(Extraversion)、開放性(Openness)、宜人性(Agreeableness)、責任感(Conscientiousness)五個維度分別選取了六個下屬特質,作為旅游者虛擬人格構建的30個特質,并在此基礎上建立旅游者虛擬人格的測量模型。

神經質:N1平靜——焦慮、N2隨和——易怒、N3心態開朗——易受打擊、N4健談自信——敏感害羞、N5自制力強——沖動、N6勇敢——脆弱

外向性:E1消極疏遠——積極熱情、E2孤僻獨處——熱鬧合群、E3靦腆被動——自信果決、E4緩慢——急迫、E5謹慎傳統——冒險刺激、E6嚴肅——活潑樂觀

宜人性:A1猜忌悲觀——信任他人、A2精明虛偽——坦誠率真、A3自私勢利——熱心慷慨、A4攻擊性強——恭順克己、A5傲慢自負——謙遜謙卑、A6理性冷靜——友好熱心

開放性:O1理性現實——充滿幻想、O2審美疲乏——藝術敏感、O3情感遲鈍——情緒敏感、O4守舊傳統——求新求異、O5思辨力弱——思路開闊、O6尊崇權威——挑戰傳統

責任感:C1自卑——自信、C2雜亂無序——高效條例、C3不負責的——可信賴的、C4沒有目標——有抱負的、C5容易放棄——高度自律、C6沖動草率——深思熟慮

由于數據計算基于定量關系,在構建用戶虛擬人格時,以上列舉的30個特質都必須轉化成數值進行分析。每位用戶的初始特質分數為0,不同的一級標簽為該指數加分或減分,數值大小由基于相關性分析得到的相關性系數的大小來確定。最終形成一個位于(-100,100)區間內的分數。當分數位于(-100,-50)或(50,100)的區間內時,系統將會將此特質決定的二級標簽打在用戶身上,成為構建用戶畫像的一個特質標簽。

當一級標簽的數量足夠多時,就可以精準地描繪用戶的某個特征;當各特征值足夠多的時候,就會將用戶歸納到一個“虛擬人格”中,系統就可以為此一類用戶精準推送內容或廣告。

1.3構建用戶畫像與標簽庫算法的計算核心——相關性分析

利用Python計算兩數組間相關性是其中的一個方法:當用戶點擊了一個帶有多個關鍵詞的詞條,以各個關鍵詞的點擊量與其他點擊了該詞條用戶帶有的各標簽頻率關系做相關性分析,就可以選出相應的標簽為此用戶添加:

①建立數組:首先,根據各關鍵詞的點擊量與其他點擊了該詞條用戶帶有的各標簽頻率建立兩個數組

print(a)>> [A1,B1,C1……]

print(b)>> [A2,B2,C2……]

②期望

由于兩數組中數據一般為離散型隨機變量,因此采用離散型隨機變量公式:

③離散度:即標準差與方差,同樣采用離散型隨機變量公式。

④協方差與相關系數

接下來開始計算兩組數據的相關性,一般采用相關系數來描述兩組數據的相關性。

協方差:

相關系數:

同樣,除了利用Python計算相關性關系外,也可使用NumPy計算協方差矩陣相關系數、使用pandas計算協方差與相關系數、利用SPSS軟件分析變量間的相關性關系[7]等方法來實現算法構建。

2基于用戶畫像的旅游行程攻略推薦方法

2.1針對單個攻略的推薦方法

由于被推薦對象是單個的文本內容,對于分析其關鍵詞與目標群體特質相對簡單,因此采用基于內容的推薦方法。基于內容的推薦算法是一種擴展的信息過濾技術[8]:

傳統的基于內容的推薦方法只能根據用戶畫像標簽進行文本相似度計算給出敏感程度高的資源。由于沒有將用戶的虛擬人格融入到推薦方法中,不能預測用戶的興趣趨向。因此在本文研究中,將加入目標群體與虛擬人格之間的特質標簽,以減少該方法的缺陷。

假設參與推薦的推薦主體為用戶群U,每位用戶已被賦予的標簽集合為T。被推薦對象為內容C,被推薦對象已被賦予的關鍵詞為集合K,目標群體為u1(u1∈U)。

通過相關性分析計算K與T中各標簽的相關性系數P、u1的人格特質數值與T數值的相關性系數Q,將計算得出的兩數值P、Q通過權重計算得出最終指數I,指數I即為每位用戶對該被推薦對象的敏感指數。然后設立一闕值It,將此內容推送給敏感指數I≥It的用戶。最后比較目標群體的平均指數Ii與It之間的大小關系,反復調整闕值It,最終確立It的大小。

2.2針對單個用戶的推薦方法

在建立了用戶畫像與虛擬人格之后,用戶帶有大量的標簽與信息可供計算分析,面對資源庫中海量的資源,傳統的基于內容的推薦法不能適應用戶多變的性格特質,也不能挖掘用戶的未知領域。因此,當針對單個用戶的推薦方法時,目前使用范圍最廣泛、使用次數最多的協同過濾推薦法是一種優先選擇。也就是,我們可以運用基于用戶的協同過濾推薦算法和基于資源的協同過濾的推薦算法。

2.2.1基于用戶的協同過濾算法

假設用戶A的一級標簽為集合T1,包含n1個一級標簽,二級標簽為集合K1;用戶B的一級標簽為集合T2,包含n2個一級標簽,二級標簽為集合K2。

T1∩T2=T∩,T∩中包含的標簽數量記為n∩,α= n∩/n1,β=n∩/n2。

根據構建虛擬人格時所構建的30個特質,集合K1、K2各包含30個數值。因此數集K1、K2可以根據1.3中給出的相關性分析進行計算,得到的相關性系數記為η。

若α≥β≥75%,則稱用戶A與用戶B為興趣相似用戶,且用戶A為用戶B的興趣類型用戶;若η≥75%,則稱用戶A與用戶B為人格相似用戶。

在為用戶A推薦項目資源時,可以推薦其興趣相似用戶B喜愛的項目;在預測A喜愛的項目資源時,可以推薦其人格相似用戶B喜愛的項目。

2.2.2基于項目的協同過濾算法

假設用戶A喜歡的項目為C1,C1包含的關鍵詞集合為K1,包含m1個關鍵詞,關鍵詞能夠決定的特質數值的集合為U1;存在項目C2,C2包含的關鍵詞集合為K2,包含m2個關鍵詞,關鍵詞能夠決定的特質數值集合為U?2。

K1∩K2=K∩,K∩中包含的標簽數量記為m∩,α= m∩/m1,β=m∩/m2。

根據構建虛擬人格時所構建的30個特質,集合U1、U?2共包含30個數值。因此數集U1、U?2可以根據1.3中給出的相關性分析進行計算,得到的相關性系數記為η。

若α≥β≥75%,則稱項目C1與項目C2為內容相似項目,且項目C1為項目C2的內容類型項目;若η≥75%,則稱項目C1與項目C2為目標群體相似項目。

在為用戶A推薦項目資源時,可以將與項目C1內容相似的項目C2推薦給用戶;在預測A喜愛的項目資源時,可以將與項目C1人格相似的項目C2推薦給用戶。

3結束語

本文基于大數據下的用戶畫像,構建了在線旅游虛擬人格模型,為個性化旅游行程攻略推薦提供了方法。首先,根據用戶行為數據、用戶基本屬性構建用戶靜態標簽、動態標簽與虛擬人格,然后結合推薦內容的關鍵詞,利用多種算法進行相關性分析,最后根據基于內容、用戶、項目等被推薦對象給出了不同的推薦方法。在一定程度上為解決在線旅游企業旅游行程攻略解決了實際性問題,對于其他領域構建網絡虛擬人格也提供了思路。

參考文獻:

[1]Bigdata.Nature,2008,455(7209):1-136

[2]Alan Copper,劉瑞挺. 軟件創新之路[M].北京: 電子工業出版社,2001.

[3]謝康,吳記,肖靜華:基于大數據平臺的用戶畫像與用戶行為分析. 中國信息化 2018-03-10

[4]Goldberg,L. R. Developing taxonomy of trait-descriptive terms[J] Problems with languageimprecision;New directions for methodology of social and behavioral seienee,1981,9:43-65.

[5]Peabody,D. Selectingrepresentative trait adjectives[J]. Journal of personality and SocialPsychology,1987,52:59-1

[6]張雨青,林微,陳仲庚:家長對子女人格特點的自由描述明[J].心理學報,1995,3:281-286.

[7]孫逸敏:利用 SPSS 軟件分析變量間的相關性1008—3588(2007)02 -0120 -04

[8]Di Jiaqi, Wang Nihong. Incremental collaborative filtering algorithm based on GridGIS [J]. Computer Science,2013,40(12):219-222.

[9]陶俊, 張寧. 基于用戶興趣分類的協同過濾推薦算法[J]. 計算機系統應用, 2011, 20(5):55-59.

作者簡介:

陳浩昕,男(2000,4——),山西太原人,成都信息工程大學,2017級旅游管理本科生在校學生,研究方向:旅游管理。

謝雅丹(指導教師)女,(1979,8——),四川自貢人,成都信息工程大學,博士,講師,研究方向:文化遺產與旅游開發;智慧旅游;會展旅游。

猜你喜歡
大數據
基于在線教育的大數據研究
中國市場(2016年36期)2016-10-19 04:41:16
“互聯網+”農產品物流業的大數據策略研究
中國市場(2016年36期)2016-10-19 03:31:48
基于大數據的小微電商授信評估研究
中國市場(2016年35期)2016-10-19 01:30:59
大數據時代新聞的新變化探究
商(2016年27期)2016-10-17 06:26:00
淺談大數據在出版業的應用
今傳媒(2016年9期)2016-10-15 23:35:12
“互聯網+”對傳統圖書出版的影響和推動作用
今傳媒(2016年9期)2016-10-15 22:09:11
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 一本一道波多野结衣av黑人在线| 乱人伦99久久| 欧美国产日本高清不卡| 免费一极毛片| 免费jjzz在在线播放国产| 热99精品视频| 婷婷五月在线视频| 另类重口100页在线播放| 日韩亚洲高清一区二区| 欧美在线网| 美女被操黄色视频网站| 国产精品 欧美激情 在线播放| 国产美女在线观看| 99精品在线视频观看| 欧美综合在线观看| 毛片视频网址| 爱做久久久久久| 成人日韩精品| 九九香蕉视频| 久久99精品久久久久纯品| 成人一级免费视频| 亚洲视频二| 亚洲看片网| 国产啪在线91| 激情综合网激情综合| 国产一区成人| 91国内外精品自在线播放| 天天色综合4| 国产成人久久综合一区| 欧洲极品无码一区二区三区| 成年女人a毛片免费视频| 国产在线97| 欧美午夜小视频| 国模极品一区二区三区| 国产一国产一有一级毛片视频| 色网站在线视频| 婷婷六月激情综合一区| 国产在线一二三区| 亚洲第一综合天堂另类专| 亚洲av无码人妻| 日本久久网站| 中文字幕啪啪| 日本91视频| 国产久操视频| 综合色88| 久久久精品国产SM调教网站| 香蕉国产精品视频| 亚洲欧美日本国产专区一区| 亚洲欧洲日韩国产综合在线二区| 久久这里只有精品国产99| 久久精品亚洲中文字幕乱码| 欧美在线三级| 囯产av无码片毛片一级| 精品视频福利| 伊人福利视频| 欧美精品影院| 欧美激情一区二区三区成人| 国产精品视频猛进猛出| 亚洲天堂网站在线| 精品国产毛片| 五月天天天色| 九九九精品成人免费视频7| 亚洲欧洲自拍拍偷午夜色无码| 国产一区二区视频在线| 色AV色 综合网站| 成人噜噜噜视频在线观看| 福利在线不卡| 亚洲国内精品自在自线官| 午夜福利视频一区| 98精品全国免费观看视频| 日本高清有码人妻| 亚洲综合极品香蕉久久网| 一级香蕉人体视频| 亚洲精品国产乱码不卡| 国产喷水视频| 婷婷六月综合网| 欧美天堂在线| 亚洲bt欧美bt精品| 国产欧美视频在线观看| 国产午夜无码片在线观看网站| 亚洲欧美激情另类| 亚洲香蕉久久|