999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于用戶畫像的信息智能推送方法*

2016-12-21 07:14:06姜建武李景文陸妍玲葉良松
網絡安全與數據管理 2016年23期
關鍵詞:詞匯智能用戶

姜建武,李景文,陸妍玲,葉良松

(桂林理工大學 測繪地理信息學院,廣西 桂林 541004)

?

基于用戶畫像的信息智能推送方法*

姜建武,李景文,陸妍玲,葉良松

(桂林理工大學 測繪地理信息學院,廣西 桂林 541004)

針對傳統信息推送服務由于缺少對用戶個人綜合因素的考慮,存在針對性差、推廣轉化率低的問題,在大數據理論基礎上提出了一種基于用戶畫像的智能信息推送方法。該方法將用戶抽象為結構化信息本體,通過構建行為-主題、主題-詞匯及行為-詞匯三位一體的數學模型,研究基于用戶畫像的信息本體提取方法。采用包含對象、時間、地點、內容、行為和重返次數六方面內容的事件描述法計算本體權重,以此構建用戶畫像。設計了基于用戶畫像的智能信息推送系統,為大數據環境下面向用戶的智能信息推送提供了一種新的方法。

用戶畫像;信息推送;信息本體;大數據

0 引言

基于“用戶畫像”的信息智能推送服務已經廣泛應用于亞馬遜、京東、阿里、百度、百分點、騰訊等電商和信息服務企業,國內外眾多學者也對其進行了深入研究。彭藝等研究了云環境下智能推送服務在數字化教學中的應用[1];顏友軍研究了移動平臺上基于本體知識庫的問答與Web服務推送系統[2];赫磊研究了基于云平臺的智慧旅游信息推送系統[3];黃舒榕提出了基于JXTA的移動智能小區信息推送服務平臺[4];劉海等采用4C理論構建了服裝領域的“用戶畫像”數據庫,并在此基礎上構建了精準營銷細分模型[5];莫靜泱構建了B/S架構的用戶健康消費智能推送系統[6];肖鋒等圍繞LBS服務、情景模型和智能信息推送,提出了基于位置的智能信息服務模式[7-8]。然而,這些研究都是傳統的信息推送方法,缺少對用戶的偏好、時間、購買力等個人因素的考慮,導致推送信息泛濫,缺乏精準性。本文研究了用戶畫像數學模型的構建及基于用戶畫像的智能信息推送方法,通過對用戶網絡行為數據和個人信息數據的采集、處理,建立用戶畫像數學模型,提取信息本體、計算本體權重,構建用戶個人信息畫像,并融入信息智能推送過程,提供面向用戶的個性化精準信息推送服務。

1 構建用戶畫像數學模型

1.1 信息本體的確定

用戶畫像又稱用戶角色[9],是一種大數據環境下用戶信息標簽化方法。信息本體是一種語義本體,分為靜態(如人口屬性、商業屬性等)和動態兩類。靜態本體來自用戶注冊信息,該類本體自成標簽,在實際提取中主要進行數據清洗工作。動態本體隱藏于用戶隨機互聯網行為中,具有隱蔽性,需通過數據分析,挖掘隱藏信息并提取本體,其提取過程如圖1所示。

圖1 動態本體提取過程

圖1中,K表示主題集合,M表示行為集合,Nm表示第m個行為中的詞匯個數,α,β為先驗參數。

動態本體的提取分為數據預處理、行為-主題建模、主題-詞匯建模和行為-詞匯建模四個部分,其中行為-主題模型與主題-詞匯模型服從Dirichlet分布,行為-詞匯模型服從Multiomial分布。

(1)行為數據預處理

首先過濾用戶行為數據,去除非文本信息,且只保留行為文本中的動詞和名詞[10],然后求解各詞匯的TF-IDF指標,保留指標在70%以上的詞匯,構成動態本體數據源。

其中,TF指詞項頻率,TF-IDF指逆文檔頻率[11],TF-IDF指標的計算公式為:

(1)

式(1)中,N代表互聯網行為總集,ni為詞匯i出現過的行為集合,j為某一行為記錄,fi,j表示詞i在j中出現的次數[12]。

(2)行為-主題建模

從參數為α的Dirichlet分布中抽取各文檔M對應的行為-主題分布模型,記為θm,則有[10]:

θm~Dir(α),m∈[1,M]

(2)

其中整個行為庫中主題的生成概率為:

(3)

(3) 主題-詞匯建模

從參數為β的Dirichlet分布中抽取各主題K對應的主題-詞匯分布模型,記為φk,則:

φk~Dir(β), k∈[1,K]

(4)

其中所有主題中詞匯生成的概率為:

(5)

根據主題生成概率和詞匯生成概率得出主題-詞匯的聯合分布為:

p(w,z|α,β)=p(w|z,β)p(z|α)

(6)

(4) 行為-詞匯建模

根據主題-詞匯分布模型和行為-主題分布模型,則行為m對應的第n個詞匯的計算過程為:

① 從θm中采樣一個主題,記為Zm,n,則[10]:

(7)

② 根據計算的主題Zm,n,從φk中取出與Zm,n對應的特定單詞Wm,n:

Wm,n~Mult(Zm,n)

(8)

在以上求解過程中,Wm,n為獲取量,Zm,n為隱含量,本文采用Gibbs Sampling采樣法求解Zm,n,由于圖1中①和②兩過程均服從Dirichlet-Multiomial共軛分布,根據前述所得的聯合分布p(w,z|α,β),并將行為Z中的第i個詞對應的主題記為Zi,i表示去除下標為i的詞,假設已經觀測的詞wi=t,則有如下推導:

p(zi=k|z,w)∝p(zi=k,wi=t|z,w)

(9)

(10)

根據以上兩式,得到最終行為-詞匯模型的Gibbs Sampling公式如下[13-14]:

(11)

通過以上步驟,提取用戶隨機互聯網行為中的動態信息本體,綜合靜態信息本體,構成用戶畫像數學模型的label參數。label只能表示用戶的興趣偏向內容,而無法體現偏向程度,需計算label權重p(i)。

1.2 本體權重的計算

權重用于表示用戶對某一本體的偏向程度。靜態本體相對穩定,權重設為1。目前,用戶畫像標簽權重的計算主要考慮對象、時間、地點、內容4個因素,文中提出用戶隨機互聯網行為的對象、時間、地點、內容、行為和重返次數6因素事件描述法,可更全面地描述用戶的隨機互聯網行為。采用6因素事件描述法表示的互聯網隨機行為動態本體的權重計算方法如下:

(1) 對象

對象即互聯網上區分用戶的標識(Cookie、IP、Email、身份證等),不同標識的可信度不同。對象權重為該標識可信度值與可信度值總和的比值,即:

(12)

(2) 時間

時間包含時間戳和時間間隔兩方面內容。時間戳用于標識事件發生、結束的時刻,時間間隔用于標識瀏覽時間,則時間對動態本體的權重T(label)記為瀏覽本體的時間與用戶所有上網時間的比值,即:

(13)

(3) 地點(接觸點)

地點是用戶互聯網行為的接觸點(天貓、官網等),用戶行為接觸點的不同,對標簽的影響亦不同。為不同接觸點設置重要程度度量值,則地點對本體的權重L(label)為:

(14)

(4) 內容

內容是動態本體權重的重要組成部分,標識了一個互聯網行為的核心,用C(label)表示,即該動態本體包含詞匯的最大TF-IDF指標:

(15)

(5) 行為

行為是用戶對網站內容的操作,如瀏覽、收藏等,不同的行為具有的權重不同,用A(label)表示,計算公式為:

(16)

(6) 重返次數

重返次數體現了用戶對該網站(產品、內容)的關注程度,這將在很大程度上影響該次互聯網行為的“有效性”。重返次數采用R(label)表示,其權重為該行為的重返次數與用戶所有瀏覽次數的比值,計算公式為:

(17)

1.3 用戶畫像最終數學模型

用戶畫像最終數學模型如式(18)所示。

C(label)+A(label)+R(label)]×0.2×ri}

(18)

式中labeli表示某一方面用戶的信息標簽,p(i)表示該標簽的權重,Obj(label)、T(label)、L(label)、C(label)、A(label)、R(label)為事件對應六方面內容對標簽的權重,r為衰減因子,用來描述信息本體對某一標簽的興趣隨著時間變化的衰減程度。

2 基于用戶畫像的智能信息推送系統

推送技術的模式分為操作式推送和觸發式推送兩種[15]。基于用戶畫像的智能信息推送系統是操作式推送與觸發式推送的結合體,即客戶端操作觸發信息推送與服務器主動推送二者相結合。該系統分為數據獲取及處理、信息本體獲取及權重計算、信息推送三個階段,具體過程如下:

(1) 數據獲取及處理

用戶基本數據(年齡、體重等)通過注冊信息獲取,該部分信息相對穩定,為靜態信息本體(如表1所示),權重定為1。動態本體隱藏于用戶行為中,通過用戶互聯網行為抓取,實現電商、社交、媒體等信息的獲取。對數據進行預處理,主要獲取網頁的標題信息,過濾用戶行為中非文本信息,只保留動詞與名詞,且只保留TF-IDF指標在70%以上的詞匯,并按照對象、時間、地點、內容、行為五方面內容以天為單位存儲至數據庫(如表2所示)。

表1 靜態本體記錄表

表2 互聯網行為記錄表

(2)動態信息本體獲取

通過行為-主題建模、主題-詞匯建模、行為-詞匯建模三個過程,從用戶行為庫中挖掘動態信息本體,提取行為主體及主題詞匯。

(3)動態信息本體權重計算

根據對象、時間、地點、內容、行為五個方面,依據動態信息本體權重計算公式求解其聯合影響權重。

(4)用戶畫像構建

根據步驟(1)、(2)、(3)所得結果,結合用戶畫像數學模型,構建特定用戶的用戶畫像,采用非關系型數據庫MongoDB以Bson格式存儲。對用戶畫像做可視化處理,直觀顯示用戶偏向內容及偏向程度,如圖2所示。

圖2 用戶畫像柱狀圖

(5)信息推送

將用戶畫像中各信息本體按照權重排列,采用LBS技術定位用戶實時位置,以位置和信息本體為查詢條件,查詢信息數據庫,將查詢結果組合、排序,為用戶提供符合個人情況的智能信息,如圖3。

圖3 推送結果

3 結束語

本文提出的信息本體概念利于用戶描述和計算機處理,基于行為-主題、主題-詞匯及行為-詞匯模型的信息本體提取方法和采用對象、時間、地點、內容、行為和重返次

數的聯合影響權重計算方法構建的用戶畫像數學模型,能夠較好地描述用戶偏好。本文設計的基于用戶畫像的智能信息推送系統,為大數據環境下的精準營銷提供了一種新的方法。

[1] Peng Yi .An application for digital teaching of intelligent push technology under the cloud environment[C].International Conference on Social Science and Education,2013:398-403.

[2] 顏友軍.移動平臺上基于本體知識庫的問答與Web服務推送系統[D].南京:南京大學,2013.

[3] 赫磊.基于云平臺的智慧旅游信息推送系統研究[D].西安:西安工業大學,2014.

[4] 黃舒榕.基于JXTA的移動智能小區信息推送服務平臺的設計與實現[D].廈門:廈門大學,2014.

[5] 劉海,盧慧,阮金花,等.基于“用戶畫像”挖掘的精準營銷細分模型研究[J].絲綢,2015,52(12):37-42.

[6] 莫靜泱.基于數據挖掘的用戶個性化健康消費智能推送系統設計與實現[D].南京:南京郵電大學,2015.

[7] 肖鋒,侯岳,王留召,等.基于LBS的智能信息推送技術研究[J].測繪與空間地理信息,2015 (6):125-127.

[8] 肖鋒,侯岳,賈寶.情境建模下的LBS智能信息服務推送方法[J].測繪通報,2016(4):96-98.

[9] 余孟杰.產品研發中用戶畫像的數據建模——從具象到抽象[J].設計藝術研究,2014,4(6):62-64.

[10] 何建云,陳興蜀,杜敏,等.基于改進的在線LDA模型的主題演化分析[J].中南大學學報(自然科學版),2015(2):547-553.

[11] 周品.云時代的大數據[M].北京:電子工業出版社,2013.

[12] 張亮.數字圖書館多層次閱讀擴展系統[D].杭州:浙江大學,2010.

[13] LDA-math-LDA [EB/OL].(2013-02-03)[2016-07-30].https://www.baidu.com/link?url=7pX4p07QnrELNMnz Fp8w_tOVaZQjd_M_YCzH-J3K76EkWWlLdGHKTz7O0 BUQlsgOrp5zWAa87JtJ082036AWV_DTPWUPvUrK-0x9U8Wc44_&wd=&eqid=d0a6f0b80002a92f000000035672ad45.

[14] GREGOR Heinrich. Parameter estimation for text analysis[R].Darmstadt: Fraunhofer,2009:17-30.

[15] 石巖.基于智能推送技術的個性化服務系統研究[J].現代情報,2006,26(10):146-148.

Intelligent information push method based on user portrait

Jiang Jianwu,Li Jingwen,Lu Yanling,Ye Liangsong

(College of Geomatics and Geoinformation,Guilin University of Technology,Guilin 541004,China)

Traditional information push service lack of consideration of user's personal factors, so has two problems of low efficiency and low conversion, to solve these problems, this paper presents a new intelligent information push method based on user portrait and big data theory. This method abstracts user as a structured information noumenon, through building behavior-theme, theme-words and behavior-words mathematical model, to study the information ontology extraction method based on the user portrait. The body weight is calculated by six aspects including the object, time, place, content , behavior and return times, comprehensive information ontology and weight to build a user portrait and design a intelligent information push process based on user portrait. The method provides a new way for the intelligent information push in the large data environment.

user portrait; information push; information ontology; big data

廣西自然科學基金項目(2014GXNSFDA118032);廣西科學研究與技術開發計劃項目(1598019-4);廣西桂林市科技攻關項目(20140108-2)

TP399

A

10.19358/j.issn.1674- 7720.2016.23.025

姜建武,李景文,陸妍玲,等. 基于用戶畫像的信息智能推送方法[J].微型機與應用,2016,35(23):86-89,92.

2016-08-13)

姜建武(1992-),通訊作者,男,碩士研究生,主要研究方向:GIS理論和應用。E-mail: 1126926348@qq.com。

李景文(1971-),男,博士,教授,主要研究方向:GIS理論和應用。

陸妍玲(1988-),女,碩士研究生,講師,主要研究方向:GIS理論和應用。

猜你喜歡
詞匯智能用戶
本刊可直接用縮寫的常用詞匯
一些常用詞匯可直接用縮寫
山東醫藥(2020年34期)2020-12-09 01:22:24
本刊可直接用縮寫的常用詞匯
智能前沿
文苑(2018年23期)2018-12-14 01:06:06
智能前沿
文苑(2018年19期)2018-11-09 01:30:14
智能前沿
文苑(2018年17期)2018-11-09 01:29:26
智能前沿
文苑(2018年21期)2018-11-09 01:22:32
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
主站蜘蛛池模板: 国产一在线| 国产精品无码制服丝袜| 成人免费网站久久久| 亚洲毛片在线看| 国内视频精品| jizz国产在线| 亚洲精品国产精品乱码不卞| 91亚洲视频下载| 欧洲一区二区三区无码| 国产成人免费高清AⅤ| 一区二区理伦视频| 拍国产真实乱人偷精品| av无码一区二区三区在线| 日韩一级毛一欧美一国产| 亚洲免费福利视频| 69国产精品视频免费| 国产精品视频观看裸模| 亚洲Aⅴ无码专区在线观看q| 丁香亚洲综合五月天婷婷| 老司机aⅴ在线精品导航| 国产屁屁影院| 91精品国产91欠久久久久| 日韩在线中文| 91色爱欧美精品www| 青青草国产一区二区三区| 宅男噜噜噜66国产在线观看| 久久亚洲国产最新网站| 色哟哟国产精品一区二区| 久久综合伊人77777| 欧美国产精品拍自| 日韩毛片基地| 亚洲天堂777| 夜夜拍夜夜爽| 国产成人精品午夜视频'| 91久久国产综合精品| 无码中文字幕精品推荐| 欧美成人h精品网站| 国产99视频精品免费观看9e| 538国产视频| 看国产一级毛片| 尤物午夜福利视频| 99人体免费视频| 欧美另类精品一区二区三区| 黄色污网站在线观看| 色婷婷狠狠干| 国产福利在线观看精品| 永久免费无码日韩视频| 国产无码网站在线观看| 国产精品密蕾丝视频| 福利在线不卡| 视频二区国产精品职场同事| 中文字幕在线观看日本| 久操线在视频在线观看| 在线国产毛片手机小视频| av大片在线无码免费| 久久综合五月| 这里只有精品国产| 天天综合网站| 国语少妇高潮| 婷婷午夜影院| 午夜视频免费试看| 99视频在线看| 91无码网站| 国产欧美日韩精品第二区| 午夜电影在线观看国产1区| 一本二本三本不卡无码| 欧美日韩亚洲综合在线观看| 亚洲高清中文字幕在线看不卡| 无码高潮喷水专区久久| 亚洲av综合网| 99人体免费视频| 国产成人一二三| 成人福利在线视频| 99视频在线免费观看| 91无码视频在线观看| 美女一级免费毛片| 欧美爱爱网| 996免费视频国产在线播放| 国产99欧美精品久久精品久久| 美女毛片在线| 亚洲丝袜第一页| 午夜性爽视频男人的天堂|