999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于多維尺度向量的用戶興趣模型構建研究

2015-07-31 23:34:20王慶福
微型電腦應用 2015年5期
關鍵詞:頁面用戶

王慶福

基于多維尺度向量的用戶興趣模型構建研究

王慶福

用戶的興趣模型構建在個性化平臺上有著廣泛的應用,針對用戶的興趣進行服務定制具有非常重要的意義。提出以多維尺度向量的方式來表征用戶的興趣,多維尺度向量可以較好的反映用戶興趣特征。同時,用戶的興趣隨著時間的變化呈現非規則性變化,多維尺度向量可以通過各維度上坐標反映這種非規則變化。實驗選取10名志愿者,以新浪網作為興趣采集資源,實驗結果表明,新的算法能夠較為準確地反映用戶的興趣變化。

多維尺度向量;用戶興趣;動態非規則;興趣模型

0 引言

用戶興趣的采集一直是諸多電商平臺和社交平臺研究熱點,針對用戶的興趣進行定向資源推薦,提高用戶體驗具有非常重要的意義和價值[1]。

用戶興趣的表示一直是用戶興趣采集中的核心問題,如何對用戶的興趣進行定量表示從而根據興趣特征進行資源定向推薦。傳統的興趣表示方式將用戶的興趣歸為一主要興趣,以此興趣點來對用戶進行定向推薦,顯然這種方式不能很好的反映的興趣特征和興趣變化[2];此后,嘗試將用戶的興趣按照向量進行表示并定期更新,然而卻忽略了用戶的動態非規則變化特性[3],因此,此種方式的興趣表示方法無法適時的調整用戶的興趣特征。

本文通過分析用戶興趣的動態變化特性,提出采用多維尺度向量來表示用戶的興趣,多維尺度向量中每個維度對應用戶的一個興趣維度,定義興趣衰減函數來對用戶興趣的動態非規則變化進行量化表示,當用戶的某個興趣維度衰減到臨界閾值時,可對用戶的多維尺度興趣向量進行全局調整去掉該興趣維度。實驗以新浪網作為用戶興趣的資源采集,挑選10名志愿者進行興趣變化測試,實驗結果表明本文算法能夠較為準確地反映用戶興趣的動態變化。

1 用戶興趣提取

用戶在進行網頁瀏覽時會留下用戶的諸多信息,如果登錄用戶則會保留用戶的個人信息以及對應的網頁瀏覽記錄,如果非登錄用戶則可以通過IP地址來標識該用戶的瀏覽記錄。在用戶興趣的提取時,我們可獲得4類常用的信息(通稱為瀏覽歷史):歷史、書簽、頁面內容和訪問日志。 瀏覽器通常會保持用戶當前和以往會話中的請求記錄。全局歷史存儲了訪問頁面的標題,URL,最初訪問時間戳,最近訪問時間戳,截止時間戳,URL訪問的次數。通過瀏覽歷史記錄可以初步認定訪問頻率高的網頁(即 URL)代表用戶的較高興趣。書簽服務提供了用戶對感興趣的站點的快速訪問,用戶通常將自身經常需要訪問或者感興趣的網頁內容以書簽的形式加以存儲,其中的 URL可認為是用戶很感興趣的內容站點。每個頁面通常包含多個指向其他站點的鏈接,如果這個頁面內容是用戶感興趣的,則他將很有可能會訪問此頁面所包含的鏈接,這一規則在搜索引擎領域也同樣適用,經典頁面排序算法則是參照此規則。因此,可認為訪問頁面包含的鏈接的可能性越大則用戶對頁面越感興趣。對于索引頁面,這點是非常重要的,因為,它包含了很多相關內容的鏈接,所以,相對于包含內容的頁面,用戶的瀏覽時間就很短。

本文通過搭建一個簡易的頁面瀏覽網站來提取用戶的興趣點,通過用戶對網頁的瀏覽歷史,將瀏覽日志進行抽取分析,通過以上的4種指標對用戶的頁面停留時間來反映用戶的每個網頁具體的感興趣程度。

2 用戶興趣表示

用戶的興趣呈現出多元化,用戶可能同時對多個領域存在興趣[4],在細分到具體領域時,本文對用戶的興趣定義一個權值,稱之為興趣值,用興趣值的高低來表示用戶對各個領域的喜好程度。假設用戶的興趣維度以C表示,C={互聯網、電影、音樂、美食、旅游}。各個領域對應的興趣值如表1所示:

表1 興趣值表示表

在表1中,用戶的互聯網興趣值為0.32,電影興趣值是0.14,可見用戶對于互聯網更具有興趣。將用戶的興趣維度對應于向量中各個坐標系,各個興趣維度的興趣值對應于坐標系上坐標。則用戶興趣的表示如圖1所示:

圖1 用戶興趣表示

在圖1中,將用戶興趣通過興趣值加以量化,圖中閉合紅色部分表示用戶的興趣圖譜。用戶的興趣非常抽象,用戶興趣值的量化也相對困難。本文以用戶的瀏覽行為來表征用戶興趣值,通過用戶在頁面的停留時間在整個瀏覽時間的比重來表示興趣值[5]。興趣收集系統后臺通過網頁分類技術對網頁進行分類,分類后的結果可以定義為各個興趣領域,用戶在固定時間段內的頁面瀏覽會對應相應的興趣領域。用戶興趣值的量化表示如公式(1):

在公式(1)中,N表示網頁分類后類別數目即興趣領域的數目,表示用戶在某個興趣領域的頁面停留時間之和,表示用戶整個頁面瀏覽時間總和。

3 用戶興趣動態變化

用戶興趣呈現一種動態的非規則變化,隨著時間的推移用戶的興趣也會隨之漂移,興趣漂移呈現一定程度的不規則性,相對而言,用戶新產生的興趣領域應當相應地分配較高的興趣值,因為用戶可能受到當前環境和其他用戶的影響。用戶興趣動態更新算法如表2所示:

表2 用戶興趣動態更新算法流程表

在表2中,用戶的興趣會隨著時間的變化呈現非規則變化,對于每次捕獲的用戶興趣列表,首先,需要判斷用戶的興趣是否在當前的用戶興趣圖譜中出現,如果出現則更新當前興趣圖譜中該興趣的興趣值,否則將新的興趣加入興趣圖譜中。當完成用戶興趣列表的掃描后,則需要對用戶的興趣圖譜進行全局更新,剔除用戶歷史興趣中興趣值低于閾值的興趣[6]。

同時用戶的興趣也會隨著時間的延展呈現一定程度的衰減,興趣的衰減呈現逐漸遞減的趨勢,通過對大量用戶行為日志的分析,用戶的興趣衰減近似呈現指數分布趨勢,如圖2所示:

圖2 興趣衰減曲線圖

將用戶興趣的衰減變化以公式加以量化,如公式(2):

在公式(2)中,Δt為時間差,表示當前時間和歷史時間之間的差值,v'表示經過衰減之后的興趣值。

4 實驗

實驗選取10名志愿者對本文的算法進行驗證。以新浪網作為興趣采集資源點,采用Heritrix網絡爬蟲工具,以3天為周期,定期去爬取新浪門戶網中網頁,將爬取到的網頁構建一個小型的本地瀏覽網站。挑選的10名志愿者根據自身興趣選擇從新浪門戶網中爬取的內容網頁進行瀏覽。分別采用基于單一興趣的用戶興趣模型算法(算法 1)、基于多個興趣的固定用戶興趣模型算法(算法2)和本文算法(算法 3),分別每種算法對用戶興趣變化之后的敏感度,通過比較3種算法在用戶興趣捕獲上的準確率。

在表2中,α=0.01,將興趣采集的資源采集周期定為10次,每次資源完成后,10名志愿者進行資源選擇瀏覽。前 3周期的用戶瀏覽行為定義為對用戶興趣圖譜的補充和完整,隨機挑選10名志愿者中一名,分別比較在3種算法下興趣點的變化如表3所示:

表3 前三個周期下三種算法用戶興趣變化表

將后 7個周期采集的數據作為用戶瀏覽行為的落地資源,用以對本文算法進行驗證,分別比較3種算法對用戶興趣定為的準確率,如表4所示:

表4 三種算法在后七周期下用戶興趣捕獲準確率表

3種算法在后7周期用戶興趣捕獲準確率如圖3所示:

圖3 三種算法在后7個周期用戶興趣捕獲準確率圖

在圖3中可以看出,算法1(基于單一興趣的用戶興趣模型)效果要低于算法2和算法3,并且算法2和算法3保持了相對較高的用戶興趣捕獲準確率,算法2和算法3相比,算法3對用戶興趣變化的捕獲更為敏感,由于是采用動態的對用戶興趣值進行調整并且實時的對用戶興趣圖譜進行全局更新,因此能夠保持較高的用戶興趣捕獲準確率。同樣在圖3也可以看出,隨著周期的延長,算法3的準確率性能也逐漸與算法2拉大,可見基于本文的算法能夠較為準確并且敏感的判斷用戶興趣的變化并能夠實時反饋。

5 總結

本文以用戶興趣的表示為出發點,將用戶的興趣以多維尺度向量的方式加以表示,每個興趣對應多維向量中一個坐標系,該興趣的興趣值對應坐標系中坐標值,通過這種方式來表示用戶的興趣圖譜。用戶的興趣隨著時間呈現出非規則變化,通過用戶興趣的變化動態的更新興趣圖譜,最后,挑選10名志愿者分別就本文算法和其它兩種算法在興趣表示準確度的對比,實驗結果表明,本文算法能夠比較準確地反映用戶興趣的變化。

[1]王永貴,張旭,任俊陽,等.結合微博關注特性UF_AT模型用戶興趣挖掘研究[J]. 計算機應用研究,2015,7.

[2]詹天晟,陳德華,樂嘉錦,等. 基于海量搜索歷史數據的用戶興趣模型[J].計算機應用,2014,S2:126-129,139.

[3]史寶明,賀元香,張永. 個性化信息檢索中用戶興趣建模與更新研究[J].計算機應用與軟件,2014,03:7-10.

[4]于洪濤,崔瑞飛,董芹芹.基于遺忘曲線的微博用戶興趣模型[J].計算機工程與設計,2014,10:3367-3372,3379.

[5]任保寧,梁永全,趙建立,廉文娟,李玉軍. 基于多維度權重動態更新的用戶興趣模型[J]. 計算機工程,2014,09:42-45.

[6]陶永才,何宗真,石磊,衛琳,曹仰杰. 基于加權動態興趣度的微博個性化推薦[J]. 計算機應用,2014,12:3491-3496.

Research on User Interest Model Building Based on Multi-dimensional Vector

Wang Qingfu
(Liaoning School of Administration, Shenyang 110161, China)

The construction of user's interest model has been widely applied in personalized platform. Service customization according to users' interest has vital significance. A novel way of multi-dimensional vectoris proposed to reflect user’s interest, which could reflect the user’s interest feature better. At the same time, the user's interest will change irregularly with time; what’s more, the multi-dimensional vectorcould reflect this kind of irregular change through coordinate of each dimension. The experimental result on sina resource with ten volunteersshows that the proposed algorithm could reflect the change of user’s interest accurately.

Multi-dimensional Vector; User Interest; Dynamic-irregular; Interest Model

TP391

A

2015.03.09)

1007-757X(2015)05-0039-03

王慶福(1979-),男(漢族),遼寧盤錦人,遼寧行政學院,講師,本科,研究方向:網絡信息平臺的設計,沈陽,110161

猜你喜歡
頁面用戶
微信群聊總是找不到,打開這個開關就好了
大狗熊在睡覺
刷新生活的頁面
保健醫苑(2022年1期)2022-08-30 08:39:14
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
100萬用戶
創業家(2015年10期)2015-02-27 07:54:39
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
同一Word文檔 縱橫頁面并存
主站蜘蛛池模板: 久久一日本道色综合久久| 久久 午夜福利 张柏芝| 国产精品第一区| 综合天天色| 欧美激情成人网| 精品欧美日韩国产日漫一区不卡| 国产91特黄特色A级毛片| 久久黄色毛片| 欧美综合区自拍亚洲综合天堂| 女人18毛片一级毛片在线 | 色哟哟色院91精品网站| 日韩欧美国产综合| 中文字幕欧美日韩高清| 国产av无码日韩av无码网站 | 久无码久无码av无码| 亚洲一区波多野结衣二区三区| 国产呦视频免费视频在线观看| av手机版在线播放| 国产精品一线天| 国产视频入口| 精品国产一二三区| 无码高潮喷水专区久久| 国产亚洲精品在天天在线麻豆| 91在线中文| 亚洲另类国产欧美一区二区| 亚洲精品天堂自在久久77| 人妻少妇久久久久久97人妻| 久久久久久午夜精品| 毛片卡一卡二| 亚洲最新地址| 国模粉嫩小泬视频在线观看| 国产一级小视频| 国产精品视频第一专区| 91亚洲精品国产自在现线| 广东一级毛片| 黄色不卡视频| 国产网站免费观看| 91在线精品麻豆欧美在线| 亚洲无码高清免费视频亚洲 | 久久久久久国产精品mv| 丁香婷婷在线视频| 亚洲天堂.com| 国内毛片视频| 一级爱做片免费观看久久| 永久免费av网站可以直接看的| 九色在线观看视频| 久久精品这里只有国产中文精品| 福利片91| 蝴蝶伊人久久中文娱乐网| 国产成人精品一区二区不卡| 国产高潮视频在线观看| 久热精品免费| 亚洲色图在线观看| 国产va在线| 国产又大又粗又猛又爽的视频| 91午夜福利在线观看精品| 又粗又大又爽又紧免费视频| 另类欧美日韩| 99精品国产高清一区二区| 青青极品在线| 色婷婷综合在线| 55夜色66夜色国产精品视频| 欧美日韩国产综合视频在线观看| 亚洲乱亚洲乱妇24p| 亚洲国产成人久久精品软件| 久久这里只有精品66| 色综合激情网| 亚洲不卡网| 色婷婷在线播放| 精品久久久久久成人AV| 久久久久青草线综合超碰| 美女高潮全身流白浆福利区| 丁香婷婷激情网| 国产极品美女在线观看| 国产成人精品2021欧美日韩 | 熟妇丰满人妻| 免费国产高清精品一区在线| 欧美日韩一区二区三| 超清无码熟妇人妻AV在线绿巨人| 99激情网| 国产视频自拍一区| 亚洲女同欧美在线|