999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

用戶行為驅動的網頁布局自動調整的研究

2011-01-01 00:00:00牛永潔,張成
計算技術與自動化 2011年1期

摘 要:在傳統的Web網站中,網頁的布局往往由網頁制作人員安排并很少變化。為了更好的為網絡用戶提供服務,提出通過對Web日志的數據清洗,識別出每個用戶在一個會話期內訪問的頁面,依據網頁內容在邏輯上的關系和用戶經常訪問的頁面,得到用戶對網頁內容的興趣度矩陣及各子項目的興趣度矩陣。對網絡用戶根據興趣度矩陣進行層次化的分類,得到每個用戶所屬的類別。當用戶訪問網站時,根據該用戶所屬的類別進行網頁布局的自動調整,讓用戶能夠方便、快捷地訪問到自己感興趣的頁面。這樣能夠給每個用戶提供更加個性化、柔軟的服務,增加網站的服務效果和用戶對于網站的信賴,避免用戶迷失在海量數據中。

關鍵詞:用戶行為;Web 挖掘;分類;興趣度;網頁布局

中圖分類號:TP393 文獻標識碼:A

User Behavior-driven Automatic Adjustment of Page Layout

Niu YongJie1, Zhang Cheng2

(1.Computing Center, Yan’an University, Yan’an 716000,China;2. Network Center, Yan’an University, Yan’an 716000,China)

Abstract:In a traditional Web site, the page layout was often arranged by the web production staff, and very few changes.In order to better provide services for network users, the datum of Web log were cleaned, each user to access a page during a session was identified, according to the logical relationship of web content and pages which were frequently visited to get interest matrix about content and the sub-item. Web users were hierarchical classified by these matrices.When users visited the Web site, page layout was automatic adjusted by the categories of the users. Users can quickly and easily access interesting pages.This will give each user more personalized, flexible services,service performance of site and trust of user were increased to prevent the user lost in the mass data.

Key words:user behavior; Web mining; classification; interesting degree; page layout

1 Web使用挖掘

隨著信息技術與計算機技術的飛速發展,人們的生活、工作、學習等各方面都與互聯網緊密相關。目前,在互聯網上的信息量正在迅猛的增長,可以使用海量來描述,為避免用戶淹沒在海量數據中,同時為更好的服務于互聯網用戶,Web挖掘就顯得十分有必要。根據挖掘過程中關注對象的不同,Web挖掘可分為Web內容挖掘、Web結構挖掘、Web使用挖掘、Web 用戶性質挖掘等[1]。其中Web使用挖掘,即Web用戶行為模式挖掘,可分為一般訪問模式分析、分析定制Web站點等。 能夠滿足用戶個性化的需要,是Web挖掘的一個分支和重要組成部分。

目前,絕大部分的門戶網站都包含了大量的內容與信息供不同的用戶瀏覽與訪問。但是網站中網頁的布局在制作過程中被固定以后,基本不會再發生變化,變化的大多是網頁里面的內容與圖片,有的網站為了增加網站的瀏覽量或者用戶的興趣,在不同的時間會變換網站的背景、主題顏色等。但真正吸引用戶的除了網頁的內容外,網站使用或者瀏覽時的方便、快捷性也是一個重要的因素。正是基于這樣的考慮,本文提出了一種能夠根據用戶瀏覽網站時的行為動態調整網頁布局的方法,該方法能夠根據不同的用戶呈現出不同的網頁布局,能夠讓用戶最快的在網頁中找到并瀏覽自己感興趣的內容。

Web用戶行為模式的挖掘結構千差萬別,但基本的Web 用戶行為模式挖掘結構包括數據源、數據預處理、模式挖掘、模式分析、模式應用幾個部分[2]。如圖1所示。

圖1 Web用戶行為模式挖掘基本體系結構

2 用戶行為模式的挖掘

2.1 數據預處理

在傳統的Web用戶行為模式挖掘方法中,基本都是采用Web日志作為數據源[3-5]。如果單純使用Web日志,在用戶識別過程中一般只能采用IP地址對用戶識別,而不能區分不同用戶使用同一IP地址的情況。這就造成用戶識別不準確,為后面用戶行為模式的挖掘帶來了干擾。本方法采用自定義的日志系統與Web日志系統相結合的方法進行,提高了用戶識別的準確度。

在每個用戶登錄網站系統時,在數據庫中記錄登錄的用戶名和該用戶的會話ID(Session_Id)。Web日志采用符合W3C擴展日志格式的文件,在該日志文件中,分別獲取日期(date)、時間(time)、用戶名(csusername)、服務名(ssitename)、服務器名(scomputername)、URI資源(csuristem)、Cookie字段。 在Web日志中,由于通常用戶沒有進行注冊,故一般都為占位符所替代。而且每個用戶在訪問一個頁面時,會自動同時請求與該頁面相關的圖片及腳本代碼等資源文件,所以需要將與這些資源請求有關的記錄刪除掉,得到僅與內容相關的網頁記錄。

為了得到完整的關于用戶訪問網站的信息,將自定義的日志系統與Web日志系統通過Session_Id進行連接,就得到了完整的用戶訪問網站的信息,每個信息字段使用空格進行分隔。一條完整的日志信息如圖2所示。

2010-06-25 13:02:22 用戶名 網站名 計算機名 /yd/sports.aspx

ASP.NET_Session_Id=fsnvds45hkz3mh31frfvwb30

圖2 一條完整的日志記錄

按照每條記錄中用戶名的不同對所有記錄分組,在每個組內并按照時間進行排序,于是得到每個用戶在一段時間內訪問網站所有頁面的集合P。P={P1,P2,…,Pi,i∈U},U為網站所有用戶的集合,i表示網站的第i個用戶。

2.2 用戶興趣度的計算

一個網站可能包括數量眾多的若干個不同的網頁,為了計算用戶的興趣度,應該先完成兩個任務:基于內容的網站結構劃分與用戶行為輪廓的識別[6-8]。一個門戶網站按照網頁的內容可以被劃分為圖3所示的層次結構。

圖3 網站內容層次結構

將根看作0層,將新聞、體育等稱為一級項目,相應的將國內、國際等稱為二級項目。對每一個節點按照層次+所屬類別+位置順序進行編號,比如足球的編號為221,其中第一個2表示它位于第二層,第二個2表示它屬于體育項目,1表示它位于體育項目子節點的第一個,按照這個規律,電視的編號為232。而第二層的節點的編號只有兩位,比如體育的編號為12,1代表它屬于第一層,2代表它屬于體育項。在網站中的每個網頁都可以根據其內容將其劃到圖3中的某一項,即網站中的每一個網頁都有一個對應的編號存在。

按照用戶在網站中瀏覽網頁的順序及網頁所屬項目的不同,可以將用戶的行為分為三種不同的方向,向下瀏覽、向上瀏覽、側向瀏覽。其中向下瀏覽、向上瀏覽動作發生在同一個項目之中,而跨越不同項目之間的網頁瀏覽都屬于側向瀏覽。向下瀏覽的順序是用戶從根(主頁)進入某一項目(比如體育),然后由體育頁面又進入關于排球的頁面。向上瀏覽的順序與向下瀏覽的順序剛好相反。側向瀏覽是指用戶從一個項目中直接進入另外的一個項目,比如從排球頁面直接進入電視頁面,或者直接從國際頁面直接進入了娛樂頁面。用戶瀏覽網頁方向的示意如圖4所示。

圖4 瀏覽方向的說明

在集合P中的日志記錄中,首先將網頁全部更換為與之對應的編碼,然后對于每個用戶的頁面集合Pi,按照Session_Id的不同分組,每一個分組標志著用戶訪問網站的一次會話,根據網頁的編碼,將每個用戶每個會話中瀏覽方向為向上的記錄刪除,只保留瀏覽方向是向下與側向的記錄。然后再刪除所有非最底層的網頁,即刪掉所有編號長度只有1和2的記錄。經過刪除的記錄構成了集合PS, 被編碼替換及清理以后的日志記錄如圖5所示。

2010-09-25 13:02:22 用戶名 網站名 計算機名 211 ASP.NET_Session_Id=fsnvds45hkz3mh31frfvwb30

圖5 清理后的日志記錄

根據PS按照下面的步驟計算用戶的興趣度。

1)對每個用戶構建一個二維表Ti。表中的每一行表示一個一級項目,每一列表示一個二級項目。表中每個單元格的初始值為0。

2)讀取日志中關于請求頁面的編碼abc,截取后兩位,在b行c列單元格中加1。

3)PSi中記錄結束,終止,否則轉步驟(2)。

4)尋找表Ti中的最大值Max,次大值Sub_max與第三大值Th_max。它們處于的行代表了該用戶最感興趣的三個一級項目,而每一行中數字的最大值與次大值表示了該用戶對于該子項目感興趣的二級項目的程度。

例如用戶i的興趣度如表1所示。

在表1中,最大值是5897,次大值是4831,第三大值是4325,表明用戶i興趣度由大到小的順序是新聞>娛樂>體育,而在體育項目中興趣度的順序分別為足球>籃球>排球。

2.3 用戶分類與實施方案

根據用戶的興趣度,可以將用戶進行多層次的分類,比如依據用戶的最大興趣度,使用判定樹進行分類,判定樹與圖3的網站內容層次結構相似,稱該判定樹為最大興趣度判定樹,同理,可以依據每個用戶的第二興趣度建立第二興趣度判定樹;根據系統的具體情況可以適當決定用戶分類層次的深度。

根據用戶瀏覽網站的Web日志和自定義的日志,經過數據清洗,依據網站內容的層次結構計算用戶興趣度,進而對用戶進行分類,整個過程在網站的后臺離線進行。當一個用戶登錄網站后,根據最大興趣度判定樹判定該用戶所屬的最大興趣類別,同理也可以根據用戶的第二興趣度判定樹得到該用戶的第二興趣類別。比如用戶UA根據最大興趣度屬于體育/籃球類,而根據第二興趣度該用戶屬于娛樂/電視類,那么該用戶一旦登錄網站,網站主頁應將體育、娛樂模塊放在網頁的主要位置,而且在關于體育的模塊中應該將籃球放在首要位置,而在娛樂模塊中,將電視放在首要位置,讓用戶更加方便的瀏覽自己最感興趣的內容。

對網頁布局控制的方法有多種 [9,10],使用表格對網頁進行布局缺乏靈活性,使用DIV+CSS的方法目前比較流行,但是該技術缺乏定制性,文獻[10]采用了JSP標簽庫技術,此技術缺乏通用性,文獻[11]使用的XML技術比較靈活且具有通用性。

3 結 論

為更好的服務網絡用戶,吸引用戶對網站的瀏覽與訪問,應根據用戶的行為模式實現對網站的個性化設置,即不同的用戶登錄同一網站時因用戶興趣度的不同,網站的頁面布局應有所不同,使用本文提出的方法計算每個用戶的興趣度,并對用戶分類,根據用戶不同的類別動態調整網站的布局,該方法具有一定的創新性、實用性。但也存在不足,就是要求用戶瀏覽網站時應登錄網站,否則,本文中的方法將退化為使用IP地址來識別用戶。

參考文獻

[1] 楊風雷,閻保平.Web 用戶行為模式挖掘研究[J].微電子學與計算機.2008, 25(11):146-149.

[2] 楊風雷,閻保平.新的Web用戶行為統計分析系統研究和實現[J].計算機應用研究.2008, 25(9):2758-2761.

[3] 潘瑩,梁京章,黎慧娟.基于K-means算法的校園網用戶行為聚類分析[J].計算技術與自動化.2007, 26(1):66-69.

[4] 周愛武,程博,李孫長,等.Web日志挖掘中的會話識別方法[J].計算機工程與設計.2010, 31(5):936-938.

[5] 趙文忠,張長利,房俊龍.Web日志挖掘在農業網站的應用[J].東北農業大學學報.2010, 41(8):135-140.

[6] 王攀,張順頤,陳雪嬌.基于動態行為輪廓庫的Web用戶行為分析關鍵技術[J].計算機技術與發展.2009, 19(2):20-23.

[7] 馬衛東,李幼平,馬建國,等.面向Web網頁的區域用戶行為實證研究[J].計算機學報.2008, 31(6):960-966.

[8] 趙海燕,戴佳筑,施善.基于用戶行為編碼的數據庫入侵檢測模型[J].計算機應用與軟件.2010, 27(2):97-99.

[9] 盧雷,萬建成,鹿旭東,等.基于Web應用特點的界面組成及交互模型[J].計算機工程與設計.2006, 27(23):4551-4554.

[10]李諾,曹勇剛,金茂忠.可定制高可用性Web應用程序界面的設計和實現[J].計算機工程與設計.2005, 26(4):862-866.

[11]朱紅果,鐘志農,陳宏盛,等.基于XML的界面管理技術[J].軟件技術.2006, 25(2):89-90.

注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文

主站蜘蛛池模板: 114级毛片免费观看| 无码一区18禁| 青青草原偷拍视频| 欧洲精品视频在线观看| 国产午夜人做人免费视频| 亚洲一区二区精品无码久久久| 日韩在线第三页| 国产91视频免费| 中文字幕亚洲综久久2021| 国产在线自乱拍播放| 97国产精品视频自在拍| 精品久久蜜桃| 色欲色欲久久综合网| 欧美一道本| 精品久久高清| 午夜少妇精品视频小电影| 一级毛片基地| 欧美成人一区午夜福利在线| 曰韩免费无码AV一区二区| 国产H片无码不卡在线视频| 婷五月综合| 色偷偷av男人的天堂不卡| 97超爽成人免费视频在线播放| 国产成人夜色91| 国产精品欧美激情| 女同久久精品国产99国| 亚洲人成网站18禁动漫无码| 久久99精品久久久久久不卡| 免费一级成人毛片| 国产a v无码专区亚洲av| 久久青草免费91观看| 看国产一级毛片| 东京热一区二区三区无码视频| 国产精品专区第1页| 日韩国产一区二区三区无码| 一级毛片免费播放视频| 亚洲天堂精品视频| 亚洲一区无码在线| 国产成人精品免费av| 欧美爱爱网| 国产乱视频网站| 日韩欧美中文字幕一本| 欧美日韩精品在线播放| 宅男噜噜噜66国产在线观看| 国产95在线 | 国产成人精品18| 国产精品福利社| 久久久国产精品无码专区| 麻豆AV网站免费进入| 国产精品va免费视频| 欧美成人午夜视频| 亚卅精品无码久久毛片乌克兰| 久久成人国产精品免费软件| 91丝袜美腿高跟国产极品老师| 欧美日韩在线国产| 欧美精品影院| 免费看美女毛片| 看av免费毛片手机播放| 爱色欧美亚洲综合图区| 精品国产成人a在线观看| 中文字幕免费在线视频| 青青草国产精品久久久久| 亚洲欧美综合另类图片小说区| 精品国产网| 免费无码又爽又黄又刺激网站 | 四虎影视8848永久精品| 久久精品国产亚洲麻豆| 国产97公开成人免费视频| 久久久精品国产亚洲AV日韩| 少妇精品在线| 欧美自慰一级看片免费| 毛片在线播放a| a毛片免费在线观看| 久久久久夜色精品波多野结衣| 久久精品无码中文字幕| 999国内精品久久免费视频| 亚洲人成日本在线观看| 日韩中文字幕亚洲无线码| 国产精品漂亮美女在线观看| 精品三级网站| 99激情网| 亚洲水蜜桃久久综合网站|