999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Web的數據挖掘在電子商務中的應用

2010-01-15 09:26:58周賢善謝婷婷
湖北工程學院學報 2010年3期
關鍵詞:頁面數據挖掘用戶

周賢善,謝婷婷

(1.長江大學計算機科學學院,湖北荊州434023;2.北京電子科技學院計算機科學與技術系,北京100070)

基于Web的數據挖掘在電子商務中的應用

周賢善1,謝婷婷2

(1.長江大學計算機科學學院,湖北荊州434023;2.北京電子科技學院計算機科學與技術系,北京100070)

Web數據挖掘應用于電子商務系統(tǒng),已成為數據挖掘熱點研究。Web服務器日志中保存了大量的用戶訪問電子商務系統(tǒng)的記錄,運用數據挖掘技術對數據進行處理和分析,構造頻繁訪問路徑挖掘算法,獲取用戶的購物特性和習慣,達到向每個用戶推薦產品的目的,進一步指導電子商務網站建設。

Web;數據挖掘;電子商務;頻繁訪問路徑

面對大量的電子商務信息,找出用戶感興趣的信息加以組織利用,加強客戶關系的管理,提高客戶滿意度,從而改變Web站點的設計、改善企業(yè)與客戶的關系成為電子商務必須解決的問題。通過對電子商務網站服務器日志文件進行分析挖掘,可以找出用戶行為模式,利于向用戶推薦產品,提出針對性商務計劃或者對網站進行改進。

1 電子商務中的Web挖掘

1.1 Web數據挖掘的資源

Web數據挖掘的資源[1]主要包括Web上各種形式的文檔和用戶訪問信息兩大類。在Internet電子商務中,客戶的瀏覽信息被Web服務器自動搜集,并保存在日志文件中。Web服務器文件的記錄格式如表1所示。

表1 Web服務器文件的記錄格式

1.2 Web日志挖掘的過程

Web日志挖掘是對原始的日志文件進行預處理轉變成適合挖掘的數據形式,再利用模式識別中的數據挖掘算法進行挖掘,最終匯總挖掘結果應用到實際中去。通過對日志數據信息進行分析加工,可以發(fā)現用戶訪問站點的瀏覽模式,得到商家用于向特定消費群體或個體進行定向營銷的決策信息,可揭示其中的關聯關系、時序關系、頁面類屬關系、客戶類屬關系以及頻繁訪問路徑與頁面等,從而為優(yōu)化Web站點拓撲結構,為企業(yè)更有效地確認市場目標、改進決策提供幫助[2]。

1.3 用戶識別、會話識別

用戶識別[3],是分析有多少不同的用戶訪問。一般的方法是采用啟發(fā)式規(guī)則,以用戶IP和代理來唯一確定用戶。即用戶IP地址和代理同時相同的為同一個用戶;IP地址相同而代理不同,則可以標記為不同的用戶。結合訪問信息、引用日志和站點拓撲,就能列出用戶瀏覽的眾多路徑,若請求的頁面與用戶已瀏覽的頁面不存在鏈接關系,則認為存在IP地址相同的多個用戶。

會話是指用戶在一次訪問網站期間所進行的活動,會話識別的任務就是把屬于同一用戶的同一次訪問請求識別出來。不同的用戶訪問屬于不同的會話,同一用戶相鄰兩次訪問時間跨度較大時,可以認為該用戶開啟過兩次不同會話。一般時間戳Timeout設定為30分鐘。掃描日志文件中按照用戶分類的日志記錄,可完成對所有用戶的會話識別,進而完成整個日志文件的會話識別。會話識別是Web日志挖掘的基礎和關鍵,只有識別出高質量的會話,才能有效地實現模式識別和模式分析,從而為應用提供有意義的數據支持。

2 頻繁訪問路徑的挖掘

用戶頻繁訪問路徑[4]是用戶在一個時間段中多次瀏覽的連續(xù)網站頁面序列。在求得M FP的基礎上,逐次掃描每個用戶會話的所有M FP,迭代產生長度為len的候選子路徑,通過計算候選路徑的頻繁訪問支持度從而產生頻繁訪問路徑。

2.1 相關定義和概念

定義1用戶會話S是一個二元組<Uid,p>,其中Uid為用戶標識,p為用戶在一個時間段內訪問的頁面的集合,它由用戶訪問的頁面Pi和用戶訪問一個頁面所停留的時間L(訪問時間長度)構成,即:S= <Uid,{(P1,L 1),(P2,L 2)…(Pn,Ln)}> 。

定義2最大向前路徑M FP(maxim um fo rw ard path)是指用戶會話中的首個網站頁面至回退的前一個網站頁面所組成的路徑。如:一個用戶會話頁面順序是P1-P2-P1-P3-P4-P3,則對應的M FP為 P1-P2和 P1-P3-P4。

定義3設P={x1,x2,…,xn}為用戶順序訪問的頁面集合,Fmin為最小支持度,若,則稱路徑P為頻繁訪問路徑。頻繁訪問路徑就是M FP中滿足一定支持度的連續(xù)頁面序列,頻繁訪問路徑的長度為其包含的頁面數。

定義4包含頻繁訪問路徑的用戶會話數目稱為支持度。用FPlen表示長度為len的頻繁訪問路徑的集合,則最頻繁的 K個訪問路徑的集合為FPlen_k={Plen_1,…Plen_k}。

定義5若兩個連續(xù)的len-1長的子路徑{xj,…xj+len-2}和{xj+1,…xj+len-1}都是 FPlen-1的元素,即它們的支持度都不小于Plen-1_k的支持度,則稱{xj,…xj+len-1}為FKlen的候選路徑。

2.2 頻繁訪問路徑挖掘算法

要挖掘長度為len的頻繁訪問路徑,實際上就是要構造出 FPlen。從M FP中找出長度為len的候選路徑{xj,…xj+len-1},計算它在用戶所有會話中的支持度。支持度最大的 K個路徑的集合就是 FKlen_k。

FPk的構造算法如下:

input:備選M FP集合,最小支持度 Fmin;

output:長度為len的頻繁路徑集合FPlen(len>1)。

for每個用戶會話s{

for s中的每個M FP{x1,x2,…,xk}{

if(len≤k){

for(j=l;j<k-len+l;j++){

if{xj,…xj+len-1}已經在 FPlen中

{xj,…xj+len-1}的支持度加1

else if{xj,…xj+len-2}的支持度 ≥Fminand{xj+l,…xj+len-1}的支持度≥Fmin

把{xj,…xj+len-1}插入 FPlen;

}

}

}

}

通過該算法對用戶會話進行分析,構造出每個用戶頻繁訪問路徑表(用戶標識,頻繁訪問路徑),反映出用戶的瀏覽興趣,同時為用戶提供個性化服務提供依據。

3 結束語

在電子商務中,客戶瀏覽信息被Web服務器自動收集并保存在訪問日志、引用日志和代理日志中。通過對Web服務器日志文件的數據進行處理和分析,在挖掘出最大向前路徑的基礎上做進一步的挖掘工作,得到用戶的頻繁訪問路徑,找出用戶的購物特性和習慣,達到向用戶推薦產品的目的,同時為企業(yè)更有效地確認目標市場,改進決策獲得競爭優(yōu)勢提供幫助。

[1] 趙東東.電子商務中的Web數據挖掘系統(tǒng)的設計[J].微計算機信息,2007,23(10-3):168-169.

[2] 周麗利,李耀輝,董顥霞,等.基于 Web的數據挖掘在電子商務中的應用[J].微計算機信息,2006,22(7-3):162-164.

[3] 周賢善,王松林,王海林,等.Web日志挖掘及應用[J].長江大學學報:自然科學版,2009,6(2):258-260.

[4] 蔡俊,宋順林.基于Web日志的頻繁偏愛路徑挖掘算法[J].計算機工程與設計,2009,30(24):5615-5617.

The Application of Web-based Data Mining in E-business

Zhou Xianshan1,Xie Tingting2
(1.School of Computer Science,Yangtze University,Jingzhou,Hubei 434023,China;2.Department of Computer Science and Technology,Beijing Electronic Science and Technology Institute,Beijing 100070,China)

Application of Web-based data mining in e-businesses has become a ho t topic in the research on data mining.Web server logs have saved the records on the access of large numbers of users to ecommerce system s.The use of data mining techniques help s to process and analyze data,work out the algorithm for frequent access paths,obtain the user’s shopping features and habits and achieve the purpose of recommending products for each user.This can serve as a guidance to furthering the construction of e-commerce sites.

Web;data mining;e-business;frequent access path

TP393.092

A

1671-2544(2010)03-0071-03

2010-01-26

周賢善(1963— ),男,湖北黃石人,長江大學計算機科學學院副教授,碩士。謝婷婷(1980— ),女,湖北荊州人,北京電子科技學院計算機科學與技術系講師,碩士。

(責任編輯:陳錦華)

猜你喜歡
頁面數據挖掘用戶
大狗熊在睡覺
刷新生活的頁面
探討人工智能與數據挖掘發(fā)展趨勢
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
一種基于Hadoop的大數據挖掘云服務及應用
如何獲取一億海外用戶
基于GPGPU的離散數據挖掘研究
主站蜘蛛池模板: 极品av一区二区| 免费a级毛片视频| 无码aaa视频| 国产爽妇精品| 久久无码av一区二区三区| 日本三级欧美三级| 亚洲第一页在线观看| 日韩精品一区二区三区大桥未久| www.youjizz.com久久| 欧美成人免费午夜全| 国产成人喷潮在线观看| 伊人久热这里只有精品视频99| 免费国产不卡午夜福在线观看| 伊人天堂网| 久久黄色影院| 日韩欧美91| 黄色网站不卡无码| 国产精品99r8在线观看| 二级特黄绝大片免费视频大片| 亚洲男女在线| 亚洲欧洲国产成人综合不卡| 久久青草精品一区二区三区| 日韩国产亚洲一区二区在线观看| 波多野结衣一区二区三区四区| 亚洲精品黄| 国产成人AV大片大片在线播放 | 免费看美女毛片| 欧美三级自拍| 三上悠亚在线精品二区| 国产丝袜第一页| 色哟哟精品无码网站在线播放视频| 免费a级毛片视频| 亚洲全网成人资源在线观看| 亚洲最大情网站在线观看| 朝桐光一区二区| 九色综合伊人久久富二代| 亚洲精品777| 色呦呦手机在线精品| 无码精品福利一区二区三区| 91久久青青草原精品国产| 黑人巨大精品欧美一区二区区| 中日无码在线观看| 91在线播放免费不卡无毒| 精品无码国产自产野外拍在线| 综合五月天网| 国产99热| 欧美有码在线| 亚洲一区二区成人| 午夜免费小视频| 国产美女视频黄a视频全免费网站| 超碰免费91| 91黄视频在线观看| 国产成人高清在线精品| 久久综合一个色综合网| AV在线麻免费观看网站 | 亚洲综合18p| AⅤ色综合久久天堂AV色综合| 欧美在线天堂| 亚洲Av激情网五月天| 午夜视频免费一区二区在线看| 亚洲色欲色欲www在线观看| 国产成人亚洲精品色欲AV| 久久夜色精品国产嚕嚕亚洲av| 亚洲男人的天堂在线| 在线观看视频一区二区| 国产欧美在线观看一区| 青青草欧美| 国产在线一区二区视频| 成人国产精品网站在线看| 国产精品99久久久久久董美香| 国产精品久久精品| 亚洲系列无码专区偷窥无码| 3344在线观看无码| 日韩无码视频专区| 中文字幕亚洲综久久2021| 久久鸭综合久久国产| 秋霞午夜国产精品成人片| 在线观看热码亚洲av每日更新| 欧美人与牲动交a欧美精品| jizz在线观看| 国产精品播放| 久久黄色免费电影|