999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Web挖掘及其在電子商務中的應用

2008-04-29 00:00:00門國尊李雅軒
商場現代化 2008年35期

[摘 要] 電子商務網站向用戶提供及時有效的信息,是提高網站聲譽和效益的基礎。Web挖掘可以通過分析用戶的使用偏好,幫助用戶高效地檢索到所關心的信息。本文深入討論了Web結構挖掘、Web內容挖掘和Web使用挖掘等技術,并提出了商務網站基于Web挖掘技術為用戶提供個性化推薦的一種框架。

[關鍵詞] 電子商務 WEB挖掘 個性化服務

一、引言

電子商務站點的成功很大程度上取決于保持已有用戶和將隨意瀏覽者轉化為現實購買者的能力。因此,怎樣在電子商務環(huán)境中吸引新用戶,并確保自己可以提供足夠的產品或服務留住老用戶,成為許多電子商務站點所要關注的主要問題。另一方面,用戶面對電子商務站點所提供的眾多選擇,要從中挑選出自己真正需要的產品或服務猶如大海撈針。

人們?yōu)榱藢崿F從海量Web數據中,查找自己想要的數據和有用信息,提出了Web挖掘(Web Mining)。Web挖掘可以幫助人們從Web文檔和Web活動中發(fā)現和抽取潛在的、有意義的模式和知識。它將傳統(tǒng)的數據挖掘技術與Web結合起來,并綜合運用了統(tǒng)計學、計算機網絡、數據庫與數據倉庫、可視化等眾多領域的技術,形成了Web結構挖掘、Web內容挖掘和Web使用挖掘的研究與應用體系。

二、 Web結構挖掘

由于Web頁面具有比純文本更為豐富的結構,不僅具有文本信息,而且具有表示頁面之間關系的鏈接,所以Web結構挖掘主要是利用Web文檔之間的超鏈結構進行分析。大量的Web超鏈接信息提供了關于Web頁面內容相關性、質量和結構方面的信息,反映了文檔之間的包含、引用或者從屬關系。引用文檔對被引用文檔的說明往往更客觀、更概括、更準確。它有助于推斷出頁面的權威性。所謂權威頁面是在一個主題內被高度引用或參考的頁面,與其相關的另一個概念是樞紐頁面,即:那些指向許多權威頁面的頁面。權威頁面和樞紐頁面展示了強烈的互增強關系;一個好的樞紐頁面指向了許多好的權威頁面;一個好的權威頁面被許多好的樞紐頁面所指。在信息檢索中往往將高權威分和樞紐分的頁面視為高質量的頁面,可以考慮優(yōu)先提供給用戶。

三、Web內容挖掘

Web內容挖掘主要有兩種策略:1.直接挖掘Web文檔的內容;2.在工具搜索的基礎上進行改進。采用第一種策略的有針對Web查詢語言利用啟發(fā)式規(guī)則的Ahoy等。采用第二種策略的方法主要是對搜索引擎的查詢結果進行進一步的處理,得到更為精確和有用的信息。共分為四個階段:

首先,對文本挖掘對象建立特征表示。為Web文本內容建立特征表示是Web文本挖掘中的基本問題,常用的特征表示方法有:向量空間模型、布爾模型、聚類模型、概率模型和基于知識模型等。

其次,提取文檔特征并縮減。在目前所采用的文檔表示方法中,共同存在的瓶頸就是文檔特征向量維數過高。常用的特征提取與縮減方法有:信息增益、互信息、文本證據權、特征頻度、文本頻度,以及特征熵等。

再次,在完成文檔特征向量維數的縮減后,利用數據挖掘的方法(如分類、聚類、關聯(lián)規(guī)則等)提取面向特定應用的知識模式。

最后,對挖掘結果進行評價,若評價結果滿足一定的要求則輸出,否則返回到之前的某個環(huán)節(jié),分析改進后再進行新一輪的挖掘工作。

四、 Web使用挖掘

Web使用挖掘的結果通常是用戶群體的共同行為和共性興趣,以及個人用戶的檢索偏好、習慣和模式等,已經成為當前電子商務個性化推薦的主流方法。Web使用挖掘主要通過分析用戶訪問Web的記錄了解用戶的興趣和習慣,對用戶行為進行預測,以便提供個性化的產品信息和服務。Web使用挖掘的方法可以分為兩類:

1.基于Web事務的方法

基于Web事務的Web使用挖掘技術通常應用于Web服務器日志文件,引入最大向前引用算法MF,將用戶會話分割成一系列的事務,然后采用與關聯(lián)規(guī)則相類似的方法挖掘頻繁訪問序列,從而取得用戶訪問模式。Web使用數據的采集和預處理是Web使用挖掘過程中非常關鍵的步驟。

2.基于數據立方體的方法

基于數據立方體的技術是根據Web服務器日志文件,建立數據立方體,然后對數據立方體進行數據挖掘和聯(lián)機分析處理。這種方法從多角度、全面地進行挖掘和分析,有利于Web挖掘與數據挖掘技術的迅速融合與發(fā)展。

五、語義Web挖掘

語義Web模型的一個重要思想就是以本體來表示語義信息,通過在語義Web中引入本體層來實現語義信息的共享,從而提高網絡信息服務的智能化與自動化。語義Web挖掘的主要分為兩個層次:其一,探索能夠直接處理Web本體的Web挖掘算法;其二,在Web挖掘其他環(huán)節(jié)利用本體方法,以提高Web挖掘的效能。

要解決現有數據挖掘技術在語義Web環(huán)境下應用,關鍵的問題是要求數據挖掘算法具有幾種能力:第一是使用的算法應該具有處理比命題邏輯更有表達力的一階邏輯的能力;第二是在算法中具有利用背景知識數據進行數據挖掘。

六、結論

電子商務個性化推薦可以根據用戶的偏好、歷史訪問數據,以及相似用戶的相關信息,幫助用戶完成網上瀏覽、購買等過程,為用戶提供個性化服務。WEB挖掘技術可以從不同的角度和層次對網站信息和用戶的使用偏好進行分析,正在成為提高電子商務網站聲譽和效益的有效途徑之一。

參考文獻:

[1]石 琳 王刊良:網上購物與網上學習中的個人化推薦系統(tǒng)的比較.清華大學學報(自然科學版),2006,46(S1)

[2]陳文偉 黃金才:數據倉庫與數據挖掘.北京:人民郵電出版社,2004

主站蜘蛛池模板: 午夜老司机永久免费看片| 久久久久夜色精品波多野结衣| 欧美一级高清免费a| 欧美 亚洲 日韩 国产| 亚洲区第一页| 免费一看一级毛片| 人人爱天天做夜夜爽| 囯产av无码片毛片一级| 91青草视频| 日本AⅤ精品一区二区三区日| 国产一区成人| 亚洲日韩日本中文在线| 亚洲免费福利视频| 黄色成年视频| 在线精品亚洲一区二区古装| 99人体免费视频| 亚洲天堂久久新| 国产精品成人啪精品视频| 久久久精品无码一二三区| 九九线精品视频在线观看| 亚洲第一区精品日韩在线播放| 亚洲欧美精品在线| 亚洲毛片网站| 人妻精品久久无码区| 99热亚洲精品6码| 日本不卡在线播放| 国产成人h在线观看网站站| 亚洲成年人网| 欧美精品另类| 亚洲欧美不卡视频| 亚洲色图另类| 亚洲成人动漫在线| 中国国产高清免费AV片| 99国产在线视频| 国产免费羞羞视频| 中文字幕久久波多野结衣| 亚洲一本大道在线| 欧美区一区| 经典三级久久| 波多野结衣在线se| 男人天堂伊人网| 免费a级毛片视频| 四虎亚洲国产成人久久精品| 亚洲综合经典在线一区二区| 狠狠操夜夜爽| 国产色婷婷视频在线观看| 国产精品视频观看裸模| 97se亚洲| 国产精品白浆无码流出在线看| 亚洲成av人无码综合在线观看| 国产精品流白浆在线观看| 美女潮喷出白浆在线观看视频| 午夜久久影院| 在线国产三级| 在线亚洲精品自拍| 国产精品乱偷免费视频| 欧美午夜视频在线| 国产精品不卡片视频免费观看| 曰AV在线无码| 天天摸天天操免费播放小视频| 欧美成人日韩| 少妇精品网站| 一区二区午夜| 亚洲国产精品一区二区高清无码久久| 无码人中文字幕| 凹凸国产分类在线观看| 欧美亚洲香蕉| 亚洲av片在线免费观看| 国产精品青青| 日韩国产一区二区三区无码| 欧美日韩第三页| 伊人久久大香线蕉成人综合网| 美女潮喷出白浆在线观看视频| 在线综合亚洲欧美网站| 国产在线啪| 欧美黄网在线| 香蕉国产精品视频| 色婷婷在线播放| 欧美无遮挡国产欧美另类| 情侣午夜国产在线一区无码| 亚洲二三区| 欧美成人亚洲综合精品欧美激情|