999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Web挖掘及其在電子商務中的應用

2008-04-29 00:00:00門國尊李雅軒
商場現代化 2008年35期

[摘 要] 電子商務網站向用戶提供及時有效的信息,是提高網站聲譽和效益的基礎。Web挖掘可以通過分析用戶的使用偏好,幫助用戶高效地檢索到所關心的信息。本文深入討論了Web結構挖掘、Web內容挖掘和Web使用挖掘等技術,并提出了商務網站基于Web挖掘技術為用戶提供個性化推薦的一種框架。

[關鍵詞] 電子商務 WEB挖掘 個性化服務

一、引言

電子商務站點的成功很大程度上取決于保持已有用戶和將隨意瀏覽者轉化為現實購買者的能力。因此,怎樣在電子商務環境中吸引新用戶,并確保自己可以提供足夠的產品或服務留住老用戶,成為許多電子商務站點所要關注的主要問題。另一方面,用戶面對電子商務站點所提供的眾多選擇,要從中挑選出自己真正需要的產品或服務猶如大海撈針。

人們為了實現從海量Web數據中,查找自己想要的數據和有用信息,提出了Web挖掘(Web Mining)。Web挖掘可以幫助人們從Web文檔和Web活動中發現和抽取潛在的、有意義的模式和知識。它將傳統的數據挖掘技術與Web結合起來,并綜合運用了統計學、計算機網絡、數據庫與數據倉庫、可視化等眾多領域的技術,形成了Web結構挖掘、Web內容挖掘和Web使用挖掘的研究與應用體系。

二、 Web結構挖掘

由于Web頁面具有比純文本更為豐富的結構,不僅具有文本信息,而且具有表示頁面之間關系的鏈接,所以Web結構挖掘主要是利用Web文檔之間的超鏈結構進行分析。大量的Web超鏈接信息提供了關于Web頁面內容相關性、質量和結構方面的信息,反映了文檔之間的包含、引用或者從屬關系。引用文檔對被引用文檔的說明往往更客觀、更概括、更準確。它有助于推斷出頁面的權威性。所謂權威頁面是在一個主題內被高度引用或參考的頁面,與其相關的另一個概念是樞紐頁面,即:那些指向許多權威頁面的頁面。權威頁面和樞紐頁面展示了強烈的互增強關系;一個好的樞紐頁面指向了許多好的權威頁面;一個好的權威頁面被許多好的樞紐頁面所指。在信息檢索中往往將高權威分和樞紐分的頁面視為高質量的頁面,可以考慮優先提供給用戶。

三、Web內容挖掘

Web內容挖掘主要有兩種策略:1.直接挖掘Web文檔的內容;2.在工具搜索的基礎上進行改進。采用第一種策略的有針對Web查詢語言利用啟發式規則的Ahoy等。采用第二種策略的方法主要是對搜索引擎的查詢結果進行進一步的處理,得到更為精確和有用的信息。共分為四個階段:

首先,對文本挖掘對象建立特征表示。為Web文本內容建立特征表示是Web文本挖掘中的基本問題,常用的特征表示方法有:向量空間模型、布爾模型、聚類模型、概率模型和基于知識模型等。

其次,提取文檔特征并縮減。在目前所采用的文檔表示方法中,共同存在的瓶頸就是文檔特征向量維數過高。常用的特征提取與縮減方法有:信息增益、互信息、文本證據權、特征頻度、文本頻度,以及特征熵等。

再次,在完成文檔特征向量維數的縮減后,利用數據挖掘的方法(如分類、聚類、關聯規則等)提取面向特定應用的知識模式。

最后,對挖掘結果進行評價,若評價結果滿足一定的要求則輸出,否則返回到之前的某個環節,分析改進后再進行新一輪的挖掘工作。

四、 Web使用挖掘

Web使用挖掘的結果通常是用戶群體的共同行為和共性興趣,以及個人用戶的檢索偏好、習慣和模式等,已經成為當前電子商務個性化推薦的主流方法。Web使用挖掘主要通過分析用戶訪問Web的記錄了解用戶的興趣和習慣,對用戶行為進行預測,以便提供個性化的產品信息和服務。Web使用挖掘的方法可以分為兩類:

1.基于Web事務的方法

基于Web事務的Web使用挖掘技術通常應用于Web服務器日志文件,引入最大向前引用算法MF,將用戶會話分割成一系列的事務,然后采用與關聯規則相類似的方法挖掘頻繁訪問序列,從而取得用戶訪問模式。Web使用數據的采集和預處理是Web使用挖掘過程中非常關鍵的步驟。

2.基于數據立方體的方法

基于數據立方體的技術是根據Web服務器日志文件,建立數據立方體,然后對數據立方體進行數據挖掘和聯機分析處理。這種方法從多角度、全面地進行挖掘和分析,有利于Web挖掘與數據挖掘技術的迅速融合與發展。

五、語義Web挖掘

語義Web模型的一個重要思想就是以本體來表示語義信息,通過在語義Web中引入本體層來實現語義信息的共享,從而提高網絡信息服務的智能化與自動化。語義Web挖掘的主要分為兩個層次:其一,探索能夠直接處理Web本體的Web挖掘算法;其二,在Web挖掘其他環節利用本體方法,以提高Web挖掘的效能。

要解決現有數據挖掘技術在語義Web環境下應用,關鍵的問題是要求數據挖掘算法具有幾種能力:第一是使用的算法應該具有處理比命題邏輯更有表達力的一階邏輯的能力;第二是在算法中具有利用背景知識數據進行數據挖掘。

六、結論

電子商務個性化推薦可以根據用戶的偏好、歷史訪問數據,以及相似用戶的相關信息,幫助用戶完成網上瀏覽、購買等過程,為用戶提供個性化服務。WEB挖掘技術可以從不同的角度和層次對網站信息和用戶的使用偏好進行分析,正在成為提高電子商務網站聲譽和效益的有效途徑之一。

參考文獻:

[1]石 琳 王刊良:網上購物與網上學習中的個人化推薦系統的比較.清華大學學報(自然科學版),2006,46(S1)

[2]陳文偉 黃金才:數據倉庫與數據挖掘.北京:人民郵電出版社,2004

主站蜘蛛池模板: 天天综合网站| 曰AV在线无码| 国产九九精品视频| 久久综合色视频| 久久特级毛片| 日本中文字幕久久网站| 国产成人91精品| 午夜福利免费视频| 国产精品99一区不卡| 97精品国产高清久久久久蜜芽| 操美女免费网站| 久久国产亚洲偷自| 国产视频一二三区| 久久久久久高潮白浆| 91外围女在线观看| 亚洲人成网站色7799在线播放| 国产成人高清精品免费软件| 好吊妞欧美视频免费| 欧美性精品不卡在线观看| 国产欧美专区在线观看| 欧美激情视频一区二区三区免费| 国产亚洲精| 国产xxxxx免费视频| 国产精品自在拍首页视频8| 国产九九精品视频| 日韩精品亚洲一区中文字幕| 日韩毛片在线播放| 丝袜国产一区| 精品自窥自偷在线看| 色噜噜综合网| 亚洲美女一级毛片| 婷婷色丁香综合激情| 日韩天堂视频| 国产免费黄| 国产福利小视频高清在线观看| 香蕉精品在线| www亚洲天堂| 国产一级毛片网站| 71pao成人国产永久免费视频| 国产美女丝袜高潮| 国产精品爽爽va在线无码观看| 亚洲AV免费一区二区三区| 日韩在线第三页| 久久久久国产精品免费免费不卡| 精品国产自在在线在线观看| 乱人伦中文视频在线观看免费| 国产丝袜一区二区三区视频免下载| 亚洲第一色网站| 欧美成人一级| 欧美一区日韩一区中文字幕页| 国产91视频免费观看| 亚洲黄色高清| 亚洲天堂成人在线观看| 国产视频你懂得| 成人国产精品视频频| 精品国产一区91在线| 色综合日本| 精品伊人久久久香线蕉| 久久久久无码国产精品不卡| 国产成人精品免费视频大全五级| av无码一区二区三区在线| 亚洲国产精品成人久久综合影院| 午夜日b视频| 精品国产三级在线观看| 91国语视频| 三上悠亚精品二区在线观看| 国产欧美高清| 91精品国产综合久久香蕉922| 特级欧美视频aaaaaa| 91九色最新地址| 一区二区无码在线视频| 蜜桃视频一区二区| 91小视频在线观看| 欧美有码在线| 青青草原国产av福利网站| 亚洲国产系列| 国模私拍一区二区三区| а∨天堂一区中文字幕| 久久成人国产精品免费软件| 一级毛片高清| 欧美日韩免费| 欧美亚洲国产精品第一页|