徐文生
[摘 要] 本文對數據挖掘的基本特點與流程和電子商務中Web數據挖掘與數據源進行了分析,并對數據挖掘技術在電子商務領域的應用進行了研究探討
[關鍵詞] 數據挖掘 電子商務 數據源 應用
一、數據挖掘的基本特點與流程分析
數據挖掘定義為是從存放在數據庫、數據倉庫或其他信息庫中的大量數據中挖掘有趣知識的過程。
數據挖掘系統具有以下幾個主要部分:
1.數據庫、數據倉庫或其他信息庫:這是一個或一組數據庫、數據倉庫、電子表格或其他類型的信息庫,可以在數據上進行數據清理和集成。
2.數據庫或數據倉庫服務器:以用戶為主導的交互式數據挖掘過程一般是通過系統的用戶界面模塊,將用戶的搜索指令轉化為一組標準的SQL語句,交由服務器去執行。
3.數據挖掘引擎:這是數據挖掘系統的基本部分,是由一組以系統為主導的數據挖掘功能模塊組成的。
4.模式評估模塊:此模塊一般使用興趣度指標并與數據挖掘模塊交互作用,指導數據挖掘引擎將搜索集中在感興趣的模式上。
5.知識庫:知識庫包含著領域知識,用于指導搜索過程,并計算評估結果模式的興趣度指標。
6.圖形用戶界面:本模塊在用戶和數據挖掘系統之間通訊,允許用戶與系統交互,指定數據挖掘查詢或任務,提供信息,幫助確定搜索目標,根據數據挖掘的中間結果進行探索式的數據挖掘。
二、電子商務中的Web數據挖掘與數據源
根據對Web數據的感興趣程度不同,Web數據挖掘一般可以分為三類:Web內容挖掘(Web Contentmining)、Web結構挖掘(Web structure mining)、Web用法挖掘(Web usage Mining)。
1.Web內容挖掘。Web內容挖掘指從Web內容中發現有用信息。Web上的信息由各種類型的數據源組成,包括WWW、FTP、Telnet等,比如政府信息服務、數字圖書館、電子商務數據,以及其他通過Web可以訪問的數據庫。
2.Web結構挖掘。從廣義上講,Web的結構包含以下三個內容;不同網頁間的超鏈接;網頁內部的URL字符串中的目錄路徑結構信息;網頁內部內容的可以用HTML、XML表示成的樹形結構信息。
3.Web用法挖掘(Web usage Mining)。即Web使用紀錄挖掘,在新興的電子商務領域有重要意義,它通過挖掘相關的Web日志紀錄,來發現用戶訪問Web頁面的模式,通過分析日志紀錄中的規律,可以識別用戶的忠實度、喜好、滿意度,因而可以發現潛在用戶,增強站點的服務競爭力。
在數據挖掘中一個很重要的步驟就是采集數據。在Web上可以用來作為數據挖掘分析的數據量比較大,而且類型眾多。電子商務的數據挖掘技術中,數據的來源主要有以下幾個方面:
一是服務器數據。客戶訪問站點時會在Web服務器上留下相應的日志數據,這些日志數據通常以文本文件的形式存儲在服務器上。一般包括sever logs、error logs、cookie logs等。
二是查詢數據。它是電子商務站點在服務器上產生的一種典型數據。
三是在線市場數據。這類數據主要是傳統關系數據庫里存儲的有關電子商務站點信息、用戶購買信息、商品信息等數據。
四是Web頁面。主要是指HTML和XML頁面的內容,包括本文、圖片、語音、圖像等。
五是Web頁面超級鏈接關系。主要是指頁面之間存在的超級鏈接關系,這也是一種重要的資源。
六是客戶登記信息。客戶登記信息是指客戶通過Web網頁輸入的、要提交給服務器的相關用戶信息,這些信息通常是關于用戶的人口特征信息。
三、Web數據挖掘在電子商務中的應用
1.發現潛在客戶。通過Web數據挖掘,對新訪問者的網頁瀏覽紀錄進行分析,就可以判斷出該訪問者是屬于哪一類客戶,是有利可圖的潛在客戶還是毫無價值的過客,從而挖掘潛在客戶。
2.個性化定制,提高客戶忠誠度。通過對客戶訪問信息的挖掘,就能知道客戶的瀏覽行為,從而識別用戶的忠實度、喜好、滿意度,了解客戶的興趣及需求,動態地調整Web頁面以滿足客戶的需要。
3.改進站點設計。站點的結構和內容是吸引用戶的關鍵。Web挖掘技術通過挖掘用戶的行為紀錄和反饋情況為站點設計者提供改進的依據,比如頁面連接情況應如何組織、那些頁面應能夠直接訪問等。
4.聚類客戶。在電子商務中客戶聚類是一個重要的方面。通過分組具有相似瀏覽行為的客戶并分析組中客戶的共同特征,可以幫助電子商務的組織者更好地了解自己的客戶,及時調整頁面及頁面內容使商務活動能夠在更大程度上滿足客戶的要求,向客戶提供更適合、更面向客戶的服務,使商務活動對客戶和銷售商來說更具意義。
5.廣告效益評價。利用Web挖掘對大量消費行為模式進行分析,可精確地評價各種廣告手段的效益,并組合設計出最佳的商品宣傳組合方案,根據關心某產品的訪問者的瀏覽模式來決定廣告的位置,增加廣告針對性,提高廣告的投資回報率。
無論Web挖掘技術還是基于它的電子商務,都是綜合性很強的新技術,需要進一步的完善和發展。作為實現電子商務的關鍵技術之一,Web挖掘技術具有良好的發展和應用前景,已受到并將越來越得到更加廣泛的關注。
參考文獻:
[1]呂延杰:《電子商務教程》.電子工業出版社,2000年版
[2]王永慶:《人工智能原理與方法》.西安交通大學出版社,1998年版
[3]林杰斌 劉明德 陳 湘:《數據挖掘與OLAP理論與務實》,清華大學出版社,2003年版
[4]袁 柱:《電子商務中Web數據挖掘的應用研究》.《商場現代化》,2007年第8S期
[5]姚國章:《中國企業電子商務發展戰略》.北京大學出版社,2001年版