郭鵬
摘要:Web頁面結構復雜但所含信息極為豐富,將Web數據挖掘技術應用到電子商務平臺中,能夠挖掘大量的知識,提供決策參考。本文論述了Web數據挖掘的概念、特點和分類,并闡述了Web數據挖掘在電子商務的應用。
關鍵詞:電子商務;數據挖掘;Web數據挖掘
Internet在世界范圍內普及的同時,人們在互聯網上各個方面的需求也越來越大,基于Web的商業交易成為電子商務迅猛發展的重要因素,海量的Web頁面也蘊含了大量反映用戶需求的知識,而Web數據挖掘也將大有用武之地。
1 Web數據挖掘
1.1 Web數據挖掘概述
數據挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、以前未知并具有潛在可用知識的過程。Web頁面復雜,數據量巨大、無結構、動態的、樣式繁多,大多數傳統數據挖掘方法已不太適用,因此一種新的技術應運而生——Web數據挖掘。
1.2 Web數據挖掘特點
Web挖掘技術使用方便、信息量大、內容豐富、應用分布范圍廣,其最大的特點就是適用半結構化的Web文檔。而傳統的數據庫中數據是完全結構化的數據。但相比單個數據庫的數據挖掘,Web數據挖掘會面臨很多具體問題。主要有:
(1)與傳統的數據挖掘和數據倉庫來比,Web數據量巨大,增長速度快,諸多企業和團體一并把自己大量的可訪問的信息放在互聯網上,這樣很難構造一個數據庫來復制、存儲或集成Web上的所有數據。
(2)與傳統文本文檔相比,Web頁面相對復雜。其主要原因在于Web頁面呈現半結構化數據,數據不規則或不完整,數據結構隱含,模式變化快,模式信息量大。
(3)Web頁面無時無刻不在變化、增長與更新,是動態性極強的信息源。它沒有固定模式,僅用傳統關鍵字檢索方式來實現Web頁面上那些幾乎都是隱藏的、潛在的未知知識的發現是很難實現的。
(4)由于Web數據所包含的客戶信息具有多樣性特點,所以用戶訪問的內容和使用目的千奇百怪。
(5)盡管Web頁面信息儲量大,內容廣,但利用率一直很低,“數據豐富而知識貧乏”的問題非常嚴重。
2 Web數據挖掘的分類
2.1 Web內容挖掘
Web內容挖掘指的是對Web文檔內容或其描述的數據進行挖掘,一般以文本內容的挖掘居多。Web文檔主要包括HTML、XML等結構性標記語言,是Internet環境中跨平臺的、依賴內容的技術。Web內容挖掘常用的方法有Web OQL和Ahoy以及基于軟件Agent的分類器方法。
2.2 Web使用挖掘
Web使用挖掘主要通過分析服務器端用戶訪問記錄抽取用戶的興趣和習慣。Web服務器都保留了用戶訪問日志,記錄了每位登錄用戶的訪問和交互信息,分析這些信息可用于對用戶行為進行預測,從而改進Web站點結構,以便提供個性化的產品信息和服務。
3 Web數據挖掘在電子商務中的應用
Web數據挖掘技術在電子商務中的應用將極大地提高電商企業的競爭能力,數以億計的Web頁面及其鏈接和服務器日志中蘊藏著有意義的用戶訪問模式和相關的潛在用戶群知識,充分運作挖掘到的這些知識,從中提取商業決策支持的關鍵性數據,改進Web站點設計,能夠更好地開展電子商務活動。
3.1 優化電子商務平臺網站
通過挖掘用戶的Web日志文件,一是找出用戶訪問最頻繁的路徑,設計網站的結構和網頁的鏈接,有助于節約客戶的訪問時間;二是發現用戶的期望位置,如果在期望位置的訪問頻率高于對實際位置的訪問頻率,可考慮為該用戶提供個性化的導航鏈接。網站網頁的導航設置直接影響網站的訪問效率。按照大多數訪問者的瀏覽模式對網站進行組織,不僅減輕了服務器的負擔,而且還給用戶留下好的訪問體驗。
3.2 挖掘潛在客戶,提供個性化服務
通過分析和探究Web日志,可以發現購買某種商品的消費者的性別、年齡、學歷、收入狀況、愛好和職業等信息,充分地了解客戶的需求,提供個性化的產品或服務。電子商務平臺運營商將最大限度地利用客戶資源,開展客戶行為的分析與預測,尋找潛在的有價值的客戶,開展個性化服務,提高客戶的滿意度和忠誠度。
3.3 交叉銷售
交叉銷售廣泛應用于電子商務零售領域。電子商務運營商可以獲取較詳細的老客戶信息,對于Web數據挖掘的準確性來說是有很大幫助的。通過客戶的歷史購買記錄推測該客戶將來下一個購買行為,實現交叉銷售。
4 結論
本文通過對Web數據挖掘的概念、分類和特點進行了論述,并對Web數據挖掘在電子商務方面的應用進行了探討,在電子商務中運用Web數據挖掘有發現潛在客戶、提供理性化服務、改進站點設計、提高系統效率等優點。