姜寧+牛永潔



DOI:10.16644/j.cnki.cn33-1094/tp.2016.07.014
摘 要: 闡述了Web數據挖掘與電子商務的概念及Web數據挖掘的分類與技術;以淘寶網為例探討了Web數據挖掘在電子商務中的應用。電子商務領域豐富的信息資源,為數據挖掘的應用提供了廣闊的空間,將數據挖掘技術應用到電子商務中,可以極大地提高企業獲取信息的能力,幫助企業制定更具針對性和個性化的商業決策,提高企業市場競爭力。
關鍵詞: 電子商務; 數據挖掘; Web挖掘; 網絡營銷
中圖分類號:TP391 文獻標志碼:A 文章編號:1006-8228(2016)07-49-04
Application of Web data mining in electronic commerce
——For Example Taobao
Jiang Ning, Niu Yongjie
(College of Mathematics & Computer Science, Yan'an University, Yan'an, Shaanxi 716000, China)
Abstract: This paper expounds the concept of Web data mining and electronic commerce, and the classification and technology of Web data mining, discusses the application of Web data mining in electronic commerce with Taobao as an example. The rich information resources of the electronic commerce provide data mining application with vast space, the application of data mining in electronic commerce, can greatly improve the ability of enterprises to obtain information, help enterprises to develop more targeted and personalized business decisions, and improve the market competitiveness of enterprises.
Key words: electronic commerce; data mining; Web mining; network marketing
0 引言
在互聯網及移動互聯網時代,電子商務蓬勃發展,其高效與便捷的特點使人們逐漸從傳統的購物方式轉向網絡購物方式。隨著電子商務的快速發展,企業內部收集了大量的數據,并迫切需要從這些繁雜的數據中找出真正有價值的信息和知識。數據挖掘技術具有從大量復雜數據中發現特定規律的能力,能夠幫助企業深入了解客戶需求信息和購物行為特征,給客戶提供更有針對性、更貼心的產品和服務。
1 Web數據挖掘與電子商務
1.1 Web數據挖掘與電子商務簡介
數據挖掘(Data Mining)又稱為數據庫知識發現,它通常是指從數據源(如數據庫、文本、圖片、萬維網等)中探尋有用的模式或知識的過程[1]。這些模式必須是有用的、有潛在價值的,并且是可以被理解的。數據挖掘是一門多學科交叉的學問,它融合了機器學習、統計、數據庫、人工智能、信息檢索、圖像與信息處理等多個領域的理論和技術。
Web挖掘是數據挖掘在Web上的應用,它利用數據挖掘技術從互聯網上的文檔中及互聯網服務中抽取人們感興趣的、有用的模式和隱含信息。Web數據挖掘將傳統的數據挖掘技術與Web結合起來,并綜合運用了統計學、計算機技術、數據庫與數據倉庫、信息學、可視化等眾多領域的技術。
電子商務是指個人或企業通過Internet網絡,采用數字化電子方式進行商務數據交換和開展商務業務活動[2]。電子商務以其方便、快捷、安全、可靠、不受時空限制等優點贏得了廣大客戶的青睞,網上交易數額逐年上漲。
1.2 電子商務中的Web數據挖掘
1.2.1 Web數據挖掘分類
Web數據挖掘一般分為三種主要類型:Web內容挖掘、Web結構挖掘、和Web使用挖掘。
⑴ Web內容挖掘
Web內容挖掘是指對Web頁面內容及后臺交易數據庫進行挖掘,從Web文檔內容及其描述的內容信息中獲取有用的知識。Web挖掘主要是針對各種非結構化的數據如文本數據、音頻數據、視頻數據、圖形圖象數據等多種數據相融合的多媒體數據挖掘,又可將其分為基于文本的挖掘和基于多媒體的挖掘兩種。
⑵ Web結構挖掘
Web結構挖掘是從Web的組織結構和鏈接關系中尋找有用的知識。Web結構挖掘通常用于挖掘Web頁上的超鏈接結構,從而發現那些包含于超文本結構之中的信息。大量的Web超鏈接信息提供了關于Web頁面內容相關性、質量和結構等方面的信息,反映了文檔之間的包含、引用或者從屬關系[3]。
⑶ Web使用挖掘
Web使用挖掘是通過挖掘相應站點的日志文件和相關數據來發現該站點上瀏覽者的行為模式,獲取有價值的信息。Web使用挖掘主要通過分析用戶訪問Web交互過程中的記錄,比如:服務器日志記錄、瀏覽器端日志、注冊信息、鼠標點擊流等。進而發現潛在的客戶和市場,并改進Web服務器系統的性能。
1.2.2 Web數據挖掘技術
⑴ 路徑分析技術
路徑分析是一種找尋頻繁訪問路徑的方法,通過路徑分析技術可以確定網站的頻繁訪問路徑,可以對頻繁訪問的路徑進行優化,改進頁面及網站結構的設計,以方便客戶使用。
⑵ 關聯分析技術
關聯規則挖掘就是要挖掘出用戶在一個訪問期間內在服務器中訪問的頁面、文檔之間的聯系。在Web數據挖掘中,構建關聯模型,將相關聯的商品放在一起,增加交叉銷售。
⑶ 序列模式分析
序列模式分析是按時間順序查看時間數據庫,其側重點在于分析數據間的前后序列關系[4]。這些序列反映出的用戶行為有助于確認用戶訪問網站的興趣所在,便于預測客戶的訪問模式以及對客戶提供個性化的服務。
⑷ 分類與聚類技術
分類技術就是從數據中挖掘出某些共同特征來實現對數據項的分類。在Web數據挖掘中,分類技術可以根據Web日志中某些共同的特性,利用該特性對新添到數據庫里的數據項進行分類,根據訪問模式得出訪問某一服務器文件的用戶特性。
聚類分析用于將有相似特性的客戶、數據項集合到一起,按照“類內相似性最大,類間相似性最小”的原則,對數據進行類的聚集[5]。例如按照顧客的購買習慣進行聚類,將購物習慣相近的顧客分在一起,有針對性地進行廣告促銷。
2 Web數據挖掘在電子商務中的應用
數據挖掘技術可以幫助企業分析從互聯網上獲取的大量數據,比如,客戶訪問網站時點擊了哪一個鏈接,瀏覽了哪個產品,在該頁面停留了多少時間,其搜索歷史等信息。這樣分析可指導企業制定更合理的營銷策略,為客戶提供個性化的服務。
本文以淘寶網為例,將探討Web數據挖掘技術在淘寶網的應用。淘寶網(www.taobao.com)成立于2003年5月10日,由阿里巴巴集團投資創辦,擁有近5億的注冊用戶數,每天有超過6000萬的固定訪客,是中國最大的購物零售平臺,是亞洲第一大網購零售商。
2.1 數據挖掘在網絡營銷中的應用
網絡營銷是建立在對市場了解和分析的基礎上,這就需要提前收集、整理大量的數據信息,進行數據分析,再開展下一步的營銷活動。淘寶商家在產品上新之前一定要做好市場分析,將風險降到最低,這就需要用到數據分析。本文使用的數據分析工具是淘寶指數,淘寶指數是2011年年底上線的淘寶官方免費數據分享平臺。登錄淘寶指數頁面,先查看排行榜,注意頁面的統計時間和排名類型,要有時效性和針對性。如圖1所示,統計時間為2016/2/8—2016/2/14,暴增的關鍵詞為“連衣裙 春”,與上一周相比增長了5倍多。商家在這個時間段上新“春款連衣裙”,借助產品需求的增長,可大幅提高銷售量。
搜索排行只代表了買家需求,并不是真正的購買,可能買家只是先了解產品信息,時機到了才會成交。成交排行就是最近一周各品類的成交量,如圖2所示,最近一周成交量排名前三的品類分別是打底衫、連衣裙和外套。成交排行里還有個地域選擇,可以根據自己的地域,優先選擇。商家要時刻掌握市場動態,分清淡季和旺季,做到旺季入市,淡季出市。
2.2 數據挖掘在客戶關系管理中的應用
客戶關系管理是一種以客戶為中心的經驗策略,旨在改善企業與客戶之間關系的新型管理機制,通過完善的客戶服務和深入的客戶分析來滿足客戶需求。所謂在互聯網上“凡走過必留下痕跡”就是指,當訪客從進入某網站的那一刻起,他的一切瀏覽行為與歷程都是可以立即被記錄的。對來自不同平臺的數據進一步挖掘和分析,找到這些數據相對應的人群,再對這些群體進行個性化對比,展開個性化的營銷服務。這里還以搜索“連衣裙 春”為例,性別和年齡很重要,從圖3可以看出,女性買家居多,35歲以上喜好度更高,這樣就可以有針對性的對這類客戶實施一定的營銷策略。
根據客戶的瀏覽記錄,可以獲知訪客的愛好或關注目標,更充分地了解客戶的需要,為每一位顧客提供更具針對性的產品和服務,都有利于獲取新的客戶和提高老客戶的滿意度,這是掌握客戶的根本。如圖4所示,了解來訪者的星座、愛好,投其所好,定期推送一些星座幸運物、健美/運動產品、零食、化妝品廣告,可以大大提高“轉化率”。這里的“轉化率”指的是產生實際消費的用戶和來到用戶網頁的總用戶數量的比值,是將流量轉化為實際銷售額的一種衡量方式[6]。
2.3 數據挖掘在優化電子商務網站設計中的應用
網站頁面內容的安排就如超級市場中貨品在貨架上的擺設一樣,把具有一定支持度和信任度的相關聯的物品擺放在一起,可能有助于銷售。利用關聯規則可以了解如何針對客戶動態調整站點結構,使客戶訪問的有關聯的文件之間的鏈接能夠比較直接,客戶能夠更容易地訪問到感興趣的頁面,繼而可以增加下次訪問的幾率。
用戶在一個網站平均停留的時間和每個用戶對網站的平均貢獻是成正比的。想要客戶在自己的網站上駐留更長的時間,我們就應該深入了解客戶的瀏覽行為和興趣、需求,動態地調整Web頁面結構,向客戶推薦、提供一些他們感興趣的商品信息和廣告,從而延長客戶的停留時間。在淘寶網頁面就會看到“根據瀏覽,猜我喜歡”,根據客戶的瀏覽痕跡,推薦客戶可能感興趣的相關產品,以期將瀏覽者轉變為購買者。
3 結束語
電子商務的迅猛發展是現代信息技術發展的必然結果,電子商務的數據挖掘也將是很有前景的領域,它將數據轉化為有價值的信息,自動預測客戶消費趨勢和市場走向,為企業做出正確的商業決策提供有力的支持和保證。但Web數據挖掘中還有一些問題需要解決,比如:電子商務中產生的海量數據、結構異化數據的挖掘問題,以及數據質量、數據安全與隱私問題等。Web數據挖掘技術的不斷發展與完善,將促進電子商務向更加智能化、個性化的方向發展。
參考文獻(References):
[1] 劉兵著,俞勇等譯.Web數據挖掘[M].清華大學出版社,2013.
[2] 屈正庚,唐曉琴.基于電子商務中的數據挖掘技術研究[J].電
子設計工程,2009.17(3):37-39
[3] 龐英智.Web數據挖掘技術在電子商務中的應用[J].情報科
學,2011.29(2):235-240
[4] 段曉華.數據挖掘技術在電子商務客戶關系管理中的應用[J].
湖南文理學院學報(自然科學版),2010.22(2):90-94
[5] 嚴潭.數據挖掘在電子商務中的應用[J].電子商務,2006.22
(4):201-202
[6] 譚磊.大數據挖掘[M].電子工業出版社,2013.