摘 要:文章對Web數據挖掘技術的簡要介紹、Web數據挖掘的過程、電子商務平臺中Web數據挖掘技術的應用情況以及Web數據挖掘在電子商務中的作用分析四個方面的內容進行了詳細的分析和探討,從而詳細的論述了我國電子商務平臺中的Web數據挖掘技術的應用情況。
關鍵詞:電子商務平臺;Web數據挖掘技術;應用研究
1 Web數據挖掘技術的簡要介紹
1.1 Web數據挖掘的定義。所謂的Web數據挖掘就是指借助于數據挖掘技術在Web服務和Web文檔中獲取我們所需要的信息,其是一項結構較為復雜的綜合性技術,涵蓋了計算機語言學、人工智能、數據挖掘技術、數據庫、Web技術以及統計學等眾多的領域。與傳統的數據挖掘技術所不同的是,Web數據挖掘主要的研究對象是以非結構化文檔或是半結構化文檔為中心的Web,它們的內容和表示是相互交織的,并且沒有統一的模式,用語義信息也無法精確的描述出這些數據內容,要想在結構上對這些數據進行描述就必須依靠HEML語法。
1.2 Web數據挖掘的分類。(1)Web結構挖掘。超文本文檔相互之間是有著緊密的聯系的,所以,WWW在可以顯示出文檔內容的同時,也可以顯示出它們之間的關聯關系所代表的內容,對頁面進行排序時如果能夠很好的應用這些信息,就能夠找到有重要應用價值的頁面。其根本的作用就是要發現Web結構和頁面結構,這樣就能夠準確的對頁面進行聚類和分類,從而找到我們需要的頁面;(2)Web內容挖掘。這類Web挖掘技術就是指對Web上富含的大量文檔信息進行有效的總結、聚類和分類,對其關聯性進行詳細的分析,并進行相應的趨勢預測,一直到最后獲得有價值信息的過程。Web上的數據可以有文本、圖形、視頻、圖像以及聲音等多種類型,也可以是結構化的數據或是無結構的自由文本,其主要有Web多媒體挖掘和Web文本挖掘兩類;(3)Web使用挖掘。此類挖掘技術是指分析用戶訪問過的Web的歷史記錄,掌握用戶的瀏覽習慣和興趣,預測用戶可能發生的瀏覽行為,從而為其提供個性化的網絡服務。
2 Web數據挖掘的過程
2.1 Web資源搜集。此過程就是借助于蜘蛛和爬蟲等網頁抓取工具來在電子商務網站上搜集用戶使用的頁面信息,用戶請求的頁面就是游覽頁面,其是由腳本、圖片和框架等部分組成的。
2.2 預處理。此過程就是在原始數據中集中的除去那些可能對挖掘效果帶來負面影響的或是與挖掘過程無關的數據的過程,另外也會適當的刪除數據的屬性,最后應留下與挖掘過程相關的數據屬性。
2.3 特征抽取。此過程就是指對Web文本的內容進行分析、聚類、分類和過濾的過程,其對知識發現以及準確的發現用戶的瀏覽興趣模式都是有著重要的影響。
2.4 模式發現。采用這種技術所發現的知識模式以及自動的發掘模式,既是對整個文檔集合的趨勢和結構所進行的藐視,同時也是對上一級文檔的含義所進行的描述和概括。
2.5 模式評價。此過程就是對所產生的模式進行質量評價的過程,質量過關時,就應將這一知識模式存儲下來,質量不符合要求時,就應進行新一輪的挖掘,直到改進過關為止。
3 電子商務平臺中Web數據挖掘技術的應用情況
3.1 路徑分析技術。這是一項尋找用戶經常訪問路徑的技術,總體來說,其就是簡化路徑的過程,對Web服務器中文件和日志中的用戶訪問站點的次數進行詳細的分析,從而找到經常訪問的路徑,幫助使用用戶以最快的速度找到其所需要的產品或是信息。在用戶訪問某網站時,過多的中間頁面勢必會降低消費者的瀏覽興趣,也提高了網站的維護成本,而這項技術就是有效的分析超鏈接之間的聯系以及網站各個頁面之間的聯系,掌握訪問次數最多的頁面,將其它無太大使用價值的刪除。
3.2 聚類分析。在市場細分時經常要用到聚類分析技術,將市場有效細分的依據就是顧客特征模式和購買行為的相似性,細分后應針對每一個市場都制定有針對性的營銷策略。在電子商務平臺上,我們應將有相似特性的用戶數據和信息整理到一起,總結和歸納出他們的相似需求和喜好,為用戶提供個性化的電子商務平臺上的服務,為他們提供有建設性的購買建議,既提高了網絡營銷的效果,同時也培養了用戶的忠誠度。
3.3 分類。此項技術既可以用于破產預測和劃分顧客類別的工作中,也可以用于預測哪些購買人群對于贈券和郵寄產品信息等促銷手段是感興趣的。如果是商業性質的網站,分析用戶的訪問模式和相應的客戶信息,就可以總結出用戶所訪問網站的特征,分類完成后,我們就可以掌握每一類客戶的興趣愛好,也能夠發現潛在的購買客戶,從而為每一類提供個性化的網絡服務,并開展有針對性的商務活動。
3.4 關聯分析。這項技術是一類在海量的數據或網絡信息中找到項集之間關聯性、項集的頻繁模式以及因果結構和相互關系的技術,采用這項技術能夠清楚的掌握用戶的購買喜好和購買習慣,從而制定出電子商務網站上的商品擺放策略和捆綁營銷策略。舉例來說,在淘寶網站上的運動服裝的頁面上,既會有運動服裝和運動鞋,同時也會有襪子、手套和帽子等配套產品的圖片鏈接,消費者就可能一起購買,這對提高網站的銷售量是有著明顯的作用的。而優化網站結構的關聯分析技術則能夠找到網站中各種文件之間的關聯性,也能夠找到隱藏數據之間的相互聯系,簡化用戶的瀏覽信息,并且用戶當前的購買行為提供推薦,挖掘出各類購買群體之間訪問頁面的關聯性,不斷的優化設計電子商務網站。
4 Web數據挖掘在電子商務中的作用分析
4.1 提高用戶滿意度并發現潛在消費者。采用Web數據挖掘技術,通過對用戶Web日志的挖掘,就能夠準確的掌握用戶訪問Web頁面的普遍模式,對Web日志的規律加以分析,就可以輕易的識別出用戶的滿意度、喜好、需求以及忠誠度,同時也能夠發現潛在的消費者,增強了電子商務網站的服務競爭力,對提升站點的銷售業績也是有著積極的促進作用的。
4.2 提供個性化的服務,更加商務和智能。針對每一個用戶的瀏覽站點的歷史記錄,了解他們的瀏覽習慣和購買興趣,同時對每一個用戶進行建模,記錄用戶的基本信息并分析其購買需求和使用習慣,這樣在電子商務網站中,為每一個用戶都提供更具針對性的個性化服務。在分析潛在消費者已經訪問過的商品頁面的內容后,應向用戶提供大量的同類產品的鏈接頁面,這樣方便用戶進行對比和選擇,用戶各個層次購買需求都能夠得到很好的滿足。
4.3 優化網站的結構。采用Web數據挖掘技術,對于提升所建設的網站以及所設計的服務器的合理性也是十分有利的,同時也可以更好的組織和設計Web主頁,比如幫助改進分布式網絡系統的結構,提升其設計的性能,在有高度相關的網站之間提供更加有效并且快速的訪問渠道;另外,也可以幫助商家制定更準確的市場營銷策略。
通過以上的論述,我們對Web數據挖掘技術的簡要介紹、Web數據挖掘的過程、電子商務平臺中Web數據挖掘技術的應用情況以及Web數據挖掘在電子商務中的作用分析四個方面的內容進行了詳細的分析和探討。作為一個擁有海量數據信息資源的大型數據庫,如果在電子商務平臺中能夠較好的應用Web數據挖掘技術,準確的掌握其工作的規律和模式,對商家制定正確的商業策略會提供重要的支持和保證。當然,我們也應不斷的完善Web數據挖掘技術,其在電子商務平臺上有著廣闊的發展前景,商家所建設的電子商務網站將更加的科學和合理,增強了商家的市場競爭力,并為消費者提供更加個性化的服務。
參考文獻
[1]夏火松.數據倉庫與數據挖掘技術[M].北京:北京科學出版社,2009.
[2]郭曉晨.電子商務中的Web數據挖掘應用研究[J].長春理工大學學報,2012.
[3]魯俊.基于電子商務應用的Web數據挖掘技術研究[J].電腦知識與技術,2009.
[4]張冬青.數據挖掘在電子商務中應用問題研究[J].現代情報,2007.
作者簡介:王芳(1982-),女,籍貫:安徽肥東,青島大學畢業,助教,研究方向:數據挖掘,數據庫。