湖北工業大學 劉國雄
基于電子商務中web挖掘關鍵技術研究
湖北工業大學 劉國雄
web數據挖掘是數據挖掘技術在web環境下的應用,是從大量的web文檔集合和用戶瀏覽網站的數據中發現蘊涵的、未知的、有潛在應用價值的、非平凡的模式的過程。web數據挖掘可以在許多領域發揮作用,而電子商務為數據挖掘提供了豐富的數據源和新的研究課題。
電子商務;數據挖掘
本文對 web數據挖掘在電子商務中的應用進行了研究,主要做了以下工作:
(1)綜述了數據挖掘國內外研究現狀。分析了數據挖掘邏輯模型及存在的一些問題。
(2)闡述了web數據挖掘技術,web數據挖掘的用途,以及XML在數據挖掘中的應用。
(3)討論了在電子商務中如何有效地利用幾種可行的數據挖掘技術,如路徑分析、關聯規則分析、序列模式分析、分類分析和聚類分析等挖掘出用戶的購買模式及瀏覽模式,并就其中的路徑分析和序列模式分析提出了實現的方法。
(4)構建了一個電子商務網站系統模型,并且將上述數據挖掘技術有機地集成到其中,以實現電子商務的個性化服務;并就電子商務網站的web挖掘具體實施過程進行了分析。
目前,Internet已發展成為一個巨大的、蘊涵著具有潛在價值知識的分布式信息空間。各種形式的信息大量地產生和收集導致了信息爆炸。如何快速、準確地獲得有價值的網絡信息,如何從這些海量數據中發現知識,導致了數據挖掘領域的出現。它不僅被許多研究人員看作是數據庫系統和機器學習方面一個重要的研究課題,而且被許多工商界人士看作是一個能帶來巨大回報的重要領域。與此同時,電子商務正以其成本低廉、方便、不受時空限制等突出優點而逐步在全球流行。電子商務是未來經濟的發動機,是企業向世界全面展示形象和產品、尋找合作伙伴和擴大銷售規模的最佳途徑,其本質就是建立高效的商務系統,即利用信息技術對各種經濟活動進行自動化和優化的過程[1]。對于那些在電子商務領域投下巨資的組織和公司來說,追蹤和分析客戶的訪問方式也很有必要。這些都與Web挖掘有著密不可分的聯系,也是電子商務平臺要迫切解決的焦點問題。
一個成功的商業公司離不開其成功的商業網站,商業網站稱為成功必然是一個經過良好設計的網站。我們說它是設計良好的網站是從客戶的角度而言的。也就是說它具有的服務能滿足客戶的需求,像頁面的導航簡單,用戶在短時間搜索目標頁面,而無須額外的搜索等等。從公司的角度而言,它能夠提高公司的利潤,同時提升顧客對公司和產品的信任。
近年來數據挖掘理論技術越來越成熟,應用也越來越廣。如何結合已有的理論技術將其應用于商業成為當前人們研究的熱門。隨著知識經濟的發展,web挖掘在企業銷售,客戶關系管理等眾多領域發揮著越來越重要的作用。因此對web挖掘尤其是在web使用挖掘上如何優化企業門戶網站結構的研究具有重要意義。
論文的結構和各章的具體安排如下:
第1章緒論。介紹了電子商務及數據挖掘技術的發展歷程,數據挖掘技術的應用情況和發展趨勢,提出了課題的研究背景和意義、本人的主要工作和論文的組織結構。
第2章電子商務與數據挖掘。介紹了數據挖掘常用技術與算法,以及電子商務中數據挖掘的主要概念和技術,如關聯規則分析、序列模式分析、分類與聚類技術等。
第3章web數據挖掘。介紹了web數據挖掘技術的概念與特點、以及其與數據挖掘的主要區別,然后分析了基于web的數據挖掘過程,最后詳細分析了web挖掘中的常用算法設計等。
第4章基于第3章中的一些基礎理論研究,第5章提出一種基于動態聚類的協同過濾算法,試圖滿足現如今用戶們個性化需求,提出了協同過濾推薦算法,而針對協同過濾算法的缺點,提出了基于動態聚類的k-means算法予以補充,并給出了相應的實例實現過程。
第5章應用于電子商務的web挖掘。介紹了電子商務中web數據挖掘主要工作流程,然后介紹了web訪問信息挖掘在電子商務中的應用,最后本文對基于web挖掘技術的電子商務網站設計進行了詳細的研究。
第6章總結與展望。對論文的相關研究作了總結,并且對未來的進一步研究進行了展望。
[1]朱明.數據挖掘.中國科學技術大學出版社,2002.75.
[2]鄧蘇,劉青寶,陳衛東.數據倉庫原理與應用.電子工業出版社,2002.26.
[3」劉同明等.數據挖掘技術及其應用.國防工業出版社,2001.17.
2017-09-10)