摘 要:21世紀是網絡信息技術的時代,各種高端的新型的科技逐漸的充斥在人們的日常生活中,最常見的就是新型的網絡技術,比如淘寶、天貓、京東等各種購物APP,還有攜程、途牛等各種外出購票等APP。這些軟件我們統稱為電子商務。電子商務的出現不僅席卷了我國人民的日常生活,包括我國的國際貿易也受到了一定程度的影響??梢哉f電子商務已經成為了我國現代的商業模式了,而且其發展的速度也越來越快,因此,該文對這個很有前景的電子商務數據挖掘領域作了簡單的分析。
關鍵詞:電子商務 Web數據挖掘 應用
中圖分類號:TP311.13 文獻標識碼:A 文章編號:1674-098X(2015)10(b)-0044-02
隨著全球的經濟化發展以及貿易自由化的發展等,電子商務,這個由信息技術、商務手段以及管理技術相結合的新的現代的商業化模式,正在以空前的生命力對部門經濟、區域經濟以及國民經濟等的發展進行推動。電子商務作為全球的現代商業模式的同時,還是人們將商務活動變為網絡化、數字化的一個途徑之一。而且它的產生將我國企業傳統的經營理念、管理方式以及支付手段等一一打破了,并且帶來更新的更符合社會發展的經營理念、管理方式以及支付手段,為企業的發展帶來了巨大的變革。但是電子商務的發展會使得公司內部的數據量迅速提升,企業想要將這些信息迅速的轉化為有用的信息和知識也是比較困難的。所以,Web數據挖掘出現了,擁有強大功能的Web數據挖掘技術不僅能夠幫助企業將這些大量的數據進行有效的分析,還能夠為企業指導并且適當的調整營銷策略,最終為客戶提供動態的個性化的高效率的服務。
1 Web數據挖掘簡述
1.1 概念
從字面上看,數據挖掘就是將有用的信息從各種大量的、不完整的數據中提取出來的過程,這些提取出來的信息的特點是隱含的、人們事先不知道的、潛在的、有用的。Web數據挖掘的技術將數據庫、人工智能、機器學習等多個領域的理論和技術知識融合在了一起,而Web挖掘則是指在Web上的應用,是指所提取的數據、信息和知識的來源是Web相關的資源。
1.2 類別
1.2.1 內容挖掘(Web Content Mining)
這個部分可以分為頁面內容和搜索結果兩個方面。前者是用Web數據挖掘技術從各個頁面中所含有的數據、信息以及知識等進行挖掘。而后者則是指用某一個搜索引擎進行某內容的搜索,從搜索的結果中進行數據挖掘。比如通過百度收索引擎,搜索WPS文字的使用方式,通過搜索出的結果,將WPS的各種使用方式進行挖掘統計。在這個Web的內容挖掘中,最常見的方式是WebOQL以及Ahoy兩個。
1.2.2 結構挖掘(Web Steucture Mining)
這一個類別中又可以分為超鏈接挖掘、內容挖掘以及URL挖掘3部分。在整個Web的空間里,除了Web的頁面內容外,其有用的知識、信息以及數據等還包含在頁面的結構中。Web的結構挖掘就是將潛在的連接結構的模式進行挖掘,這是對頁面的超鏈接關系、文檔的內部結構以及URL中的目錄途徑結構等進行挖掘的。利用文檔之間的連接信息來查早相關的Web頁面的方式就是Page2Rank方法。
1.2.3 使用挖掘(Web Usage Mining)
這一個類別中可以分為訪問模式挖掘和個性化服務模式挖掘兩個板塊。它是從電腦的訪問記錄中抽取出感興趣的模式的。訪問日記在每一個www的網頁服務器中都有保存,并且記錄了關于用戶的訪問和交互的信息。通過對這些數據的挖掘和分析,能夠使用戶的行為等被充分理解,進而改善和提高站點的結構等,或者說是為用戶提供個性化的服務。
2 電子商務中Web數據挖掘的應用
2.1 過程
Web數據挖掘的過程由3個部分組成,分別是數據準備、挖掘操作和結果表達及解釋。其操作的具體內容如下所述。
2.1.1 數據準備
這個階段可以通過3個步驟來完成,數據集成、數據選擇和數據預處理。通過這3個部分將Web數據挖掘的數據全面的準備好。數據集成是指將多個文件或者是多個數據庫的運行環境中的數據進行合并處理,就像是將許多文件壓縮成一個壓縮包一樣,將同樣的內容剔除后,留下有用的信息即可,數據的集成階段可以將語義模糊的數據問題進行解決,而且還能解決數據遺漏等問題。數據選擇是指將集成的數據有目的的進行分類,從中分辨出需要分析的數據,將需要處理的范圍縮小,從而提高數據挖掘的質量。預處理的意思就和信息預估是一樣的,都是為了日后出現的問題進行以前防御的作用。
2.1.2數據挖掘
這個階段是實際操作的階段,主要從4個方面著手:(1)決定如何生產假設;(2)選擇合適的工具等;(3)對知識進行發掘的操作;(4)將發現的知識進行證實。這個階段是將數據準備中的所有數據,進行分析提煉和挖掘,將其有用的、所需要的知識、內容以及數據等進行發掘,最后再進行證實,挖掘出的知識是否屬實等。
2.1.3 結果表述及解釋
這個階段主要是針對用戶的,是根據最后對這部分知識有需求的用戶的決策目的,對提取的信息進行分析,將信息進行區別劃分出來,提取出最有價值的信息,并且還要通過決策的支持工具提交給決策者。因此,這個階段并不是將數據挖掘的結果表現出來即可的階段,它還要對信息進行過濾等處理,如果說提取的信息不能夠滿足決策者的要求,則需要重復上述的過程,直到滿足決策者的需求為止。
2.2 方法
2.2.1 路徑分析
這個方法可以使用在Web的結構挖掘中,因為這個方式是可以用于判定在一個Web的站點中最頻繁訪問的路徑的。除此之外,還有其它的一些有關的路徑信息也可以通過路徑分析得到,而且通過路徑分析,還能夠改進網頁以及網站結構的設計。
2.2.2 關聯規則的發現
事物之間的意義的聯系以及其規則的發現就是關聯規則的目的。對Web的數據挖掘中,要將關聯模型進行構建,才能夠更好的將站點進行組織,并且將用戶過濾信息的負擔降低。不僅如此,還可以根據其挖掘到的關聯的規則對電子商務的站點的結構進行改進,將有關聯的商品放在一起,就比如淘寶中用戶搜索錢包時,其相關聯的物品有鑰匙包、子母包等也會出現在頁面中,供用戶的選擇。
2.2.3 序列模式的發現
分析數據之間的前因后果的關系以及他們在時間有序的事物的集中問題,就是序列模型分析的側重點。而其模式就是將“一些項跟隨另一些項”找到的內部事務模式。而且序列模式的發現不僅能夠為客戶提供個性化的服務,還能夠幫助電子商務的組織者對客戶的訪問模式等進行預測,從而做到更好的個性化服務。
2.2.4 分類規則
數據分類是將具有某些屬性的、類似的數據進行區別劃分的。而且數據分類的方式有很多種,比如決策樹的分類方法。這個方式是最典型的分類方式,它是根據實際的數據進行決策樹的構造的,而且他還是一種具有指導作用的學習方法。在得到分類之后,就可以針對用戶的某一個特點或者某一類客戶的特點進行商務活動的開展了,就能夠更有效的提供個性化的服務。
2.2.5 聚類分析
這一方法的目的是根據一定的規則,將記錄集合進行合理地科學的劃分,并且要采用不同的描述方式對不同的類別進行描述。而且電子商務可以通過聚類分析的方法將瀏覽過相似信息的客戶進行統計,讓管理者能夠更好的了解到河湖,并且能夠及時的提供合理的更具有個性化的服務。
2.3 應用
2.3.1企業資源計劃
Web數據挖掘在企業資源計劃中應用,可以幫助企業降低其運營的成本,還能夠提高企業的競爭力。企業的根本目的就是為了更高的經濟效益,而經濟效益不僅能夠通過更好的貿易等方式來獲取,通過對成本的節約也能夠有效的提高企業的經濟效益。所以,企業可以通過Web數據挖掘技術將企業的資源信息實時的、全面的、準確的掌握起來,并且對歷史的財務數據、庫存數據等信息進行分析,還能夠發現企業資源的消耗的主要部分,以及企業主要活動的投入產出比例等,從而為企業的資源進行優化配置時提供了決策的依據,能夠更有效的幫助企業降低其成本。
2.3.2客戶關系管理
上述中提到過,Web數據挖掘能夠將用戶經常瀏覽的網頁以及查閱的信息和交互的信息等進行挖掘統計,所以,Web數據挖掘在客戶關系管理中的應用可以幫助企業挽留老顧客,同時挖掘潛在的新客戶?,F在我國提倡的是“以人為本”的服務理念,所以,對企業而言分析客戶的心理和需求,了解客戶的信息等都已經成為了一個重要的研究課題??蛻絷P系管理是指通過現代信息技術,將客戶的信息充分的利用起來,挖掘出有用的商業知識,并將其用于企業的產品開發、市場營銷等方面,從而提高企業的競爭力。而Web數據挖掘可以幫助企業更有效的從電子商務中獲得客戶的信息等。
2.3.3 產品數據管理
這個主要是用于分析產品的質量的影響因素的,通過對其參數、結構等信息的挖掘,建立起控制產品質量的模型,全面的提高產品生產和制造的質量。
2.3.4 商業信用評估
在當下的社會中,低劣的信用狀況已經成為了影響商業秩序的最突出的原因之一了,并且已經引起了全球人民的廣泛關注。各種網絡詐騙、企業財務造假等現象日益嚴重,信用危機已經成為了電子商務發展的最大障礙。因此,利用Web數據挖掘技術對企業的經營進行跟蹤等,實施網上全程的監控,保證其電子商務的安全。
3 結語
綜上所述,電子商務雖然是我國的現代的商業模式,但是其存在的問題還是有許多的,通過Web數據挖掘的技術能夠將其現存的問題良好的控制和解決掉,所以,如何能夠使Web數據挖掘技術更好的應用在我國的電子商務中,還值得人們繼續研究。
參考文獻
[1]黃玲.在電子商務中應用Web數據挖掘的研究[D].湖南大學,2014.
[2]任新.Web數據挖掘及其在電子商務中的應用研究[D].貴州大學,2008.
[3]王飛.面向電子商務的web數據挖掘的研究與設計[D].四川大學,2006.