郭鵬
(海南經貿職業技術學院,海口 571127)
?
基于數據挖掘技術的電子商務推薦系統研究
郭鵬
(海南經貿職業技術學院,海口 571127)
摘要:社會科技的發展推動著互聯網和計算機面向大眾普及,從而使電子商務成為一種重要的商品經營模式,讓人們足不出戶就可購買全球商品的想法成為現實。但是隨著電子商務規模日益發展的同時,用戶越來越難從海量信息中獲取感興趣的對象,電子商務平臺的推薦效率和推薦精度成為關鍵問題。
關鍵詞:電子商務;數據挖掘;推薦系統
1.1數據挖掘概述
所謂數據挖掘就是指在眾多數據中抽取有用資料的過程,這些有用的資料是在海量數據中經過篩選、過濾、清洗、提取出來的,能體現客戶潛在需求。數據挖掘與傳統的數據分析相比,數據挖掘具有預知性、有效性和實用性等特點。傳統的數據分析則是定向分析、費用高、不能及時有效的提供相關數據,具有一定的局限性。而數據挖掘通過利用多種分析工具,來對大量的數據進行抽取分析,發現數據中蘊含的關系或規則,對商業決策具有重要支持性作用。
1.2數據挖掘的功能
數據挖掘往往有兩類任務:一是描述,二是預測。對于描述性任務幾乎都是利用數據挖掘技術對數據刻畫其普遍特性,而預測性任務則是根據現有的數據進行分析預測。當前,數據挖掘功能有以下幾類:
1.2.1利用概念描述發現廣義知識
通過對某類對象進行細致描述,從而對該數據進行概括、提煉。而概念描述又分為兩類,一種是描述同類對象的共性,即為特征性描述。另一種是描述異類對象的異性,即為區別性描述。
1.2.2利用關聯分析發現關聯知識
利用不同變量的取值,發現他們存在某種關系,而這往往是屬于被發現的重要資料。這種關聯往往分成三類,即簡單關聯、時序關聯、因果關聯,等等。
1.2.3利用分類和聚類方法發現分類知識
將數據對象分類或者將數據對象分成多個簇,來發現其同類對象的共性和異類對象的異性相關知識。1.2.4利用預測方法獲取預測型知識
利用過去或者當前的與時間有關的數據對未來的相關數據進行推測。
1.2.5采用偏差檢測來獲取偏差型知識
利用數據庫中的異常數據進行分析,解釋出現異常現象的原因。
1.3數據挖掘過程
從查找數據開始,通過一定的算法或模型發現數據間的關聯性,并提取出新的知識或規律,從而得出新的結論。這一流程包括以下幾個步驟:首先,提出陳述的問題和要闡明的假設,從中發現問題,提出假設,利用相關數據去發現,去解釋其原因,從中得到完善。其次是收集數據。有關數據的收集分為兩類:一類是可控數據,另一類是不可控數據。采用不同的收集方法收集出來的結果也是不同的。因此,在收集過程中要知道數據收集是如何對其理論分布產生影響的,這樣才能在應用中順利進行。再次是數據的預處理。通過完成異常點的檢測和比例縮放、編碼和選擇特征等常見任務,來對數據挖掘過程中諸多預處理活動進行說明性例證。之后是對模型進行評估。先建立一些新模型,并進行評估選出最佳模型,數據挖掘技術利用該模型對數據進行分析。最后解釋模型得出結論。通過對模型的解釋使數據挖掘所得出來的結果更加容易理解,簡單明了,為決策者提供決策支持。
2.1電子商務發展中存在的問題
大量網絡商品的涌現,不論是買方或是賣方都會面臨著諸多問題。數據挖掘技術的出現為電子商務活動提供了強大的數據分析和技術支持。數據挖掘是面向應用的,電子商務的發展使得越來越多的企業開始網上交易,電子商務后臺數據庫中客戶相關的數據和大量的交易記錄以及跟蹤用戶在Web上的瀏覽行為等數據資源中所蘊含著大量的寶貴信息,有待于充分挖掘和利用。
2.2數據挖掘在電子商務應用發展現狀
在電子商務活動中,采用數據挖掘技術在國內尚屬于一個初步發展階段。雖然國內在這一相關領域的研究也取得了很大的進展,但仍存在一些不足之處:其一,實時性與推薦質量不平衡。其二,電子商務推薦體系結構不完善。其三,不能充分地對推薦結果進行解釋。其四,不能全面關注訪問者,只是片面地對銷售商品進行排比。國外利用數據挖掘技術來提高電子商務企業的經營效益已取得顯著的成效。據亞馬遜前科學家GregLinden介紹,亞馬遜至少有35%的銷售額來自于推薦系統。
2.3數據挖掘對電子商務的影響
通過電子商務與數據挖掘技術進行優化配置,建立合理的電子商務推薦系統,采用有效的組合推薦,將所有的推薦模型進行統一管理,同時又能具體情況具體分析,從而對客戶提供精準推薦,讓消費者在較短的時間內獲得較多的“有用”信息,這樣既能增加用戶黏性,又讓商家提升銷量。
3.1數據挖掘與推薦系統
推薦系統與數據挖掘在電子商務平臺中兩者相輔相成,聯系緊密。電子商務發展過程中積累了大量的商業數據,這些數據蘊含了大量的知識,需要數據挖掘技術進行提取分析。而推薦系統根據數據挖掘得來的知識,對消費者的興趣和需求進行及時的分析,支持商業決策。
3.2電子商務推薦系統設計

圖1 基于數據挖掘的電子商務推薦系統設計邏輯模型Fig.1 Recommendation system design logic model of e-commerce based on data mining
按照系統論的觀點,可將電子商務推薦系統分成四個組成部分:信息輸入、信息處理、模式發現與用戶反饋。首先,信息輸入主要來源于數據倉庫。其次,信息處理是基于各種不同的算法模型對數據倉庫里的數據進行分析和處理,挖掘出潛在的規律或模式,即模式發現。最后,用戶客觀公正的反饋是評價推薦系統準確性與可信性的主要依據。基于數據挖掘的電子商務推薦系統設計邏輯模型如圖1所示。
隨著網絡科技的步伐不斷加快,人們對電子商務的需求也不斷加大,收集大量的用戶數據進行科學分析,挖掘客戶潛在需求,進行個性化的推薦。基于數據挖掘技術的電子商務推薦系統搭建起客戶與商家的橋梁,其必然推動電子商務的進一步發展。
參考文獻:
[1] 劉建國,周濤,旺秉宏.個性化推薦系統的研究進展[J].自然科學進展,2009,19(01):172.
[2] 賀云.數據挖掘在電子商務推薦系統中的應用研究[D].大連交通大學,2010.
Recommendation system research on e-commerce based on data mining technology
GUO Peng
(Hainan College of Economics and Business,Haikou 571127,China)
Abstract:The development of social science and technology promotes the popularization of the Internet and computers for the masses,which makes e-commerce become an important commodity business model,so that people can purchase global commodity just stay at home.However,with the development of e-commerce,users are getting more and more harder to obtain interested object from mass information,which makes recommendation efficiency and precision of e-commerce platform a key issue.
Key words:E-commerce;Data mining;Recommendation system
中圖分類號:TP311
文獻標志碼:A
文章編號:1674-8646(2016)08-0034-02
收稿日期:2016-02-26
作者簡介:郭鵬(1979-),男,海南海口人,碩士研究生,從事計算機應用、數據挖掘研究。