郭鵬
(海南經(jīng)貿(mào)職業(yè)技術(shù)學(xué)院,海口 571127)
?
基于數(shù)據(jù)挖掘技術(shù)的電子商務(wù)推薦系統(tǒng)研究
郭鵬
(海南經(jīng)貿(mào)職業(yè)技術(shù)學(xué)院,海口 571127)
摘要:社會科技的發(fā)展推動著互聯(lián)網(wǎng)和計算機面向大眾普及,從而使電子商務(wù)成為一種重要的商品經(jīng)營模式,讓人們足不出戶就可購買全球商品的想法成為現(xiàn)實。但是隨著電子商務(wù)規(guī)模日益發(fā)展的同時,用戶越來越難從海量信息中獲取感興趣的對象,電子商務(wù)平臺的推薦效率和推薦精度成為關(guān)鍵問題。
關(guān)鍵詞:電子商務(wù);數(shù)據(jù)挖掘;推薦系統(tǒng)
1.1數(shù)據(jù)挖掘概述
所謂數(shù)據(jù)挖掘就是指在眾多數(shù)據(jù)中抽取有用資料的過程,這些有用的資料是在海量數(shù)據(jù)中經(jīng)過篩選、過濾、清洗、提取出來的,能體現(xiàn)客戶潛在需求。數(shù)據(jù)挖掘與傳統(tǒng)的數(shù)據(jù)分析相比,數(shù)據(jù)挖掘具有預(yù)知性、有效性和實用性等特點。傳統(tǒng)的數(shù)據(jù)分析則是定向分析、費用高、不能及時有效的提供相關(guān)數(shù)據(jù),具有一定的局限性。而數(shù)據(jù)挖掘通過利用多種分析工具,來對大量的數(shù)據(jù)進行抽取分析,發(fā)現(xiàn)數(shù)據(jù)中蘊含的關(guān)系或規(guī)則,對商業(yè)決策具有重要支持性作用。
1.2數(shù)據(jù)挖掘的功能
數(shù)據(jù)挖掘往往有兩類任務(wù):一是描述,二是預(yù)測。對于描述性任務(wù)幾乎都是利用數(shù)據(jù)挖掘技術(shù)對數(shù)據(jù)刻畫其普遍特性,而預(yù)測性任務(wù)則是根據(jù)現(xiàn)有的數(shù)據(jù)進行分析預(yù)測。當(dāng)前,數(shù)據(jù)挖掘功能有以下幾類:
1.2.1利用概念描述發(fā)現(xiàn)廣義知識
通過對某類對象進行細致描述,從而對該數(shù)據(jù)進行概括、提煉。而概念描述又分為兩類,一種是描述同類對象的共性,即為特征性描述。另一種是描述異類對象的異性,即為區(qū)別性描述。
1.2.2利用關(guān)聯(lián)分析發(fā)現(xiàn)關(guān)聯(lián)知識
利用不同變量的取值,發(fā)現(xiàn)他們存在某種關(guān)系,而這往往是屬于被發(fā)現(xiàn)的重要資料。這種關(guān)聯(lián)往往分成三類,即簡單關(guān)聯(lián)、時序關(guān)聯(lián)、因果關(guān)聯(lián),等等。
1.2.3利用分類和聚類方法發(fā)現(xiàn)分類知識
將數(shù)據(jù)對象分類或者將數(shù)據(jù)對象分成多個簇,來發(fā)現(xiàn)其同類對象的共性和異類對象的異性相關(guān)知識。1.2.4利用預(yù)測方法獲取預(yù)測型知識
利用過去或者當(dāng)前的與時間有關(guān)的數(shù)據(jù)對未來的相關(guān)數(shù)據(jù)進行推測。
1.2.5采用偏差檢測來獲取偏差型知識
利用數(shù)據(jù)庫中的異常數(shù)據(jù)進行分析,解釋出現(xiàn)異常現(xiàn)象的原因。
1.3數(shù)據(jù)挖掘過程
從查找數(shù)據(jù)開始,通過一定的算法或模型發(fā)現(xiàn)數(shù)據(jù)間的關(guān)聯(lián)性,并提取出新的知識或規(guī)律,從而得出新的結(jié)論。這一流程包括以下幾個步驟:首先,提出陳述的問題和要闡明的假設(shè),從中發(fā)現(xiàn)問題,提出假設(shè),利用相關(guān)數(shù)據(jù)去發(fā)現(xiàn),去解釋其原因,從中得到完善。其次是收集數(shù)據(jù)。有關(guān)數(shù)據(jù)的收集分為兩類:一類是可控數(shù)據(jù),另一類是不可控數(shù)據(jù)。采用不同的收集方法收集出來的結(jié)果也是不同的。因此,在收集過程中要知道數(shù)據(jù)收集是如何對其理論分布產(chǎn)生影響的,這樣才能在應(yīng)用中順利進行。再次是數(shù)據(jù)的預(yù)處理。通過完成異常點的檢測和比例縮放、編碼和選擇特征等常見任務(wù),來對數(shù)據(jù)挖掘過程中諸多預(yù)處理活動進行說明性例證。之后是對模型進行評估。先建立一些新模型,并進行評估選出最佳模型,數(shù)據(jù)挖掘技術(shù)利用該模型對數(shù)據(jù)進行分析。最后解釋模型得出結(jié)論。通過對模型的解釋使數(shù)據(jù)挖掘所得出來的結(jié)果更加容易理解,簡單明了,為決策者提供決策支持。
2.1電子商務(wù)發(fā)展中存在的問題
大量網(wǎng)絡(luò)商品的涌現(xiàn),不論是買方或是賣方都會面臨著諸多問題。數(shù)據(jù)挖掘技術(shù)的出現(xiàn)為電子商務(wù)活動提供了強大的數(shù)據(jù)分析和技術(shù)支持。數(shù)據(jù)挖掘是面向應(yīng)用的,電子商務(wù)的發(fā)展使得越來越多的企業(yè)開始網(wǎng)上交易,電子商務(wù)后臺數(shù)據(jù)庫中客戶相關(guān)的數(shù)據(jù)和大量的交易記錄以及跟蹤用戶在Web上的瀏覽行為等數(shù)據(jù)資源中所蘊含著大量的寶貴信息,有待于充分挖掘和利用。
2.2數(shù)據(jù)挖掘在電子商務(wù)應(yīng)用發(fā)展現(xiàn)狀
在電子商務(wù)活動中,采用數(shù)據(jù)挖掘技術(shù)在國內(nèi)尚屬于一個初步發(fā)展階段。雖然國內(nèi)在這一相關(guān)領(lǐng)域的研究也取得了很大的進展,但仍存在一些不足之處:其一,實時性與推薦質(zhì)量不平衡。其二,電子商務(wù)推薦體系結(jié)構(gòu)不完善。其三,不能充分地對推薦結(jié)果進行解釋。其四,不能全面關(guān)注訪問者,只是片面地對銷售商品進行排比。國外利用數(shù)據(jù)挖掘技術(shù)來提高電子商務(wù)企業(yè)的經(jīng)營效益已取得顯著的成效。據(jù)亞馬遜前科學(xué)家GregLinden介紹,亞馬遜至少有35%的銷售額來自于推薦系統(tǒng)。
2.3數(shù)據(jù)挖掘?qū)﹄娮由虅?wù)的影響
通過電子商務(wù)與數(shù)據(jù)挖掘技術(shù)進行優(yōu)化配置,建立合理的電子商務(wù)推薦系統(tǒng),采用有效的組合推薦,將所有的推薦模型進行統(tǒng)一管理,同時又能具體情況具體分析,從而對客戶提供精準推薦,讓消費者在較短的時間內(nèi)獲得較多的“有用”信息,這樣既能增加用戶黏性,又讓商家提升銷量。
3.1數(shù)據(jù)挖掘與推薦系統(tǒng)
推薦系統(tǒng)與數(shù)據(jù)挖掘在電子商務(wù)平臺中兩者相輔相成,聯(lián)系緊密。電子商務(wù)發(fā)展過程中積累了大量的商業(yè)數(shù)據(jù),這些數(shù)據(jù)蘊含了大量的知識,需要數(shù)據(jù)挖掘技術(shù)進行提取分析。而推薦系統(tǒng)根據(jù)數(shù)據(jù)挖掘得來的知識,對消費者的興趣和需求進行及時的分析,支持商業(yè)決策。
3.2電子商務(wù)推薦系統(tǒng)設(shè)計

圖1 基于數(shù)據(jù)挖掘的電子商務(wù)推薦系統(tǒng)設(shè)計邏輯模型Fig.1 Recommendation system design logic model of e-commerce based on data mining
按照系統(tǒng)論的觀點,可將電子商務(wù)推薦系統(tǒng)分成四個組成部分:信息輸入、信息處理、模式發(fā)現(xiàn)與用戶反饋。首先,信息輸入主要來源于數(shù)據(jù)倉庫。其次,信息處理是基于各種不同的算法模型對數(shù)據(jù)倉庫里的數(shù)據(jù)進行分析和處理,挖掘出潛在的規(guī)律或模式,即模式發(fā)現(xiàn)。最后,用戶客觀公正的反饋是評價推薦系統(tǒng)準確性與可信性的主要依據(jù)。基于數(shù)據(jù)挖掘的電子商務(wù)推薦系統(tǒng)設(shè)計邏輯模型如圖1所示。
隨著網(wǎng)絡(luò)科技的步伐不斷加快,人們對電子商務(wù)的需求也不斷加大,收集大量的用戶數(shù)據(jù)進行科學(xué)分析,挖掘客戶潛在需求,進行個性化的推薦。基于數(shù)據(jù)挖掘技術(shù)的電子商務(wù)推薦系統(tǒng)搭建起客戶與商家的橋梁,其必然推動電子商務(wù)的進一步發(fā)展。
參考文獻:
[1] 劉建國,周濤,旺秉宏.個性化推薦系統(tǒng)的研究進展[J].自然科學(xué)進展,2009,19(01):172.
[2] 賀云.數(shù)據(jù)挖掘在電子商務(wù)推薦系統(tǒng)中的應(yīng)用研究[D].大連交通大學(xué),2010.
Recommendation system research on e-commerce based on data mining technology
GUO Peng
(Hainan College of Economics and Business,Haikou 571127,China)
Abstract:The development of social science and technology promotes the popularization of the Internet and computers for the masses,which makes e-commerce become an important commodity business model,so that people can purchase global commodity just stay at home.However,with the development of e-commerce,users are getting more and more harder to obtain interested object from mass information,which makes recommendation efficiency and precision of e-commerce platform a key issue.
Key words:E-commerce;Data mining;Recommendation system
中圖分類號:TP311
文獻標志碼:A
文章編號:1674-8646(2016)08-0034-02
收稿日期:2016-02-26
作者簡介:郭鵬(1979-),男,海南海口人,碩士研究生,從事計算機應(yīng)用、數(shù)據(jù)挖掘研究。