董敏 王琨
摘 要:隨著互聯網技術的不斷發展,大數據、云計算和數據的深度挖掘等技術的出現,給電子商務發展提供了更多的技術支撐。電子商務發展至今,從傳統PC電子商務平臺發展到今天的移動電子商務,讓電子商務這個領域開枝散葉,不斷擴展。本文主要是通過對電子商務平臺中各類型數據的采集,對用戶的購物行為和對商品的喜愛特點進行各種行為分析,已達到對用戶購物行為數據的深度挖掘。以此可以理性地開展各種形式的電子商務行為,減少電子商務活動的成本,實現利益的最大化。
關鍵詞:電子商務,評價數據,數據挖掘,行為分析
伴隨電子商務在我國的飛速發展,各類型的數據也呈現快速膨脹階段,已經達到海量級別。在電子商務平臺中,用戶在購買商品后,大部分會留下購物體驗和對商品使用的感受和心得,這種數據稱作為了用戶評價數據。用戶評價數據很大程度上會影響用戶對該商品的購買的因素。因此,可以通過研究用戶評價數據,分析數據之間的特點,挖掘數據的價值,就可以優化商品的不足之處,提高銷售份額。
一、數據挖掘在電子商務中的作用
數據挖掘:英文名稱為Data Mining,是從海量數據中分析出有價值、有意義、潛在的信息。并根據分析結果對各種決策提供數據依據和技術上的支撐。如何對海量數據進行有效利用,使得用戶能夠從海量數據中獲得自己所需要的知識和信息,提高其各種活動的效率和價值。
在電子商務領域中,數據挖掘其主要的目的就是從互聯網中獲取大量有關于電子商務相關的數據,通過數據挖掘手段挖掘出電子商務活動過程中的潛在價值的信息,以此來指導電子商務營銷活動,其具體的作用如下幾點:
1.根據用戶的瀏覽商品和購買商品的記錄,挖掘出用戶線上的活動規律,針對用戶電子商務活動特點,指導電子商務平臺用戶提供線上的“個性化”服務。
2.通過對電子商務網站用戶瀏覽商品頁面數據的分析,可以幫助電子商務平臺挖掘出該商品的潛在用戶。
3.目前對于線上網站來說,主要用戶都來自于搜索引擎和網站自身導航的引導,因此如何優化網站內部關鍵字和電子商務平臺內部導航,以提高網站訪問流量和方位商品的精準度。
4.通過對電子商務平臺中用戶對商品評價數據的挖掘,分析用戶購買商品后的情感分析,可以更深層次的挖掘用戶的具體需求。
5.通過平臺Web數據的挖掘,可以分析出一定的網站威脅、欺詐、入侵和很多異常訪問行為等。因此通過大數據挖掘分析,可以有效預防網絡危機,構建出一個安全、和諧的網絡環境。
隨著大數據的廣泛應用,數據挖掘對于電子商務的發展也起著很大影響,利用數據挖掘技術,可以有效的提高用戶訪問數量,優化網站訪問效率,挖掘潛在用戶、優化出售商品性能和提高網站安全環境等級等作用。
二、電子商務用戶評價數據挖掘技術研究
1.電子商務數據挖掘的過程
數據挖掘作為大數據的重要發展方向之一,其主要的目的是挖掘潛在用戶,服務于用戶,為用戶提供定制化的個性服務。在電子商務活動中,數據挖掘的服務對象是在線上的所有用戶,本文主要是研究用戶在電子商務平臺中各種對評價數據,包括了對商品評價,物流評價和售后評價等各個方面。
在電子商務活動中,數據挖掘的一般過程分為三個方面:
(1)數據準備階段,在該階段主要是對數據進行采集、數據的預處理。數據采集,采用主題性爬蟲進行,通過對電子商務平臺的結果進行分析,采用面向電子商務網站的主題網站爬蟲。同時利用云計算平臺的高計算能力、高寬帶量、大吞吐能力等有點,將網站爬蟲部署到云計算平臺中,采取并行技術,可以大大提高數據采集的效率,同時也可以提高數據采集的主題性。
將原始數據采集存放到數據庫后,接下來就是進行數據的預處理階段。數據的預處理就是通過消除噪聲、計算缺值數據、數據去重,最終將數據轉換成離散型數據的過程。
(2)數據挖掘階段,對于采集和預處理后的數據,首先要確定是數據挖掘目標和類型。在確定挖掘具體的任務后,可以采用相應的數據挖掘算法進行數據的挖掘,具體的算法接下來會詳細介紹數據挖掘的主要算法。經過數據挖掘過程后,會對挖掘的結果保存到數據庫后,以便于接下來的處理。
(3)第三個階段是對挖掘的數據結果進行評價,在該階段主要是對發現的知識,經過量化評估后,對存在冗余的知識點和與挖掘目標任務無關的知識點進行清洗。其次就是對挖掘結果不完全滿足的數據進行重新挖掘,可以選擇其他數據挖掘算法進行。對于滿足用戶需求的挖掘結果數據,經過可視化處理后,提供個用戶進行使用。
以上即是數據挖掘的三個主要階段,可以看出,數據在挖掘過程中,會出現挖掘不理想的情況,因此就需要調整挖掘算法進行反復挖掘,直到對挖掘目標任務滿足為止,同時保存挖掘不完整的過程,逐步的完善挖掘算法的自我學習和深度挖掘的能力,最終完成用戶所提出的挖掘需求。
2.電子商務數據挖掘算法介紹
數據挖掘算法是實現數據挖掘的關鍵性技術,采取哪種數據挖掘算法會直接影響到數據挖掘的效果,以下即是介紹幾種常見的數據挖掘算法:
(1)聚類挖掘算法,聚類分析是一種典型的統計學方法,是一種同數據庫技術相結合形成的現代化數據挖掘最為常用的技術之一。其主要的思想是在給定的是一個初始化數據集中,搜索數據對象之間是否存在有價值聯系。在電子商務活動中,可以利用聚類分析算法來發現客戶群中不同特點的群組,從而針對不同的特征群組來優化商品上下架、推廣的時間和位置,已提高商品銷售量。
(2)關聯規則分析法,該算法是比較基本的數據挖掘算法,其主要的思想是通過大量的數據來提取有用的數據,通過提出對提取數據和過去數據進行比較,找出數據與數據之間的關聯性,從而發現其潛在的關系。該算法可以幫助許多商務決策的制定,為商務活動的決策提供可靠的數據依據。
(3)時間序列模式,該數據挖掘的主要思想是,通過發現按時間順序查看時間事件數據庫,從數據中找出一個或多個相似的時序事件,通過時間序列搜索出重復發生概率較高的一種挖掘模式。發現序列模式便于進行電子商務組織預測客戶的查找模式,從而對客戶進行針對性的服務。在時序模式中,一個重要影響的方法是相似時序。
(4)預測與評價,該方法與關聯規則分析法有一定的相似性,都是對歷史數據進行綜合分析和歸納,從而推理出數據分布的時效性和規律性。從而對未來事件發展的趨勢和結果進行預測和評估。
3.數據挖掘在電子商務中的具體應用
(1)建立電子商務推薦系統,數據挖掘應用于電子商務其最大的一個特點就是可以圍繞客戶為中心,為客戶提供個性化服務。因此可以根據客戶的喜好和不同的特征,可以建立其一個基于數據挖掘的電子商務推薦系統。可以通過該系統為客戶提供與其感興趣的商品,幫助客戶快速找到所需要的商品,把電子商務由被動變為主動。
(2)優化商品的營銷策略,通過對用戶對電子商務平臺Web頁面的訪問,采集用戶各類評價數據,進行挖掘分析。可以充分了解用戶在使用商品后的真切感受,從而優化商品營銷的策略。針對不同的產品進行制定不同的營銷策略,利用數據挖掘技術實現不同的產品優惠、各類型促銷活動的策略方針,實現商品銷售利潤的最大化。
(3)優化平臺網站結構,增強平臺的安全性,對于電子商務平臺來說,其方位的數據量和網站本身的安全性,是有個至關重要的運營因素。有很多方法可以很好的實現,但是數據挖掘可以通過客戶本身的擁塞和訪問平臺的性能,來提示平臺管理者加以改進平臺的各項訪問策略。比如網站的緩存策略、網絡傳輸策略、流量負載平衡機制和數據的分布策略等。同時還可以有效防止非法人員惡意訪問平臺,消除平臺的弱點,提高站點可靠性,保證平臺的正常運行。
4.客戶滿意度分析機制,對于客戶滿意度的調查,可以通過各類型調查問卷來進行,但是這種方法最大的缺點就是被動,其效果與客戶填寫資料的主觀性有著很大的影響。因此可以采取數據挖掘的方式來進行,通過采集和挖掘用戶對商品、物流和客服的評價信息,進行情感分析實現主動式的客戶滿意度分析機制。這種分析機制可以主動、準確且客觀的分析出客戶對商品、物流公司和銷售服務的各項調查數據,為改進平臺的營銷策略提供可靠的決策依據。
三、總結
通過數據挖掘技術,對目前電子商務提出一個更為深刻的課題,打破了傳統的電子商務線上操作模式。對客戶的行為進行深度的分析,為其提供更為有效、更為精準的商品服務,提供技術和數據上支撐,這也是今后一段時間內電子商務發展的一個重要方向。
參考文獻:
[1]蔣良孝,蔡之華.電子商務中的數據挖掘及其應用[J].計算機工程與設計,2003,6(24),74-75.
[2]李濤,曾春秋,周武柏,等.大數據時代的數據挖掘--從應用的角度看大數據挖掘[J].大數據,2015,04:1-24.
[3]李雪菁.基于數據挖掘技術的電子商務客戶關系管理[J].計算機與數字工程,2018.
[4]易新忠.數據挖掘技術在電子商務中的應用探析[J].現代經濟信息,2018,13.
[5]劉芬.計算機數據挖掘技術的開發及其應用探究[J].現代工業經濟和信息化,2018,06.
[6]史紅霞.淺談數據挖掘在電子商務中的具體應用期[J].計算機產品與流通,2018,04.