袁奭暉++汪思敏++丁雄++盧嫣??
摘 要:數據挖掘技術是電子商務領域未來應用空間最大的一種新技術。橙光扶農平臺為了以最快的速度和效率推廣滯銷農產品,需要迅速找出潛藏于大量客戶群體中可以發展為愛心公益推廣使者的志愿者。因此,平臺利用數據挖掘技術,針對客戶歷史信息中的多個維度,設計了能迅速分析潛在志愿者的客戶細分模塊,取得了良好的效果。
關鍵詞:數據挖掘;愛心志愿者;客戶細分;維度分析;聚類分析
中圖分類號:F49 文獻標識碼:A doi:10.19311/j.cnki.16723198.2018.05.037
1 引言
扶農電子商務平臺是一種新興商業模式,可以有效的幫助農民朋友解決滯銷、掉價等傷農問題。但在我國現階段從事扶農電子商務的公司中,業務模式缺乏創新、效果不理想、經營目的缺乏社會公益性、技術相對落后等問題比較突出。橙光扶農平臺的基于志愿者公益性推廣模式,無疑是這一領域的一次新的嘗試。平臺把一些諸如數據挖掘和云計算等最新先進技術植入到電子商務平臺中來。雖然這些技術還在不斷的研究改進,但對于電商龍頭阿里巴巴等大公司,這些技術已經應用于公司的數據分析與商業模式研究,但沒有全面的為個人用戶服務。中國電子商務目前依托集約化平臺的現象十分普遍,比如淘寶、京東等,基本沒有自己獨立的客戶分析系統,這對于企業長遠的發展是不利的,電商市場急需有數據挖掘和云計算功能植入的獨立系統平臺。
2 國外發展研究現狀
由于國外許多電子商務平臺發展比較早,也成為我國電子商務行業發展早期的主要參照。他們的數據挖掘、云計算等技術也比我國研究應用的早,也已經有了相對成熟的研究模式和成果,并且早已經將這些成熟的技術應用到了電子商務領域。其中Amazon就是其中的佼佼者,其在電子商務領域不但成了一方霸主,同時也是云計算的最早引領者,數據挖掘與云計算已經成了其主要業務之一。科學技術正在領導世界社會的進步,例如谷歌的無人駕駛汽車、三星視網膜識別技術都在改變著整個世界格局。數據挖掘技術在企業信息系統中的廣泛應用已經是整個行業發展的必然,技術不但能提升了自身產品的含金量和競爭力,同時還可以擴展公司的業務范圍,幫助企業獲取更多的利潤源。
3 橙光扶農平臺客戶細分系統的需求分析
3.1 橙光扶農平臺建設背景
近年來,我國農產品滯銷現象層出不窮,傷農損農顯現不斷出現。一邊是市民抱怨農副產品價格大漲,一邊是農民種植的產品低價賤賣、血本無歸。分析這一怪相的原因有很多,比如:中間商壟斷收購、壓倉抬價;物流不暢、物流成本高;農民無規劃盲目種植、造成市場供過于求;一家一戶的分散種植經營模式,造成農產品滯銷、難賣等等。原因很復雜,但總歸有一點基本的問題就是市場供求信息流通不暢,解決的方法之一就是建設高效的信息平臺,幫助農民和消費者之間搭建無障礙的信息溝通的橋梁。橙光計劃的主要業務目標就是通過建設的電子商務系統平臺幫助農戶宣傳、銷售農產品,解決農戶農產品滯銷這一最大的困難。扶農平臺通過搭建供銷信息平臺“基地+平臺+消費者”的現代產銷體系,減少中間環節,減少時間地理帶來的經濟損失,引導農戶直接和市場對接。通過自建的電子商務交易平臺加強農產品市場信息的發布,拓寬農產品銷售渠道,建設農戶直通消費者的網絡直銷平臺,幫助滯銷的農戶銷售出農產品。
3.2 客戶細分的目的與需求
橙光平臺是以公益志愿者為主參與滯銷農產品公益推廣的運作模式。通過了解,我們發現大部分地區的農戶想要嘗試新的辦法銷售出農產品,但是又怕費力不討好,讓辛苦培育出的農產品銷售不出或者自己虧本。平臺從全國各地招募志愿者,家在滯銷地區的在校大學生、非滯銷地區的大學生、社會愛心人士等,家在滯銷地區的在校大學生更能清楚的了解滯銷地區的農產品情況,組織志愿者走進農戶,了解農戶農產品的銷售情況,向農戶推廣電子商務平臺,普及扶農平臺相關信息知識,了解市場情況,獲得信任,從而幫助他們銷售農產品。讓農戶愿意相信我們并愿意嘗試通過我們的扶農平臺銷售他們的農產品。
對于橙光平臺,基于公益的推廣模式的重要環節是從全國大量的客戶資源中,細分出能夠成為我們公益推廣使者的客戶群,發展他們成為我們團隊的成員,從而能最大限度的推廣滯銷農產品,更好的幫助農民朋友。但在海量的客戶數據中,迅速有效的找到適合的群體,一般是十分困難的。不過目前的數據挖掘技術、云數據技術可以幫我們實現這個需求。我們基于客戶的購買頻次、金額、數量、價格敏感系數等多個系數指標,設計了一套可以進行目標客戶聚合的客戶細分系統。
4 用戶細分系統設計
4.1 用戶數據的整理
在數據挖掘的應用過程中,為了便于進一步的深度挖掘,首先要對數據進行整理。在我們設計系統的多個數據表中,各表多個元素之間有很多關聯,數據冗余較多,所以,我們需要進行優化整理。橙光平臺的數據庫設計共有三個數據庫,并作為數據挖掘的三層基本結構。例如:對于客戶訂單信息數據,包括有農產品信息數據、愛心公益型用戶的信息、訂單物流信息數據以及農產品訂單數據等。首先進行第一層面的處理,就是把庫中多個表格的數據進行整合,然后把上層的數據進行整合,并集成到一個表中作為第二層,且每一個表都需要將重點數據信息突顯。在第三層中是用于數據的展示,方便數據的整合。針對各個維度,每一個都需要進行數據挖掘,以客戶記錄中訂單數量(order_num)為例,通過以訂單數作為主要的對象進行挖掘,可以把所有的客戶數據通過訂單數這個字段進行聚類,然后還可以分析其它維度信息,例如農產品大類的購買量和金額,從而去分析挖掘此客戶作為公益發展代表的可能性。
4.2 數據聚類的數學模型
系統應該給所有需要的聚類都設計一個數學模型,然后再以模型為基礎,求出相對應的數據集合。我們需要做的假定就是目標數據集由一系列概率分布的數據組成。我們通過設計一個數據分布模型來對分布情況進行描述,根據數學模型來尋找一個區域,以驗證維度分析的可能性。對于數據分布比較分散且不利于數據的分析這種情況,可以判斷維度的選擇是不恰當的,反過來如果數據相對比較集中,則可以判斷區域聚類是有效的。數學模型設定 X={X1,X2,…,Xn}是 n 維的一個立體模型,當中的 X1,X2,…,Xn 分別代表 n 維空間中單獨的一個維度。數學模型設計的算法輸入參數是 n 維空間中的點集合,其中 A={a1,a2,…,an}代表點集中。然后我們確定一個區域集,再確定好參數半徑δ,如果點中心與點的距離在δ以內,就算作集合的組成項。設計的二維空間的距離計算公式如式1所示:endprint
判斷點 A={a1,a2,…,an}是否位于指定區間{b1,b2,…,bn}內,只要比較a的每個分量是否都滿足距離中心距離小于參數δ。
4.3 客戶細分的聚類
在客戶進行細分時,所有類型客戶的參數都可以進行自主調整,我們首先通過消費者的消費總額進行第一層面的聚類,可以得到一個核心的點為¥450的范圍,然后設定范圍半徑為¥60,則可以得出此聚類范圍的客戶數量。在進行客戶細分時,不只是通過購買的總額度作為唯一單獨的維度,還將購買農產品總次數、價格敏感度、下單次數、區段時間內購買的頻次等信息要素按系數比例整合,組成一個特有的愛心公益客戶數據模型,再根據得出的數據結果進行客戶的類型級別的劃分。在我們目標客戶群體中,以分析富有愛心的公益客戶為主,可以發現多個不同情況的聚類。比如,按照交易的金額進行客戶公益熱衷度分類的聚類結果,如圖1(a)所示。同時我們還設計了以交易頻次作為分析對象,設置1-3次、4-6次、7-10次、10次以上作為維度分析的半徑,分析結果如圖1(b)所示。
通過對各個維度的因素設置合理的系數指標,我們將客戶的聚類分析結果進行匯總,按既定范圍將目標的客戶分為三大類,結果如圖2所示。從圖中我們發現,公益性強的客戶已基本從大量客戶信息資源中脫穎而出,我們將進行下一步吸收擴展,從最后的效果上來看,成功的幾率已比原來有大幅提高,證明了我們設計的客戶細分系統在這一應用領域的有效性。
5 結語
橙光平臺客戶細分模塊的設計實現,能有效的幫助我們在平臺客戶群體中快速找到并發展富有愛心的公益群里,能使我們的扶農項目在短期內達到理想的營銷推廣效果,對平臺而言是一個十分重要的功能。但是,由于開發設計的時間比較短,設計者的技術經驗不足,此模塊還有許多有待改進的地方。后期我們將不斷完善這一模塊的功能,并且將分析的維度進一步擴大,爭取提高分析結果的準確性和合理性。而且,在此基礎之上,未來我們還要將此技術應用的范圍擴大至我們的客戶服務這一領域,希望建設一個更好的平臺為廣大需要幫助的農民朋友和愛心客戶服務。
參考文獻
[1]張吉善,胡曉棠,尤惠.數據挖掘在電子商務中的應用[J].科技情報開發與經濟, 2007,(6Z):268268.
[2]逄琳,劉方愛.基于層次劃分的密度優化聚類算法[J].計算機應用,2016, 36(6).
[3]王碩.數據挖掘技術與電子商務關系分析[Z].大學生論文聯合比對庫,2015.
[4]侯俐至.SLA 驅動的 Paa S 平臺資源管理的設計與實現[D].北京:北京郵電大學,2014.endprint