黃毅能 吳旭東 多曉偉



基金項目:2019年江西省教育廳科學技術研究項目“數(shù)據挖掘技術在電商平臺中的應用——以陶瓷餐具的電商營銷為例”(項目編號:191300)
摘 要:本文通過與淘寶后臺核心經營數(shù)據進行分行析,使用生意參謀工具,在數(shù)據中心進行數(shù)據對接。利用數(shù)據挖掘的若干重要分析方法,抽取核心經營數(shù)據進行分析。對兩個月60天的數(shù)據進行分析,通過關聯(lián)規(guī)則分析、神經網絡兩種算法對淘寶核心數(shù)據進行分析,建立了經營預警機制,進而為提高店鋪經營提供一些參考性的建議。
關鍵詞:數(shù)據挖掘;陶瓷餐具;電商平臺
本文以淘寶電商平臺陶瓷餐具店鋪真實銷售數(shù)據為,專門針對陶瓷餐具的銷售歷史原始數(shù)據進行數(shù)據挖掘分析。對數(shù)據進行檢測、篩選、抽取、整理。然后,利用SPSS clementine數(shù)據挖掘軟件建立樣本模型、測試樣本數(shù)據等一系列數(shù)據挖掘工作;其中重點運用數(shù)據挖掘中常見的算法進行建模,找出適合陶瓷餐具電商銷售的算法并加以分析。如圖1陶瓷餐具電商銷售數(shù)據挖掘詳細流程圖
一、關聯(lián)規(guī)則分析
(一)數(shù)據預處理
通過相關軟件把淘寶店鋪銷售數(shù)據下載下來,先對數(shù)據進行前期的整理,然后將數(shù)據預處理,對數(shù)據離散化和抽象化處理,從而能更好的符合關聯(lián)數(shù)據挖掘模型。在開展數(shù)據挖掘之前,需要將購買商品的子類目以及購買金額。商品的類目按數(shù)據表中的順序依次映射成為英語字母A-餐具籠/架、B-碟、C-瓶/罐、D-盤、E-餐具瓷器套裝、F-果盆/果盤/果籃、G-餐墊等;經過處理以后如表1所示。
(二)實驗過程與分析
對顧客購買數(shù)據進行離散化處理,通過類型選擇集合,數(shù)據挖掘的核心算法采用GRI關聯(lián)規(guī)則算法,其中的支持度設置為50%,置信度設置為60%。數(shù)據挖掘結果如圖3所示:
規(guī)則1中顯示,購買餐墊和瓶/罐的客戶占52%,其中購買餐墊同時有76.92%的顧客購買了瓶/罐。
規(guī)則2中顯示,購買餐墊和餐具瓷器套裝的客戶占53%,其中購買餐墊同時有75.47%的顧客購買了餐具瓷器套裝。
規(guī)則3中顯示,購買餐具瓷器套裝和瓶/罐的客戶占52%,其中購買餐具瓷器套裝的同時有71.15%購買瓶/罐。
規(guī)則4中顯示,購買瓶/罐和餐具瓷器套裝的客戶占53%,其中購買瓶/罐的同時有69.81%購買餐具瓷器。
規(guī)則5顯示,購買果盆/果盤/果籃和盤的客戶占52%,其中購買果盆/果盤/果籃同時有67.31%購買盤。
二、神經網絡預測
(一)神經網絡算法
人工神經網絡又稱連接機模型,是一種無監(jiān)督的學習,是現(xiàn)代神經學、生物學、心理學的基礎上產生的一種算法模型,屬于無監(jiān)督學習的算法。是模擬生物神經系統(tǒng)處理外界事物的基本過程,是在模擬人類大腦的神經組織發(fā)展起來的計算系統(tǒng)。包括大規(guī)模并行、分布式處理、自組織、自學習等優(yōu)點,廣泛應用于模式識別、語音分析、圖像識別、數(shù)字簽名、計算機視覺等很多領域,取得了許多豐碩的成果。1986年由Rinehart和McClelland科學共同提出,按誤差逆向傳播算法訓練多層前饋網絡,是目前較典型的神經網絡算法之一。BP網絡能學習和存儲大量的輸入—輸出模式映射關系,不需要提前知道映射關系的數(shù)學方程。學習過程使用最快下降法,通過反向傳播來不斷調整網絡的權值和閾值,使網絡的誤差平方和最小。BP神經網絡具有非線性映射能力、自學習和自適應能力、泛化能力、容錯能力等優(yōu)點,國內不少研究學者都對其進行了重點研究,運用網絡解決了許多領域的問題。
BP神經網絡的計算過程由正向計算過程和反向計算過程組成。正向傳播過程中,輸入模式從輸入層到隱含層單元層逐層處理,逐步轉向輸出層,每一層神經元的狀態(tài)只影響下一層神經元的狀態(tài)。如果不能得到期望的輸出結果則轉入反向傳播,將誤差信號沿原來的連接通路返回,通過調整各層神經元的權值和閾值,把型號誤差調到最小。主要包括兩個步驟:第一步是網絡狀態(tài)初始化,第二步是前向計算過程。BP網絡主要應用在以下四個方面:
1.函數(shù)逼近:輸入向量和輸出向量訓練出對應的網絡模型逼近指定的函數(shù)。
2.模式識別:用指定的輸出向量于輸入向量進行關聯(lián),訓練特定的模型。
3.分類:把一些向量按著一定的規(guī)則進行分類。
4.數(shù)據壓縮:減少輸出向量的維度,方便傳輸和存儲。
(二)實驗過程
利用BP神經網絡算法構建模型,對準備好的數(shù)據進行挖掘,對數(shù)據源的各個字段類型進行合適的設置。利用支付轉化率、訪客數(shù)、成功退款金額、作為輸入項,借閱量作為輸出量。如圖5、圖6所示。
訓練樣本共60條,支付轉化率、訪客數(shù)、成功退款金額、直通車消耗、老買家支付金額、淘寶客傭金、客單價和支付件數(shù)8個字段作為輸入層,輸入層包括8個神經元,隱藏層包括3個神經元,輸出層包括1個神經元為支付金額。建立BP神經網絡模型,預測后10天的支付金額,假設后10天的支付金額是未知的,通過比較預測值與真實值的誤差,結果預測的準確率比較高為82.519%。
利用神經網絡建立淘寶店鋪經營預警機制。如圖7所示,輸入店鋪核心經營數(shù)據,利用事先建立好的BP神經網絡模型預測支付金額,如果預測值與實際值的誤差在20%以內,則說明正常,如果誤差超過了20%,則開始預警,表示淘寶店鋪經營數(shù)據異常,需要認真分析查找原因,首先查詢日常核心數(shù)據,找出原因后,再調整店鋪商品的擺放、定價、店鋪的裝修以及詳情頁的設計等。
結束語:
本文從淘寶網店的購買記錄出發(fā),通過發(fā)掘歷史數(shù)據,建立一些典型的數(shù)據挖掘分析法模型得出了一些有趣的結論。
1.使用關聯(lián)規(guī)則分析,發(fā)現(xiàn)了一些有趣的規(guī)律即:陶瓷餐具的某些產品存在著密切的關系。算通過規(guī)律合理安排陶瓷網店中商品的上架排布,商品的定價策略等。
2.利用神經網絡法預測出未來淘寶網店的銷售數(shù)據,并在此基礎上建立了淘寶網店的預警機制。
參考文獻:
[1]朱沙.電子商務中計算機WEB數(shù)據挖掘技術的應用分析[J].商場現(xiàn)代化,2018(23):34-35.
[2]李濤,曾春秋,周武柏,等.大數(shù)據時代的數(shù)據挖掘——從應用的角度看大數(shù)據挖掘[J].大數(shù)據,2015(04):1-24.
[3]李楠楠.大數(shù)據挖掘技術在電子商務企業(yè)營銷中的應用研究[J].全國流通經濟,2019(8):16-17.
[4]方晶晶、劉佳峰.數(shù)據挖掘技術在企業(yè)服務中的應用與研究[J].電腦編程技巧與維護.2020(06):105-107.