999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

電商企業商品銷量的預測方法

2018-12-20 07:20:58王玉霞趙旭東
統計與決策 2018年22期
關鍵詞:影響模型

李 杰,王玉霞,趙旭東

(河北工業大學 經濟管理學院,天津 300401)

0 引言

目前,許多銷量預測研究是用歷史銷量來預測未來銷量,主要考慮銷量本身歷史數據的影響,較少考慮不同因素之間的相互影響。李俊等(2012)[1]將GM(1,1)模型、非線性三次指數平滑預測模型和二次回歸預測模型相結合組成了組合預測模型,依據某企業前10個月的銷量,預測后兩個月的銷量。Singh等(2014)[2]將人工神經網絡和模糊時間序列相結合,確定歷史時間序列的間隔期,將不同間隔期的時間序列分為不同組進行預測。Li等(2015)[3]建立了動態自適應的BP神經網絡學習算法來預測四川省消費產品的總銷售額,提高了預測的準確度。Chen等(2017)[4]基于徑向基函數神經網絡提出了一種進化算法,并利用該算法對電腦的銷量進行預測。盡管也有銷量預測研究考慮到了產品銷售的影響因素,但在進行銷量預測之前,并未對影響因素進行篩選,導致許多無關變量加入銷量預測模型,降低了模型的準確度。王大溪等(2015)[5]通過問卷調查方法,找到了可能影響孔塞銷售的主要影響因素,把所有可能的影響因素都帶入了基于混沌果蠅支持向量機回歸的產品銷量預測模型中,導致模型的預測精度較低。

為此,本文提出一種基于Granger因果檢驗和XGBoost算法的電商企業商品銷量預測方法。首先對Granger因果檢驗和XGBoost算法的基本原理進行了介紹,而后給出了銷量預測算法的具體實現步驟,最后通過對2014年10月27日至2015年2月27日某電商企業一種生活用品的銷量及其影響因素歷史數據進行建模和預測,驗證了該方法的有效性。

1 基于Granger因果檢驗與XGBoost算法的銷量預測模型

1.1 Granger因果檢驗

Granger因果檢驗是用于檢驗兩個變量之間因果關系的一種常用方法,該方法于1969年由Granger提出,70年代Hendry和Richard等加以發展。該方法的一個重要概念是Granger原因。存在兩個時間序列 Xt和Yt,若 Xt的滯后項在Yt的預測中有幫助,即利用Xt比不利用Xt可以更好的預測Yt,則稱 Xt是Yt的Granger原因。

檢驗Xt是否為Yt的Granger原因,需構建不含滯后項X的受約束回歸模型和含有滯后項X的無約束回歸模型,分別如式(1)和式(2)所示:

其中,Xt表示待檢驗的Granger原因(外生變量),Yt表示待檢驗的Granger結果(內生變量),αi和βi分別表示Yt和Xt各階滯后項的系數,α0表示常數項,εt表示殘差。

對式(1)和式(2)進行估計,構建F統計量檢驗的聯合假設H0:

如果在選定的顯著性水平α上計算的F值大于臨界Fα值,則拒絕零假設,即 Xt是Yt的Granger原因。

從上述Granger因果關系檢驗方法分析中可以看出,Granger因果關系檢驗方法的前提假設是Xt和Yt都是平穩(單整)序列,或者兩序列協整。因此,本文在進行Granger因果關系檢驗之前,先對各指標序列進行了ADF檢驗,驗證各序列的平穩性。各序列通過平穩性驗證之后,再進行Granger因果關系檢驗。

1.2 XGBoost算法

2015年Chen等提出了XGBoost算法,算法全名eX-treme Gradient Boosting,該算法是在Gradient Boosting Decision Tree(GBDT)基礎上發展起來的[6]。GBDT的算法流程與一般的Boosting算法類似,是一個迭代的過程,每一次迭代是為了減少上一次的殘差[7]。相比于GBDT算法只利用了一階導數的信息,XGBoost算法采用二階泰勒公式展開損失函數,求得模型最優解的效率更高。

1.2.1 XGBoost算法原理

XGBoost算法是一種boosting算法,它的基分類器為CART決策樹,最后的預測結果為K棵決策樹的預測結果之和,反映在如式(4)所在的等式中。其中表示數據樣本,?(t)代表i樣本在模型t次迭代后的預測結果,ft(xi)代表i樣本在第t棵決策樹的預測值:

利用二階泰勒展開式將式(5)中的損失函數展開得到式(6)。其中

在第t次迭代后,得到一個不帶有常數項的簡單目標函數如式(7)所示:

在第t棵決策樹中,存在一個映射函數Ij={i| q(xi)=j}能夠把一個樣本映射到某個葉子節點,所以目標函數可以從樣本求和轉化為葉子求和。通常正則化懲罰函數,T表示樹中包含T個葉子,γ和λ表示正則化懲罰函數的兩個系數。因此,可以將式(7)轉化為式(8)的形式,式中 ft(xi)=wj。

在創建決策樹時,一棵樹的obj的值越小,該樹的結構越好。也就是說,一個葉子節點分裂后的信息增益Gain越大,該樹結構越好。Gain的計算如式(11)所示:

1.2.2 XGBoost算法流程

XGBoost算法流程如下:

(1)對所有特征的特征值分別進行排序,依次掃描所有樣本,根據式(11)計算每個分裂點的信息增益。

(2)選擇信息增益最大的分裂點進行分裂。

(3)當達到預先設定樹的最大深度時停止分裂,轉到步驟(4);否則,轉到步驟(1)。

(4)按照自底向上的順序進行剪枝,如果某個節點之后存在負的信息增益,則除去這個分裂。

(5)當達到預先設定的迭代次數t時停止,否則,轉到步驟(1)。

1.3 銷量預測算法的實現步驟

在上述分析的基礎上,給出銷量預測算法的具體實現步驟:

(1)商品銷量初始影響因素的選擇。通過調查和訪談發現電商企業產品銷量的可能影響因素包括:商品的瀏覽次數、流量、被加購次數、加購人次、收藏夾人次、拍下筆數、拍下金額、拍下件數、成交金額、成交筆數、成交件數、成交人次等24個影響因素。設n=24表示影響因素的個數,則初始影響因素集可表示為:

(2)剔除與商品銷量無關的影響因素。對各影響因素和銷量序列分別做Granger因果關系檢驗,刪除無關影響因素,形成新的影響因素集:

(3)數據的預處理。剔除與商品銷量無關的影響因素數據后,對數據進行預處理。在原始數據中,產品的銷量及各影響因素的數值均按天給出。對實驗數據分析中發現,各影響因素距離預測時間越近對預測結果的準確性影響越大。本文以周為單位,采用滑窗采樣的方法,統計該窗口前1天、2天、3天、5天和7天各種影響因素數據的總值和均值,將得到的值作為新的特征加入到數據集。同時,考慮到產品銷量具有時序性的特點,統計該窗口前1天、2天、3天、5天和7天產品銷量的總值和均值以及該窗口前7天日銷量中的最大值、最小值和標準差也作為特征加入到數據集。

(4)設置合適的XGBoost算法參數,訓練XGBoost模型。分析該模型對于測試集的擬合誤差,并和其他常用的算法模型相比較。

2 電商企業商品銷量預測實例

2.1 數據來源及說明

選取某電商企業中生活用品2014年10月27日至2015年12月27日時間段內產品日銷量及24個可能影響因素的數據,如表1所示。由于篇幅所限,表1只展示了部分日期和影響因素的數據。需要特別說明的是,本文的銷量特指非聚劃算支付件數。

表1 生活用品日銷量及可能影響因素數據

2.2 Granger因果關系檢驗

數據從2014年10月27日至2015年12月27日共包含427個樣本,從表1商品日銷量的走勢來看,“雙11”和“雙12”的銷量驟增,被認定為異常點,因此分別刪除2014年和2015年“雙11”和“雙12”的4個樣本點,剩余樣本總數為423個。

本文使用EVIEWS6.0統計軟件,對24個可能影響因素和銷量的時間序列分別做ADF檢驗,以驗證各序列的平穩性。在做ADF檢驗的過程中均采用修正的AIC準則判斷滯后期,所得結果如表2所示。

通過上述ADF檢驗結果可知,在5%顯著性水平下,24個影響因素和銷量序列均通過了平穩性檢驗,可以直接進行Granger因果關系檢驗。在進行Granger因果關系檢驗時,通過建立VAR模型找到最優滯后階數。Granger因果關系檢驗結果如表3所示。

從Granger因果關系檢驗結果可以看出,在5%的顯著性水平下,被加購次數、加購人次、收藏夾人次、淘寶客引導瀏覽次數、淘寶客引導瀏覽人次、直通車引導瀏覽次數、直通車引導瀏覽人次不是銷量的Granger原因,剩下的17個影響因素都是銷量的Granger原因。因此,在進行銷量預測時,剔除7個無關影響因素的數據。

2.3 數據預處理

在刪除了“雙11”“雙12”和7個無關影響因素的數據之后,以周為單位,利用滑窗采樣的方法對數據進行預處理。以周為單位滑窗采樣,是因為要預測的是該產品一周中的總銷量。統計該窗口前1天、2天、3天、5天和7天17種影響因素和產品銷量的總值和均值,同時統計該窗口前7天日銷量中的最大值、最小值和標準差,將這些統計數據作為銷量預測的特征變量。將該窗口在這一周的產品銷量總和作為標簽值。經過這樣的預處理后特征變量由最初的17個變為183個,樣本數量由423變為60個。在滑窗采樣過程中2015年12月21日至2015年12月27日產品銷量的滑動窗口為1,2015年12月14日至2015年12月20日產品銷量的滑動窗口為2,依此類推,2014年11月3日至2014年11月10日產品銷量的滑動窗口為60。因此,數據從2014年10月27日至2015年12月27日的423個日樣本數量變為了60個周樣本數量。表4給出了預處理后部分滑窗和特征變量的數據。

表2 日銷量及24個可能影響因素時間序列ADF檢驗結果

表3 Granger因果關系檢驗結果

表4 預處理后部分滑窗和特征變量的數據

表4中Watch指滑窗數,Label指標簽值,Pi指瀏覽次數,sn指銷量(非聚劃算支付件數)。Pi_avg_1指該窗口前1天瀏覽次數的均值,Pi_sum_1指該窗口前1天瀏覽次數的總值,Pi_avg_2指該窗口前2天瀏覽次數的均值,Std_sn指該窗口前7天日銷量的標準差。

2.4 XGBoost算法擬合模型及模型精度檢驗

本文選取2014年10月27日至2015年12月20日的數據作為訓練集,2015年12月21日至2015年12月27日的數據作為測試集,即預處理后滑窗2~60的數據作為訓練集,預處理后滑窗1的數據作為測試集。用訓練集來擬合XGBoost模型,對2015年12月21日至2015年12月27日產品周銷量進行預測,并將該模型的預測結果和常用GBDT、RF算法模型的預測結果進行比較,所得預測結果如表5所示。

表5 各算法模型預測精度比較

從表5的對比結果可以看出,無論是否進行Granger因果檢驗,XGBoost算法模型預測的相對誤差都小于GBDT和RF算法。當進行Granger因果檢驗剔除無關影響因素后,各算法的相對誤差都有所下降。在進行Granger因果檢驗,并用XGBoost算法模型擬合后,該預測的相對誤差最小為2.5%,充分說明了該銷量預測方法的有效性。

3 結論

本文對電商企業商品銷量預測問題進行了研究,在綜合分析了產品銷量時序特征和外部影響因素的基礎上,提出了基于Granger因果檢驗與XGBoost算法的電商企業商品銷量預測方法。該方法通過Granger因果分析剔除了無關的銷量影響因素,在數據預處理中充分考慮了影響因素距離預測時間越近對預測結果準確性影響越大的特點,并將產品銷量的時序特征也考慮在內。在數據預處理完成之后,用XGBoost模型進行擬合。該銷售預測方法的應用表明,所提方法能夠較好的解決電商企業商品銷量預測的問題。同時,也可以考慮將該種銷量預測方法推廣到實體企業商品銷量預測中去。

猜你喜歡
影響模型
一半模型
是什么影響了滑動摩擦力的大小
哪些顧慮影響擔當?
當代陜西(2021年2期)2021-03-29 07:41:24
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
沒錯,痛經有時也會影響懷孕
媽媽寶寶(2017年3期)2017-02-21 01:22:28
3D打印中的模型分割與打包
擴鏈劑聯用對PETG擴鏈反應與流變性能的影響
中國塑料(2016年3期)2016-06-15 20:30:00
基于Simulink的跟蹤干擾對跳頻通信的影響
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 国产青青操| 9啪在线视频| 99视频有精品视频免费观看| 免费看久久精品99| JIZZ亚洲国产| 国产免费精彩视频| 美女无遮挡免费网站| 四虎成人免费毛片| 污污网站在线观看| 亚洲国产第一区二区香蕉| 蜜桃视频一区| 91偷拍一区| 热这里只有精品国产热门精品| 黄色网页在线观看| 日本在线国产| 国产精品成人免费视频99| 国产欧美视频综合二区 | 玖玖免费视频在线观看| 在线观看91精品国产剧情免费| 国产欧美日韩资源在线观看| 国产精品自在在线午夜区app| 国产永久免费视频m3u8| 国产第八页| 欧美一区中文字幕| 亚洲区一区| 国产毛片基地| 欧美综合激情| 91精品小视频| 一级成人a毛片免费播放| 久久精品人人做人人综合试看| 国产91麻豆免费观看| 精品国产一区91在线| 香蕉视频在线精品| 国产微拍精品| 免费人成黄页在线观看国产| 国产精品免费福利久久播放| 国内熟女少妇一线天| 日韩一二三区视频精品| 精品欧美一区二区三区久久久| 亚洲日韩Av中文字幕无码| 再看日本中文字幕在线观看| 伊人久久福利中文字幕| 欧美一区二区三区不卡免费| 在线欧美日韩国产| 美女扒开下面流白浆在线试听| 欧美在线视频a| 国产精品密蕾丝视频| 国产日本欧美亚洲精品视| 97国产一区二区精品久久呦| 免费毛片视频| 青青草国产在线视频| 欧美有码在线观看| 四虎永久在线精品国产免费| 国产毛片高清一级国语 | 亚洲狠狠婷婷综合久久久久| 欧美日韩激情在线| 永久成人无码激情视频免费| 国产香蕉97碰碰视频VA碰碰看| 大香伊人久久| 88av在线播放| 午夜日本永久乱码免费播放片| 亚洲国产亚综合在线区| 久久久久久久蜜桃| 69av免费视频| 中文字幕无码中文字幕有码在线| 成人免费网站久久久| 在线观看亚洲天堂| 日本精品视频一区二区| 日韩欧美国产另类| 992Tv视频国产精品| 亚洲天堂777| 欧美精品影院| 亚洲人免费视频| 18禁高潮出水呻吟娇喘蜜芽| 在线高清亚洲精品二区| 午夜精品福利影院| 区国产精品搜索视频| 日本一区高清| 亚洲免费福利视频| 波多野结衣第一页| 欧洲亚洲一区| 国产成人精品一区二区三区|