999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于GBRT樹模型分位數(shù)回歸預(yù)測的CPFR補貨方法

2019-02-07 05:32:15孫延華張冬杰曾慶維金健陳桓姚小龍
軟件導(dǎo)刊 2019年12期
關(guān)鍵詞:大數(shù)據(jù)

孫延華 張冬杰 曾慶維 金健 陳桓 姚小龍

摘要:隨著大數(shù)據(jù)的發(fā)展和物流科技信息化進程的加快,企業(yè)供應(yīng)鏈數(shù)據(jù)呈爆炸式增長,且種類繁多、關(guān)系網(wǎng)絡(luò)復(fù)雜,而傳統(tǒng)cPRF技術(shù)中的預(yù)測模型已經(jīng)不能適應(yīng)供應(yīng)鏈大數(shù)據(jù)需求預(yù)測,更不能依據(jù)需求預(yù)測進行有效的庫存管理,經(jīng)典的周期庫存盤點策略也不能很好地適應(yīng)非正態(tài)分布的需求數(shù)據(jù),如何對供應(yīng)鏈大數(shù)據(jù)進行準(zhǔn)確預(yù)測并補貨已成為供應(yīng)鏈研究的熱點。依據(jù)大數(shù)據(jù)的分位數(shù)回歸預(yù)測技術(shù),利用歷史數(shù)據(jù)信息進行準(zhǔn)確預(yù)測,并將分位數(shù)回歸預(yù)測與補貨模型合理有效連接,通過真實數(shù)據(jù)仿真分析,表明在98%的服務(wù)水平下,平均庫存得到了降低。

關(guān)鍵詞:大數(shù)據(jù);物流供應(yīng)鏈;CPRF;分位數(shù)回歸預(yù)測;服務(wù)水平;庫存

DOI:10.11907/rjdk.192360

中圖分類號:TP306 文獻標(biāo)識碼:A 文章編號:1672-7800(2019)012-0035-05

0引言

在經(jīng)濟全球化和科技物流迅速發(fā)展的今天,企業(yè)供應(yīng)鏈的科學(xué)有效管理依賴于現(xiàn)代信息技術(shù),各供應(yīng)鏈企業(yè)也積累了豐富的供應(yīng)鏈大數(shù)據(jù),如何利用大數(shù)據(jù)技術(shù)進行供應(yīng)鏈優(yōu)化受到高度關(guān)注。CPRF技術(shù)是計算機領(lǐng)域與供應(yīng)鏈庫存管理領(lǐng)域相結(jié)合的研究熱點。供應(yīng)鏈?zhǔn)侵竾@核心企業(yè),通過對信息流、物流、資金流的控制,從采購原材料開始,制成中間產(chǎn)品以及最終產(chǎn)品,最后由銷售網(wǎng)絡(luò)將產(chǎn)品送到消費者手中,并將供應(yīng)商、制造商、分銷商、零售商、最終用戶連成一個整體的功能網(wǎng)鏈結(jié)構(gòu)模式。同一個企業(yè)可能構(gòu)成該網(wǎng)鏈的不同組成節(jié)點,但更多情況下是由不同企業(yè)構(gòu)成該網(wǎng)鏈的不同節(jié)點。供應(yīng)鏈管理是一種集成管理思想和方法,是在滿足一定客戶服務(wù)水平條件下,為使整個供應(yīng)鏈系統(tǒng)成本最小,將鏈上各節(jié)點有效組織在一起而進行的產(chǎn)品制造、轉(zhuǎn)運、分銷及銷售的整體管理模式。

庫存表示用于將來目的的資源暫時處于閑置狀態(tài),設(shè)置庫存的目的是防止短缺,其對企業(yè)供應(yīng)鏈管理具有重要作用,可提高服務(wù)水平并降低成本。優(yōu)秀的庫存管理模型既能減少缺貨成本,又能提高企業(yè)服務(wù)水平,而過多的庫存也會給企業(yè)帶來損失,庫存過多會長久地積壓在庫,勢必造成資金周轉(zhuǎn)緩慢、資本回報率低。要進行精確的庫存管理,合理的預(yù)測模型必不可少。CPRF技術(shù)是最新的供應(yīng)鏈管理技術(shù),可提高預(yù)測準(zhǔn)確度,最終達到提高供應(yīng)鏈效率、減少庫存和提高消費者滿意度的目的。

隨著經(jīng)濟全球化的加快,零售企業(yè)將面臨全世界范圍內(nèi)的巨大競爭壓力,迫切需要利用有價值的商業(yè)信息和知識應(yīng)對日益劇增的市場挑戰(zhàn)。隨著計算機信息技術(shù)的快速發(fā)展,大量信息技術(shù)如條形碼、電子收款機、POS系統(tǒng)已在零售業(yè)廣泛使用,這些信息系統(tǒng)的日益龐大積累了大量銷售交易數(shù)據(jù),如何基于零售業(yè)銷售信息得到準(zhǔn)確的預(yù)測知識,以幫助零售企業(yè)作出正確決策,更好開發(fā)CPRF技術(shù)中的預(yù)測模塊,是當(dāng)前零售業(yè)亟待解決的問題。

數(shù)據(jù)挖掘是從大量、不完全、有噪聲、模糊、隨機的實際數(shù)據(jù)中,提取隱含、未知而又潛在有用信息與知識的過程。而傳統(tǒng)零售業(yè)的銷量預(yù)測有季節(jié)分析模型、馬爾科夫預(yù)測模型等,但這些模型都是基于簡單的統(tǒng)計技術(shù),利用歷史數(shù)據(jù)和商品銷量數(shù)據(jù),不能深層次地挖掘影響銷量的一些原因與特征,數(shù)據(jù)維度單一,數(shù)據(jù)量大小對于預(yù)測準(zhǔn)確性提升有限,對于長期變化規(guī)律的場景捕捉能力差。本文利用數(shù)據(jù)挖掘技術(shù)挖掘各種影響銷量的相關(guān)特征,建立樹模型對其銷量進行預(yù)測。預(yù)測模型能快速捕捉到市場變化,具有強大的特征識別和挖掘能力以及防止過擬合的優(yōu)勢,非常適合突發(fā)事件預(yù)測。本文將計算機大數(shù)據(jù)機器學(xué)習(xí)技術(shù)與供應(yīng)鏈CPFR技術(shù)相結(jié)合,提出基于分位數(shù)回歸預(yù)測的補貨模型。

1相關(guān)研究

1995年,沃爾瑪與其供應(yīng)商Warner-Lambert等5家公司共同開發(fā)出CPFR(collaborate Planning Forecastingand Replenishment)技術(shù)。CPFR是零售行業(yè)中的一種供應(yīng)鏈管理方案,在提升供應(yīng)鏈運行效率的同時也加強了供應(yīng)鏈各環(huán)節(jié)之間的協(xié)同合作能力,它是在VMI(供應(yīng)鏈管理庫存)之后集預(yù)測和補貨于一體的供應(yīng)鏈整合全新技術(shù)。CPFR的預(yù)測提高了需求預(yù)測準(zhǔn)確度,從而能科學(xué)有效地制定庫存策略,降低生產(chǎn)、運輸、庫存持有成本,提高銷售量,進而提高供應(yīng)鏈運行效率。

現(xiàn)有銷量預(yù)測算法主要分為時間序列預(yù)測算法和機器學(xué)習(xí)預(yù)測算法。時間序列方法采取自回歸的方式(Auto-Regression,AR),用歷史上因變量y的取值預(yù)測y。Box& Jenkins在1970年提出ARIMA模型,其中ARIMA(p,d,g)稱為差分自回歸移動平均模型,P為自回歸項,g為移動平均項數(shù),d為時間序列平穩(wěn)時所做的差分次數(shù)。ARIMA用差分將非平穩(wěn)時間序列轉(zhuǎn)化為平穩(wěn)的時間序列,再進行滑動平均。另一種通用的時間序列方法是指數(shù)平滑方法(Exponential Smoothing),Peter Winters & Charles holt在1960年提出其中3次指數(shù)平滑方法(Triple ExponentialSmoothing),也稱為Holt-winters模型,Holt-winters季節(jié)模型在每個周期中采用水平、趨勢及季節(jié)3個權(quán)重更新分量,可同時修正時間序列的季節(jié)性和傾向性,并能將隨機波動的影響適當(dāng)過濾掉,適于趨勢性和季節(jié)性的時間序列。Taylor在2017年提出Prophet模型,采用廣義加法模型擬合平滑和預(yù)測函數(shù)。模型整體由3部分組成:增長趨勢、季節(jié)性趨勢、節(jié)假日,并且加人了噪聲擾動項,提升了模型的魯棒性,達到了時序模型的最好性能。機器學(xué)習(xí)模型預(yù)測算法主要有線性回歸、SVM、決策樹模型以及深度學(xué)習(xí)模型。線性回歸指利用線性回歸方程的最小二乘函數(shù)對一個或多個自變量和因變量之間關(guān)系進行建模的一種回歸分析。Vapnik在1998年提出SVM(support Vec-tor Machine),其基本思想是用少數(shù)支持向量代表整個樣本集,通過核函數(shù)將輸入空間的數(shù)據(jù)映射到更高維特征空間,然后在新的空間內(nèi)按照結(jié)構(gòu)風(fēng)險最小化原則構(gòu)造一個最優(yōu)分割面,對于有異常值、數(shù)據(jù)量小、維度高的數(shù)據(jù)集有很好效果。決策樹模型由于單棵決策樹性能限制,大多采用集成學(xué)習(xí)方法,分Bagging和boosting兩類。其中,Bag-ging的代表作是隨機森林,由Leo Breiman提出,它通過自助法(Bootstrap)重采樣技術(shù),從原始訓(xùn)練樣本集N中有放回地重復(fù)隨機抽取k個樣本生成新的訓(xùn)練樣本集合,然后根據(jù)自助樣本集生成k個分類樹組成隨機森林,結(jié)果按投票法而定,在計算速度和分布式計算方面有很大優(yōu)勢。Boosting的代表作是梯度提升樹,是由FRIEDMAN于2001年提出的一種改進算法。它是一種迭代的決策樹算法,該算法由多棵決策樹組成,所有樹的結(jié)論加起來作為最終答案。與隨機森林不同的是,每次建立模型是在之前建立模型損失函數(shù)的梯度下降方向,改進了傳統(tǒng)Boosting對正確和錯誤樣本進行加權(quán)的方法。深度學(xué)習(xí)模型善于提取時間和空間類的復(fù)雜特征;RNN(Recurrent Neural Net-work)對于時序數(shù)據(jù)可以自動提取時間維度的特征。Schmidhuber在1997年提出LSTM(Long Short-TermMemory),引入輸入門、輸出門和遺忘門的概念,解決了RNN梯度消失的問題,是目前處理時序數(shù)據(jù)性能最好的深度學(xué)習(xí)模型。Kyunghyun在2014年提出GRU(Gated Re-current Unites),將LSTM輸人門、輸出門和遺忘門縮減為兩個門:更新門和重置門,減少了模型參數(shù),對于小數(shù)據(jù)集有更好的表現(xiàn)。

2預(yù)測模型

GBDT是一個梯度提升模型,使用基于機器學(xué)習(xí)算法的決策樹,該算法是對隨機森林的進一步改進,在模型的樹模型中包含了分類樹和回歸樹。決策樹常用來處理分類問題,在商品銷量預(yù)測中可以對商品離散型特征進行有效處理和預(yù)測;回歸樹常用來處理預(yù)測問題,對商品的時間等連續(xù)性特性更加敏感。GBDT采用梯度提升方式,將分類數(shù)和回歸樹進行有效疊加,該算法應(yīng)用于商品銷量預(yù)測中,可以有效地將商品的基本屬性,如類別、周期性指數(shù)等離散特征與按時間滑動窗口獲取的連續(xù)銷量的連續(xù)特征有效結(jié)合,使商品銷量預(yù)測的多方面特征得到更綜合的利用。

分位數(shù)回歸是基于被解釋變量的條件分布擬合解釋變量的回歸模型。傳統(tǒng)回歸方法研究自變量與因變量條件期望之間的關(guān)系,而分位數(shù)回歸是通過估計被解釋變量取不同分位數(shù)時,對特定分布的數(shù)據(jù)進行估計,可以進一步推論因變量的條件概率分布。梯度提升樹(GradientBoosting Tree)算法是用訓(xùn)練樣本集產(chǎn)生多棵弱回歸樹集成形成強回歸樹的集成學(xué)習(xí)方法,在基于表格類數(shù)據(jù)的機器學(xué)習(xí)任務(wù)方面顯示出最好效果。

最近幾年,3種高效的GBRT實現(xiàn)方式被提出:XG-Boost、LightGBM和CatBoost。這3種模型在工業(yè)界、學(xué)術(shù)界和數(shù)據(jù)科學(xué)競賽中被廣泛采用。本文應(yīng)用XGBoost、LightGBM和CatBoost 3種GBRT算法分別建立分位數(shù)回歸模型,根據(jù)模型評價指標(biāo)對其進行對比研究。

2.1XGBoost

XGBoost(Extreme Gradient Boosting)對損失函數(shù)進行泰勒公式二階展開,在損失函數(shù)后面增加正則項,用于約束損失函數(shù)下降和模型整體復(fù)雜度,并且在計算葉子節(jié)點基尼指數(shù)時采取并行計算方式模型,能自動利用CPU進行多線程并行計算,是GBRT基礎(chǔ)上的一種優(yōu)化算法。XG-Boost層生長策略如圖l所示。XGBoost的目標(biāo)函數(shù)為:

2.2LightGBM

Light Gradient Boosting Decisition Tree(LightGBM)由Guolin于2017年提出,與普通的GBRT模型有如下兩點區(qū)別:

(1)帶深度限制的Leaf-wise葉子生長策略。相比于普通GBDT工具使用按層生長(Level-wise)的決策樹生長策略,具有控制模型復(fù)雜度、降低過擬合的效果。LightG-BM葉子生長策略如圖2所示。

(2)直方圖算法。其基本思想是先將連續(xù)的浮點特征值離散化成k個整數(shù),同時構(gòu)造一個寬度為k的直方圖。在遍歷數(shù)據(jù)時,根據(jù)離散化后的值作為索引在直方圖中累積統(tǒng)計量,遍歷尋找最優(yōu)分割點,降低了內(nèi)存消耗和時間復(fù)雜度。

2.3Catboost

2017年,由Yandex公司推出的CatBoost算法是一種擅長處理類別特征(categorical Features)的梯度提升(GBRT)算法。CatBoost運用一種有效方式將類別特征轉(zhuǎn)化成數(shù)值型數(shù)據(jù)并且防止過擬合:OneHotMaxSize(OHMS)。CatBoost在執(zhí)行隨機排列后能有效處理類別特征,通過使用多個排列訓(xùn)練不同模型防止過度擬合,進而獲得對梯度的無偏估計,以減輕梯度估計偏差的影響,提高模型魯棒性。主要通過以下3步完成:

(1)將初始數(shù)據(jù)進行隨機排列,產(chǎn)生多個隨機排列。

(2)將具有浮點或類別的標(biāo)簽值轉(zhuǎn)換為整數(shù)。

(3)通過式(4)將分類變量轉(zhuǎn)換成數(shù)值型變量。其中,CountInClass是具有當(dāng)前分類特征值的對象標(biāo)簽為1出現(xiàn)的次數(shù),totalCount是具有與當(dāng)前值匹配的分類特征值的對象總數(shù),Prior是分子的初始值。

2.4性能比較

各機器學(xué)習(xí)算法性能比較如表l所示。

3實驗結(jié)果

利用某零售業(yè)供應(yīng)商19家門店2015年1月-2019年5月牛奶的歷史銷量數(shù)據(jù),訓(xùn)練數(shù)據(jù)集達百萬以上,通過GBRT樹模型分位數(shù)回歸算法預(yù)測2019年6月1日-14日的銷量。其中50分位數(shù)的MAPE誤差為:

4CPRF庫存補貨方法

4.1經(jīng)典庫存管理模型

在周期盤點策略中,庫存每盤點之后隨即發(fā)生一次訂貨,使得現(xiàn)有庫存水平加上補貨量達到目標(biāo)最大庫存,假設(shè)為OUL,盤點周期等于連續(xù)兩次訂貨的時間間隔T,并假設(shè)已知如下參數(shù):D=每個時期的平均需求;σp=每個時期需求的標(biāo)準(zhǔn)差;L=平均提前期;T=盤點間隔期;CSL=期望周期服務(wù)水平。

為確定所需安全庫存,跟蹤店面經(jīng)理每次發(fā)出訂單后隨時間順序發(fā)生的各時間點。店面經(jīng)理在時點0下達第一個訂單,訂貨批量和現(xiàn)有庫存之和達到目標(biāo)最大庫存,訂單一旦發(fā)出,經(jīng)過提前期L補充訂貨將送達。下一次盤點庫存的時間為T,這時,店面經(jīng)理下達第二個訂單,訂貨在T+L時送達。目標(biāo)最大庫存水平表示滿足時點0到達時點T+L期間需求的庫存,如果在0到T+L的間隔期內(nèi),需求超過目標(biāo)最大庫存,倉庫將出現(xiàn)缺貨。因此,在經(jīng)典周期盤點策略中,必須確定一個目標(biāo)最大庫存水平使得等式成立。

4.2基于GBRT樹分位數(shù)回歸補貨模型

在經(jīng)典庫存管理模型中,需求數(shù)據(jù)必須滿足正態(tài)分布的假設(shè)前提,而實際零售業(yè)的需求分布并不能很好地滿足正態(tài)分布。本文提出一種基于分位數(shù)回歸預(yù)測的補貨模型,假設(shè)分位數(shù)為Cr,則目標(biāo)最大庫存為:

5仿真分析

為了驗證分位數(shù)模型對CPRF補貨方法的有效性,使用與預(yù)測算法相同供應(yīng)商19家門店牛奶2018年7月-2019年4月的真實銷量數(shù)據(jù),每天門店銷售約千種sku,特征維度上百維,對其進行仿真分析。

由圖4可看出,使用分位數(shù)模型的平均庫存要低于經(jīng)典模型下的平均庫存。為了進一步驗證模型的有效性,對不同模型下的庫存覆蓋天數(shù)和服務(wù)滿足率進行分析。由圖5可以看出,使用分位數(shù)模型的覆蓋天數(shù)小于經(jīng)典模型下的覆蓋天數(shù);由圖6可以看出,使用分位數(shù)模型的服務(wù)滿足率大大高于經(jīng)典模型下的服務(wù)滿足率。仿真結(jié)果表明,使用分位數(shù)模型效果優(yōu)于經(jīng)典模型下補貨模型。

6結(jié)語

本文對CPFR預(yù)測補貨方法進行了改進,將GBRT樹模型引入分位數(shù)回歸預(yù)測算法中,分別比較了GBRT的主要3種實現(xiàn)方式:XGBoost、LightGBM、CatBoost 3種算法,結(jié)果顯示LightGBM算法效果最好。對50%分位數(shù)進行了測試,計算MAPE值,結(jié)果表明效果較好。將分位數(shù)回歸預(yù)測與補貨模型相結(jié)合,將98%分位數(shù)作為補貨模型的輸入,并引入新的安全庫存計算方法,對零售業(yè)的19家門店作仿真測試分析。結(jié)果表明,在滿足98%的服務(wù)水平下,其平均庫存、平均覆蓋天數(shù)和服務(wù)滿足率均優(yōu)于經(jīng)典庫存管理模型。分析仿真結(jié)果可知,仍有幾個門店存在異常值,其結(jié)果不甚理想。對于CPRF方法,如何將預(yù)測與補貨更好地相結(jié)合仍值得研究。未來研究中可以設(shè)計精度更高的預(yù)測算法,并對魯棒性更好的補貨模型加以優(yōu)化,以完善供應(yīng)鏈的CPRF方法。

猜你喜歡
大數(shù)據(jù)
基于在線教育的大數(shù)據(jù)研究
中國市場(2016年36期)2016-10-19 04:41:16
“互聯(lián)網(wǎng)+”農(nóng)產(chǎn)品物流業(yè)的大數(shù)據(jù)策略研究
中國市場(2016年36期)2016-10-19 03:31:48
基于大數(shù)據(jù)的小微電商授信評估研究
中國市場(2016年35期)2016-10-19 01:30:59
大數(shù)據(jù)時代新聞的新變化探究
商(2016年27期)2016-10-17 06:26:00
淺談大數(shù)據(jù)在出版業(yè)的應(yīng)用
今傳媒(2016年9期)2016-10-15 23:35:12
“互聯(lián)網(wǎng)+”對傳統(tǒng)圖書出版的影響和推動作用
今傳媒(2016年9期)2016-10-15 22:09:11
大數(shù)據(jù)環(huán)境下基于移動客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
科技視界(2016年20期)2016-09-29 10:53:22
數(shù)據(jù)+輿情:南方報業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 3344在线观看无码| 国产亚洲欧美日韩在线一区二区三区| 草草影院国产第一页| 九九这里只有精品视频| 精品偷拍一区二区| 国产美女在线观看| 九九香蕉视频| 欧美日本在线观看| 国产精品永久久久久| 19国产精品麻豆免费观看| 亚洲天堂网在线观看视频| 亚洲a级在线观看| 国产日韩精品一区在线不卡| 五月天丁香婷婷综合久久| 99热这里只有精品国产99| 农村乱人伦一区二区| 国产综合另类小说色区色噜噜 | 54pao国产成人免费视频| 91精品小视频| 中国丰满人妻无码束缚啪啪| 久无码久无码av无码| 无码'专区第一页| 日韩精品久久久久久久电影蜜臀| 美女无遮挡拍拍拍免费视频| 国产人成在线视频| 在线无码九区| 99re免费视频| 日韩欧美国产成人| 91精品国产丝袜| 国产成人精品在线| 国产精品大尺度尺度视频| 精品伊人久久久大香线蕉欧美 | 亚洲男女天堂| 成人午夜久久| 日韩在线影院| 国产成a人片在线播放| 国产人成乱码视频免费观看| 亚洲中文无码h在线观看| 国产成人乱无码视频| 久久精品娱乐亚洲领先| 国产乱肥老妇精品视频| 国产成人毛片| 国产精品分类视频分类一区| 久操线在视频在线观看| 国产精品美女在线| 色哟哟国产精品一区二区| 激情乱人伦| 国产成人无码久久久久毛片| 欧美成人一级| 孕妇高潮太爽了在线观看免费| 亚洲另类第一页| 麻豆国产精品一二三在线观看| 成人第一页| 一级毛片在线免费视频| 51国产偷自视频区视频手机观看| 狠狠色香婷婷久久亚洲精品| 综合成人国产| 欧美日韩中文字幕在线| 国产精品久久久久无码网站| 91在线免费公开视频| 狠狠操夜夜爽| 伊在人亚洲香蕉精品播放| 亚洲av综合网| 亚洲an第二区国产精品| 亚洲天堂精品视频| 久久鸭综合久久国产| 亚洲精品视频免费观看| 国产新AV天堂| 真实国产精品vr专区| 亚洲男人的天堂久久精品| 99久久精品免费看国产电影| 欧美日韩免费观看| 麻豆国产精品| 国产剧情一区二区| 国产91小视频在线观看| 99免费视频观看| 99视频在线免费看| 成人午夜亚洲影视在线观看| 日韩国产亚洲一区二区在线观看| 精品国产免费观看| 久久精品免费看一| 91久久性奴调教国产免费|