吳庚奇, 牛東曉*, 耿世平, 張煥粉
(1.華北電力大學(xué)經(jīng)濟(jì)與管理學(xué)院, 北京 102206; 2.新能源電力與低碳發(fā)展北京市重點(diǎn)實(shí)驗(yàn)室, 北京 102206; 3.北京清暢電力技術(shù)股份有限公司, 北京 100089)
隨著市場競爭的不斷加劇,制造企業(yè)面臨的生產(chǎn)、庫存、物流等業(yè)務(wù)成本風(fēng)險增加。企業(yè)想要在競爭脫穎而出,獲得更多的利潤,首先要做好產(chǎn)品需求預(yù)測。準(zhǔn)確的需求預(yù)測是制造企業(yè)擴(kuò)大市場份額、提高利潤的重要支撐。首先,產(chǎn)品需求預(yù)測對制造企業(yè)合理安排生產(chǎn)計劃和物料采購計劃具有導(dǎo)向作用,能夠有效降低產(chǎn)品供應(yīng)不足風(fēng)險和庫存成本。其次,制造企業(yè)合理的生產(chǎn)計劃能夠滿足下游分銷商的產(chǎn)品銷售需求,保證其銷售利潤。同時,良好的物料采購計劃保證供應(yīng)商充足的物料準(zhǔn)備時間,有利于供應(yīng)商有序安排企業(yè)整體的供應(yīng)計劃。從而有利于維護(hù)制造企業(yè)同上下游企業(yè)長期戰(zhàn)略合作的關(guān)系,形成企業(yè)間的協(xié)同性發(fā)展,提高市場競爭力,實(shí)現(xiàn)多贏。因此,準(zhǔn)確的產(chǎn)品需求預(yù)測能夠幫助制造企業(yè)更好的管理決策,這對制造企業(yè)及其上下游關(guān)聯(lián)企業(yè)都具有重要意義。傳統(tǒng)的產(chǎn)品需求預(yù)測往往根據(jù)下游計劃訂單或人工經(jīng)驗(yàn),運(yùn)用統(tǒng)計學(xué)等方法進(jìn)行預(yù)測。隨著計算機(jī)技術(shù)和工業(yè)互聯(lián)網(wǎng)的發(fā)展,計算機(jī)算力和數(shù)據(jù)支持都有了長足的進(jìn)步,基于此構(gòu)建合理的算法模型能夠有效提高產(chǎn)品需求預(yù)測的準(zhǔn)確度。
目前,用于產(chǎn)品需求預(yù)測的方法主要有統(tǒng)計學(xué)方法,如自回歸滑動平均模型(autoregressive moving average model, ARMA)[1],灰色預(yù)測模型(grey mo-del, GM)[2]等;智能算法,如人工神經(jīng)網(wǎng)絡(luò)(artificial neural network, ANN)[3],支持向量機(jī)(support vector machine, SVM)[4]等。李成港等[5]用差分整合移動平均自回歸模型(autoregressive integrated moving average model, ARIMA)對物流公司銷售數(shù)據(jù)進(jìn)行分析預(yù)測,結(jié)果表明該模型在短期預(yù)測上置信度高,能為倉儲優(yōu)化提供輔助決策依據(jù),解決企業(yè)倉儲不合理等問題。趙軍等[6]應(yīng)用數(shù)據(jù)挖掘技術(shù)建立靈活、準(zhǔn)確的預(yù)測數(shù)據(jù)庫,將基于指數(shù)平滑模型的庫存需求預(yù)測模型應(yīng)用于第三方物流中心庫存需求預(yù)測中,預(yù)測效果良好。但當(dāng)時間序列波動或不穩(wěn)定時,ARMA、ARIMA、指數(shù)平滑等方法的預(yù)測效果不夠理想。高豪杰[7]利用反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)模型對閥門制造企業(yè)庫存需求進(jìn)行預(yù)測,結(jié)果表明該方法能夠有效降低誤差。但BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練時可能會陷入局部最優(yōu),需要反復(fù)進(jìn)行參數(shù)調(diào)優(yōu),才能取得較好的預(yù)測效果。汪婭等[8]提出一種新的基于約束需求預(yù)測的消耗性航材備件需求預(yù)測方法,通過遺傳算法對其進(jìn)行求解,獲取最優(yōu)需求預(yù)測結(jié)果。但遺傳算法的局部搜索能力較差,導(dǎo)致單純的遺傳算法比較費(fèi)時,在進(jìn)化后期搜索效率較低。綜上,單一預(yù)測模型或多或少存在一些不足,為了優(yōu)化預(yù)測模型,組合預(yù)測模型應(yīng)運(yùn)而生。靖可等[9]提出改進(jìn)BP-ARIMA組合模型用于預(yù)測智能制造模式下產(chǎn)品的不確定性需求,結(jié)果表明組合模型的預(yù)測精度較ARIMA模型有顯著提高。賈琦等[10]利用灰色模型構(gòu)建方便、計算簡單、善于挖掘影響因素內(nèi)部聯(lián)系的優(yōu)點(diǎn),以及LS-SVM在非線性映射分析和穩(wěn)定性高的優(yōu)點(diǎn),設(shè)計了一種灰色LS-SVM預(yù)測模型,用于解決小樣本數(shù)據(jù)的裝備器材需求預(yù)測問題。采用組合預(yù)測能夠結(jié)合不同模型的優(yōu)點(diǎn),有效應(yīng)對時間序列不平穩(wěn)問題,提高預(yù)測速度、降低預(yù)測誤差和風(fēng)險,保證良好的預(yù)測效果。然而,目前用于制造企業(yè)產(chǎn)品需求預(yù)測的深度學(xué)習(xí)算法較少。
近些年深度學(xué)習(xí)的應(yīng)用掀起熱潮,深度學(xué)習(xí)是一種利用復(fù)雜結(jié)構(gòu)的多個處理層來實(shí)現(xiàn)對數(shù)據(jù)進(jìn)行高層次抽象的算法,以海量的數(shù)據(jù)和計算機(jī)算力作為支撐,普遍能夠取得優(yōu)于神經(jīng)網(wǎng)絡(luò)的訓(xùn)練效果[11]。隨著工業(yè)互聯(lián)網(wǎng)的發(fā)展推動了移動互聯(lián)網(wǎng)、云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)等與現(xiàn)代制造業(yè)結(jié)合,制造企業(yè)也因此有能力提供深度學(xué)習(xí)足夠的數(shù)據(jù)支持,深度學(xué)習(xí)算法初步應(yīng)用于制造企業(yè)的產(chǎn)品需求預(yù)測方面。任春華等[12]首先提出一種優(yōu)勢矩陣結(jié)合輕梯度提升機(jī)(light gradient boosting machine, lightGBM)、門控循環(huán)神經(jīng)網(wǎng)絡(luò)(gated recurrent unit,GRU)的組合預(yù)測模型用于汽車配件需求預(yù)測,該組合模型能夠發(fā)揮2種模型的優(yōu)勢,不僅訓(xùn)練效率高效且模型結(jié)構(gòu)簡單。Weng等[13]提出了一種基于lightGBM和長短期記憶神經(jīng)網(wǎng)絡(luò)(long short-term memory, LSTM)的供應(yīng)鏈銷售預(yù)測模型,實(shí)驗(yàn)結(jié)果表明該模型能夠?qū)?yīng)鏈銷售進(jìn)行準(zhǔn)確、高效、可解釋的預(yù)測。李瓊等[14]在考慮多產(chǎn)品相互制約的條件下,通過GRU-BP組合神經(jīng)網(wǎng)絡(luò)預(yù)測模型對模型分析求解后證明預(yù)測結(jié)果的可行性。基于此,考慮引入當(dāng)前較為火熱的深度學(xué)習(xí)算法構(gòu)建預(yù)測模型,豐富深度學(xué)習(xí)算法在制造企業(yè)產(chǎn)品需求預(yù)測等方面的應(yīng)用,提高預(yù)測精度。
近年來,制造企業(yè)在注重供應(yīng)價值鏈建設(shè),強(qiáng)化自身競爭優(yōu)勢的同時,也開始重視多價值鏈協(xié)同,通過與產(chǎn)品生產(chǎn)銷售中的服務(wù)價值鏈、營銷價值鏈等協(xié)同性管理提高整體的運(yùn)作效率。其中,多價值鏈協(xié)同對于制造企業(yè)產(chǎn)品需求預(yù)測意義重大。相比單一供應(yīng)鏈,多價值鏈協(xié)同能夠獲取更為全面的相關(guān)數(shù)據(jù),幫助制造企業(yè)進(jìn)行供準(zhǔn)確的產(chǎn)品需求預(yù)測。
通過上述分析,提出一種基于一維卷積神經(jīng)網(wǎng)絡(luò)(one-dimensional convolutional neural networks, 1D-CNN)-長短期記憶神經(jīng)網(wǎng)絡(luò)的組合預(yù)測方法,將其應(yīng)用于制造企業(yè)的產(chǎn)品需求預(yù)測,通過供應(yīng)鏈、服務(wù)鏈、營銷鏈等獲取足夠的多鏈數(shù)據(jù)用于模型訓(xùn)練,構(gòu)建出擬合度高的1D-CNN-LSTM模型,從而精準(zhǔn)預(yù)測產(chǎn)品需求。模型首先采用1D-CNN自動提取歷史產(chǎn)品需求數(shù)據(jù)的深層次特征,接著利用LSTM對數(shù)據(jù)的深層次特征進(jìn)行處理學(xué)習(xí),構(gòu)建時間序列模型實(shí)現(xiàn)產(chǎn)品需求的預(yù)測。最后基于某制造企業(yè)產(chǎn)品需求的歷史相關(guān)數(shù)據(jù)進(jìn)行預(yù)測,并將模型預(yù)測結(jié)果同傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型的預(yù)測進(jìn)行比較,分析本文構(gòu)建模型的有效性。
傳統(tǒng)的制造企業(yè)產(chǎn)品需求預(yù)測通常只考慮了單一供應(yīng)鏈的物料需求、銷售數(shù)據(jù)等情況,沒有考慮到下游代理商的產(chǎn)品售后相關(guān)數(shù)據(jù)、產(chǎn)品營銷策略等其他價值鏈中相關(guān)因素的影響,預(yù)測結(jié)果不夠精確。尤其是現(xiàn)在市場環(huán)境復(fù)雜,制造企業(yè)的代理商、供應(yīng)商眾多,供應(yīng)和銷售渠道增多,企業(yè)間關(guān)系愈發(fā)復(fù)雜和緊密,產(chǎn)品需求的影響因素越發(fā)復(fù)雜,僅單一價值鏈內(nèi)的數(shù)據(jù)難以準(zhǔn)確預(yù)測。因此,應(yīng)該從多價值鏈協(xié)同入手,協(xié)同利益相關(guān)企業(yè),在大數(shù)據(jù)時代數(shù)據(jù)多且雜的背景下構(gòu)建數(shù)據(jù)空間,避免大量無用數(shù)據(jù)的干擾,從海量數(shù)據(jù)中收集與產(chǎn)品相關(guān)的多鏈數(shù)據(jù)集,用于產(chǎn)品需求預(yù)測等相關(guān)活動。數(shù)據(jù)空間是以對象為主體,其全生命周期內(nèi)圍繞業(yè)務(wù)產(chǎn)生的關(guān)聯(lián)數(shù)據(jù)的集合,充分地考慮了如何在最大程度上利用和展現(xiàn)數(shù)據(jù)的有效性及可行性,使得其在打破“數(shù)據(jù)孤島”,推動多源異構(gòu)數(shù)據(jù)快速融合方面快速確立了領(lǐng)先優(yōu)勢[15]。構(gòu)建數(shù)據(jù)空間有利于積累信息資源,用于客戶挖掘,物料需求預(yù)測、產(chǎn)品需求預(yù)測、優(yōu)化物流調(diào)度等方面。例如,本文進(jìn)行產(chǎn)品需求預(yù)測,從產(chǎn)品數(shù)據(jù)空間中獲取多鏈數(shù)據(jù)集,通過全面的數(shù)據(jù)助力預(yù)測精度的提高。多價值鏈協(xié)同視角下產(chǎn)品的數(shù)據(jù)空間及數(shù)據(jù)獲取如圖1所示。

圖1 多價值鏈協(xié)同視角下產(chǎn)品的數(shù)據(jù)空間及數(shù)據(jù)獲取
多價值鏈數(shù)據(jù)是由產(chǎn)品需求相關(guān)影響因素的相應(yīng)數(shù)據(jù)構(gòu)成,主要包括產(chǎn)品全生命周期過程中供應(yīng)商、制造商、分銷商等鏈上企業(yè)在日常業(yè)務(wù)中產(chǎn)生的采購、庫存、銷售、售后等相關(guān)信息數(shù)據(jù)[16]。構(gòu)建預(yù)測模型進(jìn)行產(chǎn)品需求預(yù)測,首先需要選取關(guān)鍵影響因素作為預(yù)測模型的輸入。產(chǎn)品需求變化的驅(qū)動因素眾多,全面選擇影響程度大的因素對預(yù)測結(jié)果的準(zhǔn)確性有顯著影響。
在供應(yīng)鏈環(huán)節(jié)上,供應(yīng)商、制造商和客戶是產(chǎn)品需求的主要影響主體,分析其中的主要影響因素包括產(chǎn)品零部件的供應(yīng)量、零部件采購總成本、采購提前期、產(chǎn)品訂單數(shù)量、市場占有率等[17]。在服務(wù)鏈環(huán)節(jié)上,產(chǎn)品售后服務(wù)過程中的產(chǎn)品退換、三包保養(yǎng)、零部件更換等因素對產(chǎn)品需求也會產(chǎn)生一定的影響。在營銷環(huán)節(jié)上,產(chǎn)品價格、營銷折扣、節(jié)假日和新增客戶數(shù)量也等與產(chǎn)品的銷售情況緊密相關(guān)。
CNN是一種包含卷積計算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),其基本結(jié)構(gòu)由輸入層、卷積層、池化層、全連接層及輸出層構(gòu)成[18]。相比傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型,CNN引入感受野機(jī)制,具有局部感受野、權(quán)值共享和池化的特點(diǎn),減少了神經(jīng)元連接數(shù)目和訓(xùn)練參數(shù),從而降低網(wǎng)絡(luò)模型復(fù)雜度,減少過擬合,獲得較好的泛化能力[19]。CNN模型具有強(qiáng)大的特征識別和提取能力,可以應(yīng)用于在時間序列數(shù)據(jù)分類上,有效的預(yù)測時間序列數(shù)據(jù)的走勢[20]。時間序列預(yù)測一般使用1D-CNN模型,其卷積和池化僅在一維尺度上進(jìn)行,卷積核在時間序列數(shù)據(jù)上進(jìn)行窗口平移,提取局部序列段與權(quán)重進(jìn)行點(diǎn)乘得到卷積層,進(jìn)而進(jìn)行池化下采樣得到池化層,多次反復(fù)卷積和池化,提取出時間序列數(shù)據(jù)的關(guān)鍵特征,使得預(yù)測性能得到優(yōu)化。1D-CNN模型的基本結(jié)構(gòu)如圖2所示。

圖2 1D-CNN的基本結(jié)構(gòu)圖
2.1.1 卷積層
卷積層通過卷積核與輸入數(shù)據(jù)的卷積運(yùn)算獲取數(shù)據(jù)潛在的特征。其中,卷積核即為濾波器,過濾不重要的信息,抓取數(shù)據(jù)中潛在的重要特征。卷積運(yùn)算實(shí)現(xiàn)了人體的感受野機(jī)制,通過局部連接的方式克服了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)中全連接方式導(dǎo)致的維度災(zāi)難,減少了計算量,大幅降低了神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練難度[21]。卷積運(yùn)算公式為
(1)
2.1.2 池化層
除了卷積層,CNN也經(jīng)常使用池化層來縮減輸入特征的大小。池化主要通過減少網(wǎng)絡(luò)的參數(shù)來減小計算量,提高計算速度,同時提高所提取特征的魯棒性,防止過擬合。池化操作方法一般包括最大池化、平均池化[23],計算公式分別為
(2)
(3)

循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural networks,RNN)主要用來處理序列數(shù)據(jù),在預(yù)測領(lǐng)域得到了大量的應(yīng)用。但隨著時間序列長度的增加,由于梯度消失或梯度爆炸問題的存在,傳統(tǒng)的RNN會產(chǎn)生長跨度依賴問題,難以保持長期記憶[24]。LSTM是RNN的一種改進(jìn)模型,其神經(jīng)單元由輸入門、遺忘門和輸出門構(gòu)成,通過門決定以往信息和即時信息的記憶程度,解決了長期依賴問題[25]。遺忘門用于決定遺棄多少細(xì)胞狀態(tài)中的過去信息和當(dāng)前信息;輸入門的作用是將有用的新信息加入到細(xì)胞狀態(tài);輸出門的作用是從當(dāng)前狀態(tài)中選擇重要的信息作為細(xì)胞狀態(tài)的輸出[26]。LSTM模型的基本結(jié)構(gòu)如圖3所示。

σ為Sigmoid激活函數(shù);xt-1、xt、xt+1為輸入,ht-1、ht、ht+1為輸出;ft為遺忘門,it為輸入門,ot為輸出門;Ct表示當(dāng)前細(xì)胞狀態(tài),表示當(dāng)前候選細(xì)胞狀態(tài);?和⊕表示運(yùn)算方式
遺忘門、輸入門和輸出門的計算公式為
ft=σ(Wf[ht-1,xt]+bf)
(4)
it=σ(Wi[ht-1,xt]+bi)
(5)
(6)
(7)
ot=σ(Wo[ht-1,xt]+bo)
(8)
ht=ot×tanhCt
(9)
式中:Wf、Wi和Wo分別為遺忘門、輸入門和輸出門的權(quán)重矩陣;WC為細(xì)胞狀態(tài)的權(quán)重矩陣;bf、bi和bo分別為遺忘門、輸入門和輸出門的偏置項;bC為細(xì)胞狀態(tài)的偏置項。
1D-CNN可以快速挖掘時間序列數(shù)據(jù)中隱藏的特征,但無法學(xué)習(xí)到時間序列數(shù)據(jù)中的長依賴特性;LSTM具有較好的長期記憶能力,但對時間序列數(shù)據(jù)隱藏信息的挖掘不如1D-CNN。因此,本文中結(jié)合1D-CNN和LSTM兩種模型,首先更好地挖掘出時間序列數(shù)據(jù)深層次的隱藏特征,再進(jìn)行時間序列預(yù)測,聚合兩種模型的優(yōu)勢以提高預(yù)測精度。本文構(gòu)建的1D-CNN-LSTM組合模型的預(yù)測流程如圖4所示。

圖4 1D-CNN-LSTM組合模型的預(yù)測流程圖
如圖4所示,1D-CNN-LSTM組合模型的及具體實(shí)現(xiàn)步驟如下。
步驟1獲取原始數(shù)據(jù),將數(shù)據(jù)預(yù)處理后輸入1D-CNN模型;
步驟2輸入數(shù)據(jù)在1D-CNN模型中進(jìn)行兩次卷積和池化操作,提取數(shù)據(jù)特征;
步驟3將1D-CNN模型處理后得到的特征數(shù)據(jù)集輸入LSTM模型中,進(jìn)行時間序列預(yù)測;
步驟4利用全連接層對將LSTM模型的輸出數(shù)據(jù)進(jìn)一步處理,最后輸出預(yù)測結(jié)果。
3.1.1 數(shù)據(jù)獲取
以某電氣設(shè)備制造企業(yè)為研究對象,對生產(chǎn)銷售的環(huán)網(wǎng)柜需求進(jìn)行算例分析。綜合考慮制造企業(yè)供應(yīng)鏈、服務(wù)鏈、營銷鏈對產(chǎn)品需求的影響以及相關(guān)數(shù)據(jù)的可獲取性,選取產(chǎn)品價格折扣、產(chǎn)品不合格數(shù)量、節(jié)假日(節(jié)假日及周末為1,正常上班日期為0)、新增客戶數(shù)量作為產(chǎn)品需求預(yù)測模型的輸入變量,以銷售數(shù)量作為產(chǎn)品需求量,構(gòu)建多價值鏈數(shù)據(jù)集,用于產(chǎn)品需求預(yù)測。獲取的數(shù)據(jù)為2020年7月6日—2021年7月30日之間的每日數(shù)據(jù)。其中,隨機(jī)抽取80%的數(shù)據(jù)集作為訓(xùn)練集,進(jìn)行預(yù)測模型訓(xùn)練;以剩下的20%數(shù)據(jù)集作為測試集,對訓(xùn)練好的模型的預(yù)測精度進(jìn)行檢驗(yàn)。環(huán)網(wǎng)柜需求相關(guān)的部分多鏈數(shù)據(jù)集如表1所示。

表1 環(huán)網(wǎng)柜需求相關(guān)的部分多鏈數(shù)據(jù)集
3.1.2 數(shù)據(jù)預(yù)處理
從數(shù)據(jù)空間中獲取的多鏈數(shù)據(jù)集需要進(jìn)行預(yù)處理,防止數(shù)據(jù)不規(guī)范、異常等因素對預(yù)測結(jié)果產(chǎn)生影響,主要處理方式包括缺失值處理、歸一化處理。
(1)缺失值處理。部分?jǐn)?shù)據(jù)有可能在數(shù)據(jù)空間記錄過程中出現(xiàn)某條數(shù)據(jù)樣本丟失或不全的情況。這些缺失值取前后時刻該特征值的平均數(shù)。
(2)歸一化處理。為了消除數(shù)據(jù)之間的相互影響,讓1D-CNN-LSTM組合預(yù)測模型收斂更快更穩(wěn)定,采用min-max法進(jìn)行歸一化處理,將數(shù)據(jù)映射到[0,1]區(qū)間內(nèi)。歸一化公式為
(10)
式(10)中:xnorm為歸一化處理后的數(shù)值;x為當(dāng)前的觀測值;xmin和xmax分別為樣本數(shù)據(jù)的最小值和最大值。
3.1.3 實(shí)驗(yàn)環(huán)境
實(shí)驗(yàn)平臺為AMD Ryzen 5 4600U with Radeon Graphics,主頻2.1 GHz,16 G RAM以及Windows 10 64位操作系統(tǒng)。本文中采用Python 3.7構(gòu)建實(shí)驗(yàn)?zāi)P停赑ython的深度學(xué)習(xí)庫Keras2.0實(shí)現(xiàn),Keras以TensorFlow或Theano作為后端,是一個非常方便的深度學(xué)習(xí)框架。1D-CNN-LSTM模型的超參數(shù)設(shè)置在一定程度上會影響預(yù)測性能,經(jīng)過反復(fù)試驗(yàn),確定了相對較優(yōu)的超參數(shù)如表2所示,模型組件的參數(shù)設(shè)置如表3所示。

表2 1D-CNN-LSTM模型超參數(shù)設(shè)置

表3 1D-CNN-LSTM模型的模型組件參數(shù)設(shè)置
對比訓(xùn)練集和驗(yàn)證集的損失值和誤差值可以反映模型的擬合能力,因此從訓(xùn)練集中隨機(jī)選取20%的數(shù)據(jù)集作為驗(yàn)證集對模型進(jìn)行驗(yàn)證。本文訓(xùn)練模型的訓(xùn)練集和驗(yàn)證集的損失曲線如圖5所示,訓(xùn)練集和驗(yàn)證集的誤差曲線如圖6所示。從圖5和圖6可以看出,隨著訓(xùn)練次數(shù)的增加,訓(xùn)練集和驗(yàn)證集的損失值和誤差值先是快速下降,而后收斂,趨于平穩(wěn),并且損失值和誤差值都收斂于較小的值,反映了本文訓(xùn)練的CNN-LSTM模型泛化能力較好,擬合程度較高。

圖5 訓(xùn)練集和驗(yàn)證集的損失對比

圖6 訓(xùn)練集和驗(yàn)證集的誤差對比
利用測試集對訓(xùn)練好的模型進(jìn)一步進(jìn)行性能驗(yàn)證,圖7為測試集的預(yù)測結(jié)果。對比預(yù)測值和實(shí)際值的曲線可以看出,預(yù)測值和實(shí)際值十分接近,預(yù)測精度較高,說明CNN-LSTM模型具有較好的預(yù)測能力。

圖7 預(yù)測結(jié)果對比
選取均方根誤差(root mean square error, RMSE)、平均絕對誤差(mean absolute error, MAE)兩種評價指標(biāo)來檢驗(yàn)?zāi)P偷念A(yù)測效果,其計算公式為
(11)
(12)
進(jìn)一步驗(yàn)證本文構(gòu)建模型的有效性,分別與LSTM模型、BP模型以及PSO-BP模型進(jìn)行實(shí)驗(yàn)對比。選取這些模型基于以下幾點(diǎn)考慮:①與LSTM模型進(jìn)行對比,驗(yàn)證利用CNN改進(jìn)的LSTM模型是否能夠通過抓取深層次數(shù)據(jù)特征而提高模型的預(yù)測精度;②與BP模型、PSO-BP模型進(jìn)行對比,驗(yàn)證深度學(xué)習(xí)模型的學(xué)習(xí)能力是否優(yōu)于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型,能夠訓(xùn)練出擬合能力更強(qiáng)的預(yù)測模型。其中,LSTM模型的參數(shù)設(shè)置為:LSTM1神經(jīng)元數(shù)量為128,LSTM1神經(jīng)元數(shù)量為64,Dropout比率取0.2,Dense層1參數(shù)為32,Dense層2參數(shù)為1。BP模型的參數(shù)設(shè)置為:隱藏層節(jié)點(diǎn)數(shù)為4,訓(xùn)練次數(shù)為1 000次,學(xué)習(xí)率為0.01,最小誤差為0.000 01。PSO-BP模型的參數(shù)設(shè)置為:初始種群數(shù)為50,粒子更新位置最大速度為0.9,粒子更新位置最大速度為0.1,隱藏層節(jié)點(diǎn)數(shù)為4。如表4所示為不同模型預(yù)測結(jié)果的誤差值。

表4 不同模型預(yù)測結(jié)果的誤差對比
從表4可以看出,LSTM模型的誤差小于BP模型和PSO-BP模型。這說明了相比傳統(tǒng)的神經(jīng)網(wǎng)絡(luò),深度學(xué)習(xí)網(wǎng)絡(luò)在足夠數(shù)據(jù)量的支持下進(jìn)行深層次的學(xué)習(xí)擬合,能夠搭建出預(yù)測精度更高的預(yù)測模型。另外考慮到了數(shù)據(jù)潛在特征的1D-CNN-LSTM模型,則在LSTM模型的基礎(chǔ)上進(jìn)一步提升了預(yù)測精度。
基于多價值鏈協(xié)同視角下制造企業(yè)的產(chǎn)品預(yù)測需求,首先提出數(shù)據(jù)空間的概念,構(gòu)建產(chǎn)品數(shù)據(jù)空間能夠有效整合產(chǎn)品需求變化的所有相關(guān)數(shù)據(jù)。當(dāng)企業(yè)需要進(jìn)行產(chǎn)品需求預(yù)測、物料需求預(yù)測等相關(guān)活動時,可以簡單高效地從數(shù)據(jù)空間中獲取預(yù)測所需的歷史數(shù)據(jù)。其次,引入深度學(xué)習(xí)算法,提出了1D-CNN-LSTM的預(yù)測模型,該模型既能快速挖掘數(shù)據(jù)隱藏的深層次特征,又能長時間記憶歷史數(shù)據(jù)中的信息,能夠有效保證預(yù)測精度。最后,利用某電力設(shè)備制造企業(yè)的環(huán)網(wǎng)柜銷售相關(guān)數(shù)據(jù)對提出的模型進(jìn)行算例分析,并與其他預(yù)測模型進(jìn)行誤差對比,驗(yàn)證本文提出模型的預(yù)測效果。主要結(jié)論如下。
(1)整合企業(yè)生產(chǎn)經(jīng)營活動中產(chǎn)生的所有相關(guān)數(shù)據(jù)構(gòu)建數(shù)據(jù)空間,可以用于產(chǎn)品需求預(yù)測、優(yōu)化物流調(diào)度等方面,為企業(yè)的經(jīng)營決策提供依據(jù)。
(2)多價值鏈協(xié)作背景下,綜合考慮多鏈對產(chǎn)品需求的影響進(jìn)行預(yù)測,其預(yù)測效果優(yōu)于僅考慮單一供應(yīng)鏈上的影響因素。
(3)本文構(gòu)建的1D-CNN-LSTM模型有效,預(yù)測精度高、誤差小。其預(yù)測效果不僅好于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型,也優(yōu)于單一的LSTM預(yù)測模型。