黃宏和,吳 臻,琚 軍,章 斌,王雪峰,潘永賀,鄭 輝,趙仲夏
(國網(wǎng)浙江省電力有限公司衢州供電公司,浙江 衢州 324000)
隨著電力企業(yè)生產(chǎn)水平和信息化水平的不斷提升、業(yè)務(wù)數(shù)據(jù)的快速積累,電力企業(yè)已經(jīng)形成了海量的業(yè)務(wù)數(shù)據(jù),步入大數(shù)據(jù)時(shí)代。 然而,現(xiàn)階段的問題在于單純的數(shù)據(jù)積累無法有效地實(shí)現(xiàn)數(shù)據(jù)價(jià)值轉(zhuǎn)換,傳統(tǒng)的經(jīng)驗(yàn)決策模式難以適應(yīng)實(shí)際工作需求,難以指導(dǎo)電力企業(yè)做出正確決策。因此,需要進(jìn)行大數(shù)據(jù)挖掘分析,為企業(yè)運(yùn)營(yíng)決策提供依據(jù)。
目前,電力企業(yè)對(duì)于物資需求預(yù)測(cè)管理停留于統(tǒng)計(jì)分析層面,沒有分析物資的需求特性,難以實(shí)現(xiàn)物資需求精準(zhǔn)預(yù)測(cè)。 本文采用數(shù)據(jù)挖掘技術(shù),提出實(shí)現(xiàn)物資高特征分類、剖析物資需求規(guī)律的方法,通過建立時(shí)間序列、灰色預(yù)測(cè)、指數(shù)平滑等預(yù)測(cè)模型,提高物資需求預(yù)測(cè)能力,輔助支撐物資部門物資采購相關(guān)工作。
預(yù)測(cè)是對(duì)未來尚未發(fā)生或者不明確的事物進(jìn)行估算和推測(cè),預(yù)測(cè)的依據(jù)主要是基于過去和現(xiàn)場(chǎng)的情況,采用一定的技術(shù)和方法去挖掘、解析、探索、模擬出復(fù)雜的中間過程,提取出較為明顯的規(guī)律特征,形成涵蓋知識(shí)性的結(jié)構(gòu)化方程或函數(shù),通過輸入相應(yīng)的變量值實(shí)現(xiàn)對(duì)未來結(jié)果的推斷預(yù)測(cè)。
企業(yè)物資需求預(yù)測(cè)可從數(shù)量、資金等多個(gè)角度開展。 本文從物資管理實(shí)際情況出發(fā),對(duì)物資歷史采購數(shù)據(jù)和消耗數(shù)據(jù)進(jìn)行分析,結(jié)果表明:物資需求特性分為連續(xù)性需求特征和間斷性需求特征兩類時(shí),需求特征較為顯著。 因此,預(yù)測(cè)方法分為連續(xù)性需求預(yù)測(cè)方法和間斷性需求預(yù)測(cè)方法。
連續(xù)性的物資需求一般具有規(guī)律性,是基于時(shí)間發(fā)生變化的,可通過對(duì)歷史數(shù)據(jù)進(jìn)行挖掘分析,采用一些成熟的連續(xù)性預(yù)測(cè)方法進(jìn)行物資需求預(yù)測(cè),總結(jié)提取出其中的內(nèi)在規(guī)律和關(guān)聯(lián)關(guān)系,并結(jié)合實(shí)際情況對(duì)模型參數(shù)進(jìn)行最優(yōu)調(diào)整,從而做出準(zhǔn)確的預(yù)測(cè)。 一般來講,連續(xù)性預(yù)測(cè)的準(zhǔn)確度與數(shù)據(jù)的數(shù)量和質(zhì)量密切相關(guān)。
1.2.1 時(shí)間序列預(yù)測(cè)法
時(shí)間序列是指將同一統(tǒng)計(jì)指標(biāo)的數(shù)值按其發(fā)生的時(shí)間順序排列而成的序列,可以是月度、季度、年度等多種時(shí)間形式。 時(shí)間序列預(yù)測(cè)是基于某一個(gè)或一組分布于時(shí)間軸上的觀測(cè)數(shù)據(jù),通過挖掘分析觀測(cè)數(shù)據(jù)自身的變化規(guī)律,形成符合變化的規(guī)律函數(shù),繼而按照等間隔時(shí)間預(yù)測(cè)未來的變化趨勢(shì),時(shí)間序列模型公式為:

等式左邊表示對(duì)第t+1 期的預(yù)測(cè)值,等式右邊表示由第1 期至第t 期時(shí)間段內(nèi)的序列構(gòu)成的規(guī)律函數(shù)。
由時(shí)間序列公式可以看到,只需輸入歷史數(shù)據(jù)即可輸出未來預(yù)測(cè)數(shù)據(jù),因此該方法預(yù)測(cè)較為簡(jiǎn)單、方便,適用于連續(xù)性的序列預(yù)測(cè)。 但該方法對(duì)于序列有平穩(wěn)性的要求,對(duì)于非平穩(wěn)的、間斷性的時(shí)間序列,該方法的預(yù)測(cè)可信度較低。
1.2.2 LSTM 神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)是一種新興且有效的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法。 人類并不是每時(shí)每刻都從頭開始思考,其思想具有持續(xù)性特點(diǎn),傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)不具備這一特性,而遞歸神經(jīng)網(wǎng)絡(luò)能夠有效解決這一問題。 遞歸神經(jīng)網(wǎng)絡(luò)中具備循環(huán)結(jié)構(gòu),能夠使信息持續(xù)保存。 LSTM 神經(jīng)網(wǎng)絡(luò)即長(zhǎng)短記憶型遞歸神經(jīng)網(wǎng)絡(luò),其計(jì)算結(jié)果具備記憶之前幾次結(jié)果的特點(diǎn),因此在時(shí)間序列數(shù)據(jù)預(yù)測(cè)方面具有很大優(yōu)勢(shì),是深度學(xué)習(xí)算法在時(shí)間序列數(shù)據(jù)預(yù)測(cè)方面的突破。
LSTM 中第一步?jīng)Q定哪些信息需要從單元狀態(tài)中被拋棄;第二步?jīng)Q定在單元狀態(tài)中需要存儲(chǔ)哪些新信息;第三步?jīng)Q定需要輸出的結(jié)果是什么,這個(gè)輸出結(jié)果將會(huì)建立在單元狀態(tài)的基礎(chǔ)上,但該輸出結(jié)果是個(gè)過濾版本,只輸出了想要輸出的那部分。
1.3.1 指數(shù)平滑法
指數(shù)平滑法本質(zhì)上是一種特殊加權(quán)的移動(dòng)平均法,常見的指數(shù)平滑法有一次指數(shù)平滑法、二次指數(shù)平滑法等,核心思想都是以歷史全量數(shù)據(jù)信息為分析基礎(chǔ),通過對(duì)不同時(shí)期的觀測(cè)值賦予不同的權(quán)重,實(shí)現(xiàn)對(duì)未來的預(yù)測(cè)。 該方法具備魯棒性強(qiáng)的特點(diǎn),由于操作簡(jiǎn)單、適應(yīng)性強(qiáng),常用于間斷性的預(yù)測(cè)。
一次指數(shù)平滑法公式為:

二次指數(shù)平滑法公式為:


at和bt的計(jì)算公式為:

1.3.2 灰色預(yù)測(cè)法
對(duì)灰色系統(tǒng)建立的預(yù)測(cè)模型稱為灰色模型(簡(jiǎn)稱“GM 模型”),是微分方程模型,可用于對(duì)描述對(duì)象作長(zhǎng)期、連續(xù)、動(dòng)態(tài)的反映,它揭示了系統(tǒng)內(nèi)部事物連續(xù)發(fā)展變化的過程。 灰色模型就是通過少量的、不完全的信息,建立灰色微分預(yù)測(cè)模型,對(duì)事物發(fā)展規(guī)律作出模糊性的長(zhǎng)期描述。 灰色預(yù)測(cè)需要樣本量較小,運(yùn)算方便,建模精度高。
基于ERP(企業(yè)資源計(jì)劃)電力信息系統(tǒng)獲取某供電公司歷史項(xiàng)目的領(lǐng)料數(shù)據(jù),按照領(lǐng)取時(shí)間的先后順序?qū)Ω黝愇镔Y進(jìn)行統(tǒng)計(jì)排序,形成建模數(shù)據(jù)寬表,詳細(xì)表字段見表1。

表1 項(xiàng)目領(lǐng)料明細(xì)數(shù)據(jù)
由于物資類型較多,且物資的需求特性不一,過多的細(xì)化分類會(huì)增大研究難度,并且極大降低可行性。 因此,通過隨機(jī)抽樣抽取架空絕緣導(dǎo)線、低壓電力電纜、10 kV 變壓器、聯(lián)結(jié)金具、錐形水泥桿等20 類物資數(shù)據(jù)開展分類特征提取,并選取兩種不同特性的物資作為代表,按時(shí)間順序形成物資時(shí)序圖,結(jié)果如圖1、圖2 所示。

圖1 連續(xù)性需求特征物資時(shí)序
由時(shí)序圖可以看出,物資較為顯著的分類特征為連續(xù)性和間斷性,因此可將物資分為連續(xù)性需求物資和間斷性需求物資,針對(duì)不同的需求特性選取合適的預(yù)測(cè)方法進(jìn)行挖掘分析。
根據(jù)物資展現(xiàn)出的需求特性選擇合適的挖掘算法預(yù)測(cè)分析物資的未來需求,經(jīng)過多種算法的篩選,最終選擇時(shí)間序列分析作為連續(xù)性物資需求預(yù)測(cè)方法,選擇指數(shù)平滑法與灰色預(yù)測(cè)法作為間斷性物資需求預(yù)測(cè)的方法。
選取物資“架空絕緣導(dǎo)線”與物資“高壓熔斷器”代表連續(xù)性物資與間斷性物資進(jìn)行后續(xù)的建模預(yù)測(cè),通過ERP 系統(tǒng)獲取2 種物資2016—2017年每個(gè)月的物資數(shù)據(jù)。
2.3.1 連續(xù)性物資需求預(yù)測(cè)分析
(1)時(shí)間序列法實(shí)現(xiàn)物資需求預(yù)測(cè)分析
基于時(shí)間序列分析,對(duì)物資“架空絕緣導(dǎo)線”未來需求進(jìn)行預(yù)測(cè)。 首先對(duì)架空絕緣導(dǎo)線序列進(jìn)行平穩(wěn)性檢驗(yàn)。 檢驗(yàn)結(jié)果見表2。

表2 架空絕緣導(dǎo)線序列平穩(wěn)性檢驗(yàn)
從表2 可知,架空絕緣導(dǎo)線序列的p 值為0.002 6,小于顯著性水平的p 值,因此序列通過了平穩(wěn)性檢驗(yàn),可以直接進(jìn)行后續(xù)建模。 接著通過查看序列的ACF(自相關(guān))圖、PACF(偏自相關(guān))圖選擇合適的模型,圖3、圖4 分別為架空絕緣導(dǎo)線序列ACF 圖、PACF 圖。
ACF 圖顯示滯后1 階后ACF 值基本沒有超過邊界值,PACF 圖顯示序列在1 階時(shí)就已收斂于邊界內(nèi)。 因此,選擇AR(1)作為建立的ARMA模型。
根據(jù)建立的AR(1)模型對(duì)架空絕緣導(dǎo)線未來一個(gè)月的物資需求數(shù)量進(jìn)行預(yù)測(cè)。 預(yù)測(cè)結(jié)果如圖5 所示。

圖3 架空絕緣導(dǎo)線序列ACF

圖4 架空絕緣導(dǎo)線序列PACF

圖5 時(shí)間序列實(shí)現(xiàn)未來物資需求預(yù)測(cè)
從圖5 可以看出,建立的AR(1)模型擬合程度較高,誤差波動(dòng)小,預(yù)測(cè)的物資需求可信度高。通過時(shí)間序列分析對(duì)物資“架空絕緣導(dǎo)線”未來一個(gè)月需求進(jìn)行預(yù)測(cè),得到該物資在2018 年1 月的需求量可能為440.180 8 km。
(2)LSTM 神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)物資需求預(yù)測(cè)分析
基于LSTM 神經(jīng)網(wǎng)絡(luò)算法,對(duì)物資“架空絕緣導(dǎo)線”未來需求進(jìn)行預(yù)測(cè)。 首先,對(duì)LSTM 神經(jīng)網(wǎng)絡(luò)模型進(jìn)行參數(shù)設(shè)置,需設(shè)置的參數(shù)見表3。

表3 LSTM 神經(jīng)網(wǎng)絡(luò)的參數(shù)
經(jīng)過多次預(yù)測(cè)試驗(yàn),LSTM 神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練次數(shù)推薦為50 次,少于50 次則模型的損失值不穩(wěn)定,易造成物資需求預(yù)測(cè)結(jié)果不穩(wěn)定,多于50 次會(huì)使得模型運(yùn)行速度變慢;訓(xùn)練一次的樣本數(shù)量為選擇樣本期的歷史數(shù)據(jù)數(shù)量;用于評(píng)估LSTM 神經(jīng)網(wǎng)絡(luò)的測(cè)試序列長(zhǎng)度推薦7 或是14,相當(dāng)于建模的測(cè)試樣本集;模型要預(yù)測(cè)的序列長(zhǎng)度為選擇預(yù)測(cè)期間的樣本數(shù)量。
接下來開展模型搭建工作。 用Sigmoid 函數(shù)作為激活函數(shù),并采用keras 來搭建LSTM 模型。將物資“架空絕緣導(dǎo)線”的時(shí)序數(shù)據(jù)輸入到LSTM模型中進(jìn)行訓(xùn)練,得到訓(xùn)練之后模型的參數(shù),然后輸入一個(gè)樣本,用LSTM 模型中的predict_sequence_full 函數(shù)(完全序列預(yù)測(cè)函數(shù))進(jìn)行預(yù)測(cè)窗口的預(yù)測(cè)。 輸入樣本集和測(cè)試集對(duì)物資需求量進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果如圖6 所示。

圖6 神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)未來物資需求預(yù)測(cè)
由圖6 可知,建立的LSTM 神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)的誤差波動(dòng)較小,模型擬合效果好,預(yù)測(cè)出的需求結(jié)果可信度高。 通過LSTM 神經(jīng)網(wǎng)絡(luò)模型對(duì)物資“架空絕緣導(dǎo)線”未來一個(gè)月需求進(jìn)行預(yù)測(cè),得到該物資在2018 年1 月的需求量可能為427.951 7 km。
2.3.2 間斷性物資需求預(yù)測(cè)分析
間斷性需求物資的特點(diǎn)為需求率低,通用性低,使用需求的時(shí)間間隔很長(zhǎng),物資消耗速度較慢,由于未發(fā)生物資領(lǐng)用,在需求數(shù)據(jù)中會(huì)產(chǎn)生大量0 值,數(shù)據(jù)存在明顯的波動(dòng)性和隨機(jī)性,且間斷性物資的歷史需求數(shù)據(jù)相當(dāng)有限。 因此,對(duì)于序列有平穩(wěn)性要求的時(shí)間序列分析法不適合開展間斷性物資需求預(yù)測(cè)分析。 鑒于間斷性物資的特點(diǎn),選擇指數(shù)平滑法與灰色預(yù)測(cè)法對(duì)其未來需求進(jìn)行預(yù)測(cè)分析。
(1)指數(shù)平滑法實(shí)現(xiàn)物資需求預(yù)測(cè)分析
對(duì)現(xiàn)有物資“高壓熔斷器”的數(shù)據(jù)先后應(yīng)用一次、二次指數(shù)平滑法,得到物資需求預(yù)測(cè)模型,從而預(yù)測(cè)出物資“高壓熔斷器”未來的需求。 首先對(duì)選取物資進(jìn)行一次指數(shù)平滑法計(jì)算得到物資“高壓熔斷器”一次指數(shù)平滑值,預(yù)測(cè)結(jié)果如圖7所示。

圖7 高壓熔斷器一次指數(shù)平滑預(yù)測(cè)
從圖7 可知,運(yùn)用一次指數(shù)平滑法進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果具有滯后作用,因此進(jìn)一步運(yùn)用二次指數(shù)平滑法對(duì)物資未來需求進(jìn)行預(yù)測(cè),提高模型預(yù)測(cè)的精度。
二次指數(shù)平滑法在一次指數(shù)平滑值的基礎(chǔ)上再次進(jìn)行指數(shù)平滑,通過與一次指數(shù)平滑值配合,共同建立預(yù)測(cè)數(shù)學(xué)模型,并通過模型對(duì)物資需求進(jìn)行預(yù)測(cè)。 根據(jù)第1.3.1 節(jié)的二次指數(shù)平滑公式計(jì)算出物資預(yù)測(cè)結(jié)果,如圖8 所示。

圖8 高壓熔斷器二次指數(shù)平滑預(yù)測(cè)
從圖8 可看出,運(yùn)用二次指數(shù)平滑法擬合出的趨勢(shì)線能夠很好地體現(xiàn)原時(shí)間序列在不同時(shí)間段的變化趨勢(shì),模型預(yù)測(cè)的精準(zhǔn)度高,根據(jù)預(yù)測(cè)模型得到物資“高壓熔斷器”在2018 年1 月的需求量可能為789 只。
(2)灰色預(yù)測(cè)法實(shí)現(xiàn)物資需求預(yù)測(cè)分析
灰色預(yù)測(cè)是一套針對(duì)間斷性物資預(yù)測(cè)的方法,能夠很好地解決間斷性物資歷史需求數(shù)據(jù)較少的不足,并通過輸入數(shù)據(jù)變化的特征值對(duì)趨勢(shì)進(jìn)行推演,實(shí)現(xiàn)間斷性物資未來需求的精準(zhǔn)預(yù)測(cè)。
運(yùn)用灰色預(yù)測(cè)法對(duì)物資“高壓熔斷器”未來需求進(jìn)行預(yù)測(cè),將其2016—2017 年間斷物資數(shù)據(jù)作為原始數(shù)據(jù)進(jìn)行建模。 預(yù)測(cè)效果如圖9 所示。

圖9 高壓熔斷器灰色預(yù)測(cè)法預(yù)測(cè)
從圖9 可以看出,運(yùn)用灰色預(yù)測(cè)法對(duì)物資“高壓熔斷器”進(jìn)行預(yù)測(cè),其擬合出的趨勢(shì)能夠很好地體現(xiàn)出原時(shí)間序列在不同時(shí)間段的變化趨勢(shì),模型預(yù)測(cè)的精準(zhǔn)度較高,根據(jù)灰色預(yù)測(cè)模型得到物資“高壓熔斷器”在2018 年1 月的需求量為465 只。
2.3.3 模型擇優(yōu)
(1)連續(xù)性物資預(yù)測(cè)模型擇優(yōu)
前文分別通過時(shí)間序列分析與LSTM 神經(jīng)網(wǎng)絡(luò)分析對(duì)特征為連續(xù)性的物資進(jìn)行需求預(yù)測(cè),通過兩者建立的模型均能有效實(shí)現(xiàn)對(duì)物資需求的預(yù)測(cè),通過對(duì)比兩者的模型平均預(yù)測(cè)誤差率,選取預(yù)測(cè)誤差更小的作為連續(xù)性物資的需求預(yù)測(cè)模型。
通過計(jì)算,時(shí)間序列分析的模型預(yù)測(cè)誤差率為9.61%,LSTM 神經(jīng)網(wǎng)絡(luò)算法的模型預(yù)測(cè)誤差率為6.88%。 因此,選取LSTM 神經(jīng)網(wǎng)絡(luò)算法作為預(yù)測(cè)連續(xù)性物資未來需求的算法。
(2)間斷性物資預(yù)測(cè)模型擇優(yōu)
運(yùn)用指數(shù)平滑法與灰色預(yù)測(cè)法均能有效、精準(zhǔn)地對(duì)間斷性物資未來需求進(jìn)行預(yù)測(cè),通過對(duì)比兩種方法的預(yù)測(cè)誤差率,選取預(yù)測(cè)精準(zhǔn)度更高的作為間斷性物資的預(yù)測(cè)模型。
通過計(jì)算,指數(shù)平滑法的模型平均誤差率為16.62%,灰色預(yù)測(cè)法的模型平均誤差率為25.88%。因此,選取指數(shù)平滑法作為預(yù)測(cè)間斷性物資未來需求的算法。
通過運(yùn)用LSTM 神經(jīng)網(wǎng)絡(luò)、指數(shù)平滑法分別對(duì)連續(xù)性物資、間斷性物資的未來需求進(jìn)行精準(zhǔn)預(yù)測(cè),能夠有效輔助客戶決策各類電力需求物資的正確庫存,改善管理人員在物資管理方面的盲目性與片面性,提升電力公司對(duì)物資需求的快速精準(zhǔn)響應(yīng),提高電力企業(yè)的物資管理水平。
本文通過對(duì)當(dāng)前物資管理的現(xiàn)狀進(jìn)行調(diào)研分析,結(jié)合企業(yè)實(shí)際工作需要,針對(duì)電力物資管理過程中的問題制定了相應(yīng)的解決策略。 采用時(shí)間序列分析與LSTM 神經(jīng)網(wǎng)絡(luò)算法對(duì)連續(xù)性物資未來需求進(jìn)行預(yù)測(cè),采用指數(shù)平滑法與灰色預(yù)測(cè)法實(shí)現(xiàn)對(duì)間斷性物資未來需求的預(yù)測(cè),有效地提高了物資管理人員的物資需求預(yù)測(cè)能力,極大地節(jié)約了企業(yè)采購成本,提升了企業(yè)綜合競(jìng)爭(zhēng)力。