黃宏和,吳 臻,琚 軍,章 斌,王雪峰,潘永賀,鄭 輝,趙仲夏
(國網浙江省電力有限公司衢州供電公司,浙江 衢州 324000)
隨著電力企業生產水平和信息化水平的不斷提升、業務數據的快速積累,電力企業已經形成了海量的業務數據,步入大數據時代。 然而,現階段的問題在于單純的數據積累無法有效地實現數據價值轉換,傳統的經驗決策模式難以適應實際工作需求,難以指導電力企業做出正確決策。因此,需要進行大數據挖掘分析,為企業運營決策提供依據。
目前,電力企業對于物資需求預測管理停留于統計分析層面,沒有分析物資的需求特性,難以實現物資需求精準預測。 本文采用數據挖掘技術,提出實現物資高特征分類、剖析物資需求規律的方法,通過建立時間序列、灰色預測、指數平滑等預測模型,提高物資需求預測能力,輔助支撐物資部門物資采購相關工作。
預測是對未來尚未發生或者不明確的事物進行估算和推測,預測的依據主要是基于過去和現場的情況,采用一定的技術和方法去挖掘、解析、探索、模擬出復雜的中間過程,提取出較為明顯的規律特征,形成涵蓋知識性的結構化方程或函數,通過輸入相應的變量值實現對未來結果的推斷預測。
企業物資需求預測可從數量、資金等多個角度開展。 本文從物資管理實際情況出發,對物資歷史采購數據和消耗數據進行分析,結果表明:物資需求特性分為連續性需求特征和間斷性需求特征兩類時,需求特征較為顯著。 因此,預測方法分為連續性需求預測方法和間斷性需求預測方法。
連續性的物資需求一般具有規律性,是基于時間發生變化的,可通過對歷史數據進行挖掘分析,采用一些成熟的連續性預測方法進行物資需求預測,總結提取出其中的內在規律和關聯關系,并結合實際情況對模型參數進行最優調整,從而做出準確的預測。 一般來講,連續性預測的準確度與數據的數量和質量密切相關。
1.2.1 時間序列預測法
時間序列是指將同一統計指標的數值按其發生的時間順序排列而成的序列,可以是月度、季度、年度等多種時間形式。 時間序列預測是基于某一個或一組分布于時間軸上的觀測數據,通過挖掘分析觀測數據自身的變化規律,形成符合變化的規律函數,繼而按照等間隔時間預測未來的變化趨勢,時間序列模型公式為:

等式左邊表示對第t+1 期的預測值,等式右邊表示由第1 期至第t 期時間段內的序列構成的規律函數。
由時間序列公式可以看到,只需輸入歷史數據即可輸出未來預測數據,因此該方法預測較為簡單、方便,適用于連續性的序列預測。 但該方法對于序列有平穩性的要求,對于非平穩的、間斷性的時間序列,該方法的預測可信度較低。
1.2.2 LSTM 神經網絡
人工神經網絡是一種新興且有效的機器學習和深度學習算法。 人類并不是每時每刻都從頭開始思考,其思想具有持續性特點,傳統的神經網絡不具備這一特性,而遞歸神經網絡能夠有效解決這一問題。 遞歸神經網絡中具備循環結構,能夠使信息持續保存。 LSTM 神經網絡即長短記憶型遞歸神經網絡,其計算結果具備記憶之前幾次結果的特點,因此在時間序列數據預測方面具有很大優勢,是深度學習算法在時間序列數據預測方面的突破。
LSTM 中第一步決定哪些信息需要從單元狀態中被拋棄;第二步決定在單元狀態中需要存儲哪些新信息;第三步決定需要輸出的結果是什么,這個輸出結果將會建立在單元狀態的基礎上,但該輸出結果是個過濾版本,只輸出了想要輸出的那部分。
1.3.1 指數平滑法
指數平滑法本質上是一種特殊加權的移動平均法,常見的指數平滑法有一次指數平滑法、二次指數平滑法等,核心思想都是以歷史全量數據信息為分析基礎,通過對不同時期的觀測值賦予不同的權重,實現對未來的預測。 該方法具備魯棒性強的特點,由于操作簡單、適應性強,常用于間斷性的預測。
一次指數平滑法公式為:

二次指數平滑法公式為:


at和bt的計算公式為:

1.3.2 灰色預測法
對灰色系統建立的預測模型稱為灰色模型(簡稱“GM 模型”),是微分方程模型,可用于對描述對象作長期、連續、動態的反映,它揭示了系統內部事物連續發展變化的過程。 灰色模型就是通過少量的、不完全的信息,建立灰色微分預測模型,對事物發展規律作出模糊性的長期描述。 灰色預測需要樣本量較小,運算方便,建模精度高。
基于ERP(企業資源計劃)電力信息系統獲取某供電公司歷史項目的領料數據,按照領取時間的先后順序對各類物資進行統計排序,形成建模數據寬表,詳細表字段見表1。

表1 項目領料明細數據
由于物資類型較多,且物資的需求特性不一,過多的細化分類會增大研究難度,并且極大降低可行性。 因此,通過隨機抽樣抽取架空絕緣導線、低壓電力電纜、10 kV 變壓器、聯結金具、錐形水泥桿等20 類物資數據開展分類特征提取,并選取兩種不同特性的物資作為代表,按時間順序形成物資時序圖,結果如圖1、圖2 所示。

圖1 連續性需求特征物資時序
由時序圖可以看出,物資較為顯著的分類特征為連續性和間斷性,因此可將物資分為連續性需求物資和間斷性需求物資,針對不同的需求特性選取合適的預測方法進行挖掘分析。
根據物資展現出的需求特性選擇合適的挖掘算法預測分析物資的未來需求,經過多種算法的篩選,最終選擇時間序列分析作為連續性物資需求預測方法,選擇指數平滑法與灰色預測法作為間斷性物資需求預測的方法。
選取物資“架空絕緣導線”與物資“高壓熔斷器”代表連續性物資與間斷性物資進行后續的建模預測,通過ERP 系統獲取2 種物資2016—2017年每個月的物資數據。
2.3.1 連續性物資需求預測分析
(1)時間序列法實現物資需求預測分析
基于時間序列分析,對物資“架空絕緣導線”未來需求進行預測。 首先對架空絕緣導線序列進行平穩性檢驗。 檢驗結果見表2。

表2 架空絕緣導線序列平穩性檢驗
從表2 可知,架空絕緣導線序列的p 值為0.002 6,小于顯著性水平的p 值,因此序列通過了平穩性檢驗,可以直接進行后續建模。 接著通過查看序列的ACF(自相關)圖、PACF(偏自相關)圖選擇合適的模型,圖3、圖4 分別為架空絕緣導線序列ACF 圖、PACF 圖。
ACF 圖顯示滯后1 階后ACF 值基本沒有超過邊界值,PACF 圖顯示序列在1 階時就已收斂于邊界內。 因此,選擇AR(1)作為建立的ARMA模型。
根據建立的AR(1)模型對架空絕緣導線未來一個月的物資需求數量進行預測。 預測結果如圖5 所示。

圖3 架空絕緣導線序列ACF

圖4 架空絕緣導線序列PACF

圖5 時間序列實現未來物資需求預測
從圖5 可以看出,建立的AR(1)模型擬合程度較高,誤差波動小,預測的物資需求可信度高。通過時間序列分析對物資“架空絕緣導線”未來一個月需求進行預測,得到該物資在2018 年1 月的需求量可能為440.180 8 km。
(2)LSTM 神經網絡實現物資需求預測分析
基于LSTM 神經網絡算法,對物資“架空絕緣導線”未來需求進行預測。 首先,對LSTM 神經網絡模型進行參數設置,需設置的參數見表3。

表3 LSTM 神經網絡的參數
經過多次預測試驗,LSTM 神經網絡模型的訓練次數推薦為50 次,少于50 次則模型的損失值不穩定,易造成物資需求預測結果不穩定,多于50 次會使得模型運行速度變慢;訓練一次的樣本數量為選擇樣本期的歷史數據數量;用于評估LSTM 神經網絡的測試序列長度推薦7 或是14,相當于建模的測試樣本集;模型要預測的序列長度為選擇預測期間的樣本數量。
接下來開展模型搭建工作。 用Sigmoid 函數作為激活函數,并采用keras 來搭建LSTM 模型。將物資“架空絕緣導線”的時序數據輸入到LSTM模型中進行訓練,得到訓練之后模型的參數,然后輸入一個樣本,用LSTM 模型中的predict_sequence_full 函數(完全序列預測函數)進行預測窗口的預測。 輸入樣本集和測試集對物資需求量進行預測,預測結果如圖6 所示。

圖6 神經網絡實現未來物資需求預測
由圖6 可知,建立的LSTM 神經網絡模型預測的誤差波動較小,模型擬合效果好,預測出的需求結果可信度高。 通過LSTM 神經網絡模型對物資“架空絕緣導線”未來一個月需求進行預測,得到該物資在2018 年1 月的需求量可能為427.951 7 km。
2.3.2 間斷性物資需求預測分析
間斷性需求物資的特點為需求率低,通用性低,使用需求的時間間隔很長,物資消耗速度較慢,由于未發生物資領用,在需求數據中會產生大量0 值,數據存在明顯的波動性和隨機性,且間斷性物資的歷史需求數據相當有限。 因此,對于序列有平穩性要求的時間序列分析法不適合開展間斷性物資需求預測分析。 鑒于間斷性物資的特點,選擇指數平滑法與灰色預測法對其未來需求進行預測分析。
(1)指數平滑法實現物資需求預測分析
對現有物資“高壓熔斷器”的數據先后應用一次、二次指數平滑法,得到物資需求預測模型,從而預測出物資“高壓熔斷器”未來的需求。 首先對選取物資進行一次指數平滑法計算得到物資“高壓熔斷器”一次指數平滑值,預測結果如圖7所示。

圖7 高壓熔斷器一次指數平滑預測
從圖7 可知,運用一次指數平滑法進行預測,預測結果具有滯后作用,因此進一步運用二次指數平滑法對物資未來需求進行預測,提高模型預測的精度。
二次指數平滑法在一次指數平滑值的基礎上再次進行指數平滑,通過與一次指數平滑值配合,共同建立預測數學模型,并通過模型對物資需求進行預測。 根據第1.3.1 節的二次指數平滑公式計算出物資預測結果,如圖8 所示。

圖8 高壓熔斷器二次指數平滑預測
從圖8 可看出,運用二次指數平滑法擬合出的趨勢線能夠很好地體現原時間序列在不同時間段的變化趨勢,模型預測的精準度高,根據預測模型得到物資“高壓熔斷器”在2018 年1 月的需求量可能為789 只。
(2)灰色預測法實現物資需求預測分析
灰色預測是一套針對間斷性物資預測的方法,能夠很好地解決間斷性物資歷史需求數據較少的不足,并通過輸入數據變化的特征值對趨勢進行推演,實現間斷性物資未來需求的精準預測。
運用灰色預測法對物資“高壓熔斷器”未來需求進行預測,將其2016—2017 年間斷物資數據作為原始數據進行建模。 預測效果如圖9 所示。

圖9 高壓熔斷器灰色預測法預測
從圖9 可以看出,運用灰色預測法對物資“高壓熔斷器”進行預測,其擬合出的趨勢能夠很好地體現出原時間序列在不同時間段的變化趨勢,模型預測的精準度較高,根據灰色預測模型得到物資“高壓熔斷器”在2018 年1 月的需求量為465 只。
2.3.3 模型擇優
(1)連續性物資預測模型擇優
前文分別通過時間序列分析與LSTM 神經網絡分析對特征為連續性的物資進行需求預測,通過兩者建立的模型均能有效實現對物資需求的預測,通過對比兩者的模型平均預測誤差率,選取預測誤差更小的作為連續性物資的需求預測模型。
通過計算,時間序列分析的模型預測誤差率為9.61%,LSTM 神經網絡算法的模型預測誤差率為6.88%。 因此,選取LSTM 神經網絡算法作為預測連續性物資未來需求的算法。
(2)間斷性物資預測模型擇優
運用指數平滑法與灰色預測法均能有效、精準地對間斷性物資未來需求進行預測,通過對比兩種方法的預測誤差率,選取預測精準度更高的作為間斷性物資的預測模型。
通過計算,指數平滑法的模型平均誤差率為16.62%,灰色預測法的模型平均誤差率為25.88%。因此,選取指數平滑法作為預測間斷性物資未來需求的算法。
通過運用LSTM 神經網絡、指數平滑法分別對連續性物資、間斷性物資的未來需求進行精準預測,能夠有效輔助客戶決策各類電力需求物資的正確庫存,改善管理人員在物資管理方面的盲目性與片面性,提升電力公司對物資需求的快速精準響應,提高電力企業的物資管理水平。
本文通過對當前物資管理的現狀進行調研分析,結合企業實際工作需要,針對電力物資管理過程中的問題制定了相應的解決策略。 采用時間序列分析與LSTM 神經網絡算法對連續性物資未來需求進行預測,采用指數平滑法與灰色預測法實現對間斷性物資未來需求的預測,有效地提高了物資管理人員的物資需求預測能力,極大地節約了企業采購成本,提升了企業綜合競爭力。