中圖分類號:TP391.9 文獻標識碼:A DOI編碼:10.3969/j.issn.1006—6500.2025.07.006
Abstract:Inordertoexplorethapplicationefectofhybridtimeseriesmodelsinpredictingtobaccostock,Monthlytobaostock dataofacertaincigareteinustryenterprisewerecolectedinthepast,singleandcombinationpredictionmodelsbasedontheexpo nentialsmoothingmethodandadaptivefilteringmethodwerebuilt,andtheefectsofdiferentmodelswerecompared.Theresults showedthatthemonthlyandannualtimeserieschartoftobaccostockdatashowedasiusoidaltrend withobvioustimeperiodicity. Thepredictionmodelbasedonte exponentialsmothing methodcouldnotjudgetherisingorfaling trendoftheealvalueaccurately. The RMSE,MAE and MAPE were 1.93,1.47 and 3.51% respectively. The prediction model based on the adaptive filtering method couldjudgethetrendofthepredictionobject,whilethepredictionerorwassignifcantlyraisedwiththeincreaseofsampledata.The RMSE,MAE and MAPE were 0.32,0.26 and 0.61% respectively.The predicted RMSE,MAE and MAPE of the combined time series model based on exponential smoothing method were 0.91,0.69, 1.75% and the predicted RMSE,MAE and MAPE of adaptive filtering combined time series model were 0.28,0.21, 0.52% respectively.In conclusion,the hybrid prediction model has better fitting effects, andcanbetereflcttheeallevelofflakytobaccostockdata.Amongthem,theadaptivefileringhybridtimeseriesmodelhsbetr prediction effect.
Keywords:flaky Tobacco;stock forecast;time series;hybrid model
預測片煙庫存是煙草產業鏈先導環節,是一種受總量、結構和產地約束的戰略資源。科學、合理的煙葉原料庫存是工業企業健康穩定發展的重要基礎。反之,不合理的原料庫存不僅導致資金大量沉淀,還會增加庫存費用,加大管理成本,降低企業資金周轉效率3-4。因而,卷煙工業企業如何更準確地預測煙葉庫存的動態變化過程,明晰煙葉庫存的變化特征,進而支撐自身卷煙品牌的健康發展,成為卷煙工業企業原料保障工作中亟待解決的重要課題
比較常用預測模型有差分整合移動平均自回歸、長短期記憶神經網絡、灰度模型等5-7,時間序列預測模型是一種適合于連續序列的數據預測方法,在動態數據的處理分析、復雜信息的預測和加工等方面顯示出傳統靜態處理無可比擬的優越性。喬少杰等通過大量試驗驗證了動態自適應時空圖的多元時序預測模型的有效性。瞿偉等研究了一種結合時序分解與相似分量重組的深度學習滑坡位移組合模型,相較現有模型可顯著提高滑坡位移的預測精度。陳永等利用ARIMA-TCN混合模型預測建立高速鐵路時鐘的數學理論和實際觀測模型,獲得了較低的同步誤差和更高的同步精度。隨著大數據分析和深度學習的迅猛發展,時間序列預測方法被廣泛應用于醫學、金融、氣象和交通等領域,為眾多應用任務提供決策支持,但在卷煙工業片煙庫存方面的應用研究目前還鮮見報道。鑒于此,利用時間序列模型在數據預測方面的優勢,比較不同時間序列算法在片煙庫存預測中的應用效果,可為卷煙企業原料保障工作提供參考依據。
1材料與方法
1.1數據來源
試驗共收集某卷煙工業企業168期國內烤煙月度庫存數據。其中,前156期樣本數據作為時間序列預測模型建立的訓練集,后12期作為檢驗模型效果的測試集。
1.2時間序列預測模型的構建
時間序列預測模型是將預測目標的歷史數據按時間順序排列,分析數據隨時間變化的趨勢,并建立數學模型進行外推的定量預測方法[13]。當預測對象影響因素較多且關系復雜時,采用時間序列預測方法可以取得較好的效果4。本研究選取2種適合中短期預測的時間序列模型算法,分別為指數平滑法和自適應濾波法,并在2種單一算法的基礎上,通過算法組合建立組合預測模型。
1.2.1指數平滑法指數平滑法是將時間序列過去的數據呈現為一條遞減的指數函數曲線,用對指數進行加權的方法實現預測[。其中,一次平滑只適用于具有水平趨勢的時間序列,誤差較大。二次平滑適用于具有線性趨勢的時間數列。采用三次指數平滑獲得典型的拋物線形式[16-17],其在第 t+T 時刻的預測值如下:

式中, S1(1),S1(2),S1(3) 分別為 t 時期的1~3次指數平滑值; a1 為t時期的期望值; bt 為 χt 時期的線性增量; ct 為t時期的拋物線增量;T為t時期后的期數。
1.2.2自適應濾波法自適應濾波法通過給定的一組權數計算一個預測值,然后計算預測誤差,再根據預測誤差調整權數,反復迭代直到找出一組“最佳\"權數,使誤差最小[18-19]。自適應濾波法的預測公式如下:

式中,
為 1+1 時期的預測值; wi 為 t-i+1 時期的觀測值權數; Xi+1 為第 t-i+1 期的觀測值;N為權重的個數。
自適應濾波法調整權數的公式如下:
wi′=wi+2kei+1Xt-i+1
式中, i=1,2,…,N,t=N,N+1,…,n,n 為序列數據的個數; Wi 為調整前的第i個權數; Wi' 為調整后第i個權數; k 為學習常數; ei+1 為 t+l 期的預測誤差,即 ei+1=
(204號
1.2.3組合預測模型為進一步提高模型的預測精度,研究在原有2種單一時間序列預測模型的基礎上,結合自適應濾波法層層迭代調整權數的模型算法,通過模型組合減小預測誤差。具體來講,即以指數平滑法和自適應濾波法為基礎,通過2種單一模型建模值與實際真實值之間反復迭代返回一組“最佳”權數,對建模結果進行修正,模型中權重個數 Nc, 初始權重值、學習常數 kc, 權數調整方法參考自適應濾波法設置。
組合模型的預測公式如下:

式中, H1+1 為 t+1 時期組合模型的預測值; Υ?1-i+1 為t-i+1 時期不同單一時間序列模型的預測值; wi 為反復迭代返回的權數。
1.3效果評估
為評估不同時間序列模型的預測效果,使用均方根誤差(RMSE)平均絕對誤差(MAE)和平均絕對百分比誤差(MAPE)作為衡量的指標。誤差越小,準確性越高[20]。

式中, yi 為真實值; yi′ 為預測值; n 為數據期數。
1.4數據處理
由于收集的片煙庫存數據差異較大,為方便對比,本研究統一將其處理成均值為0、標準差為1的正態分布,公式如下:

式中, ?μ 和 σ 分別代表數據樣本均值和標準差; x* 和 x 分別代表數據處理前后的樣本值。同時,本研究應用Matlab 2013a 軟件編程建模,MicrosoftExcel軟件繪圖做表。
2結果與分析
2.1片煙庫存數據的變化特征
量綱處理后的片煙庫存數據按月度時序排列,其變化特征如圖1所示。由圖1可見,收集的168期月度片煙庫存數據呈現“鋸齒狀\"非線性波動,庫存數據在第89期、第101期和第124期明顯增長,在第136期達到峰值,隨后緩慢下降。為更加直觀地了解片煙庫存數據的變化特征,以年(12期)為單位對月度時序圖進行重新排列(圖2)。由圖2可見,重新排列的片煙庫存數據曲線呈“正弦式\"變化,月度庫存數據在每年第2季度上揚,在第3季度開始緩慢下降,在第4季度開始快速上漲。
圖1月度片煙庫存的變化情況
Fig.1Monthly stock conditionofflakytobacco

從月度片煙庫存數據的變化特征來看,不同年際間片煙庫存峰值均出現在4一6月,谷值出現在9—10月。每年11月一次年3月庫存片煙數量呈上升趨勢,而7一9月庫存呈持續下降趨勢。結合國內烤煙生產節令來看,每年11月一次年3月出現的庫存增長與國內烤煙的成品片煙入庫息息相關,同時鑒于每年1月行業提倡的卷煙銷售“開門紅”政策22,片煙庫存消耗往往較大,因而年初片煙庫存的增長趨勢較之年底有所減緩。隨著年度新煙入庫工作陸續結束以及片煙的消耗,庫存片煙整體呈緩慢下降趨勢,并在每年9一10月出現谷值,隨后開始新一輪煙葉調撥工作,以此循環。總體來看,片煙庫存的月度數據呈現明顯的時間周期性,年際間呈先上升后下降趨勢。
圖2片煙庫存數據時序圖
Fig.2 Sequence diagram of flaky tobacco stock data

2.2單一時間序列模型的建立
參考前人研究,考慮到利用指數平滑法中進行預測時試驗數據量較大,本研究將量綱處理后的建模前5期數據平均值作為平滑初始值,并選用三次指數平滑法計算平滑系數 ∝ 的不同擬合值。不同 ∝ 的誤差平方和Q見圖3。由圖3可知,當平滑系數 α=0.7 時,Q值最小,為9.13。
在確定指數平滑法平滑初始值和平滑系數的基礎上,基于指數平滑法建立的月度片煙庫存預測擬合曲線如圖4所示。由圖4可見,與真實值相比,利用前156期訓練集建立的預測模型波動更大,且擬合的峰值和谷值滯后于真實的峰值和谷值,即存在極值預測的“后移”現象。這與前人研究結果基本一致,模型的擬合結果與真實結果存在差距。
在自適應濾波法中,需要確定權重的個數N、初始權重和學習常數 k 的取值,當數據呈現周期變動時,權重的個數一般與周期數相當23。由于片煙庫存數據呈現以年為周期的季節變動,權重個數N取12,初始權重為1/12,自適應濾波法的學習常數 k 值為 0.001[23] 。
在確定各項參數的基礎上,借助計算機反復迭代確定“最佳\"權數(表1),獲得的月度片煙庫存的預測模型如下:
圖4指數平滑法的預測值與真實值比較
Fig.4 Comparison between predicted and real value of the exponential smoothing method

3X1-3-0.1548X1-4+0.1182X1-5-0.1364X1-6+0.1358X1-7. 0.0248X1-8-0.1686X1-9+0.6018X1-10-0.2789X1-11 式中, X1+1- 為 t+1 時期的預測值; Xt-1i,Xt-10 , …,Xt 為量綱處理后第 t-11,t-10,…;t 期的月度片煙庫存的真實值。
2.5真實值 指數平滑法預測值 1.60.7 WWy-0.2-1.1 v-2.00 12 24 36 48 60 72 84 96 108 120 132 144 156期數
表1自適應濾波法的權重結果
Tab.1Weighting results of the adaptive filtering method

基于自適應濾波法建立得到預測模型(圖5),由于預測模型的權重設置為12,訓練集前12期擬合值為0。由圖5可知,模型的擬合曲線基本能夠反映真實值的變化趨勢,部分結果能夠與真實值重合。總體來看,利用自適應濾波法建立的模型能夠較好地模擬真實值上下波動的變化趨勢,構建模型的圖形效果好于指數平滑法。但隨著月度片煙庫存樣本數量的增加,建模曲線與真實值的出入變大,擬合精度下降[]。
2.3組合時間序列模型的建立
在指數平滑法和自適應濾波法的基礎上,通過模型組合獲得組合時間序列模型。以指數平滑法的建模結果為基礎,利用計算機進行迭代計算,參考自適應濾波法,確定組合模型的各項參數,其權重個數Nc、初始權重值、學習常數 kc 值分別為12、1/12和0.002。
圖5自適應濾波法的預測值與真實值比較

Fig.5Comparison between the predicted and the true value of the adaptive filtering methoc
指數平滑組合模型的權數結果見表2,其月度片煙庫存的預測模型如下:
H?+1=0.4658Y?-0.0158Y?-1+0.1187Y?-2+0.019 (204號 6Yι-3-0.018 0Xι-4-0.001 9Yι-5-0.030 8Yι-6+0.029 4Yι-7- 0.0615Yt-8-0.0743Yt-9+0.4209Yt-10-00551Yt-11 式中, Ht+1 為 t+1 時期組合模型的預測值; Υt-i+1 為t-i+1 時期指數平滑法的預測值;wi為反復迭代返回的權數。
表2指數平滑組合模型的權重結果
Tab.2Weightingresult of hybrid model based on the exponential smoothing method

同樣的,以自適應濾波法的預測結果為基礎,確定其模型的權重個數 Nc 、初始權重值、學習常數 kc 值分別為12、1/12和0.002。自適應濾波組合模型確定的權數結果見表3,其預測模型如下:
H?t+1=0.9914Y?+0.0637Y?t+1-0.1579Y?t-2-0.1111 3Yt-3+0.085 2t-4-0.074 2Yt-5+0.092 8Yt-6-0.068 5Yt-7- 0.092 9Yt-8+0.236 2Yt-9+0.265 0Yt-10-278 9Yt-11 式中, ?Hul? 為 t+l 時期組合模型的預測值; Υti+l 為 t-i+1 時期自適應濾波法的預測值; wi 為反復迭代返回的權數。
表3自適應濾波組合模型的權重結果
Tab.3Weightingresult of hybrid model based on the adaptive filtering method

2種組合時間序列模型的預測曲線如圖6所示。由圖6可見,組合模型的擬合曲線與真實值的走勢較為一致。與指數平滑法相比,組合模型能夠更準確地反映真實值上下波動的趨勢,模型與真實值的貼合程度更高。而與自適應濾波法相比,組合模型對數據極值的擬合精度有所改善,效果不會隨月度片煙庫存數據樣本的增加而減弱。
圖6組合時間序列模型的預測值與真實值比較
Fig.6 Comparison between the predicted and the real value of the hybrid time series model

2.4不同時間序列模型預測效果對比
不同時間序列模型的預測曲線(圖7)可以發現,2種單一時間序列模型種,指數平滑法的預測曲線總體呈上揚趨勢,與真實值的擬合度較差。自適應濾波法擬合效果明顯好于指數平滑法,能夠客觀反映真實值的變化趨勢。與原有單一時間序列模型相比,組合時間序列模型的預測效果均有所改善。其中,與指數平滑法相比,指數平滑組合模型能夠更準確地反映真實值上下波動的變化趨勢,但隨著預測樣本數據的增加,效果有所減弱。與自適應濾波法相比,自適應濾波組合模型的擬合曲線與真實值的貼合度更好。總體來看,模型組合后的預測曲線更加貼近真實值,其中又以自適應濾波組合模型的圖形預測效果更為理想。
圖7不同時間序列模型的預測值與真實值比較
Fig.7 Comparison between the predicted and the real value of different time series model

基于不同單一時間序列模型對后12期測試集的預測結果,計算其預測值的RMSE、MAE和MAPE值(表4)。由表4可知,指數平滑法的RMSE、MAE和MAPE值分別為1.93、1.47和 3.51% 。相比之下,自適應濾波法的RMSE、MAE和MAPE值分別為0.32、0.26和 0.61% 。由此可見,在單一時間序列預測模型中,自適應濾波法對月度片煙庫存的預測效果明顯好于指數平滑法。
表4不同時間序列模型的預測效果Tab.4Prediction effect of different time series models

同樣的,計算2種組合時間序列模型預測值的RMSE、MAE和MAPE值,結果見表4。其中,指數平滑法組合模型預測值的RMSE、MAE和MAPE值分別為0.91、0.69和 1.75% ,自適應濾波組合模型預測值的RMSE、MAE和MAPE值分別為0.28、0.21和0.52% 。由此可見,組合時間序列模型的預測誤差均小于組合前,此種現象在指數平滑法中更明顯,但組合后的預測精度依然弱于單一時間序列模型的自適應濾波法。在4種時間序列的不同算法中,以自適應濾波組合模型的預測精度最好。
3討論與結論
3.1討論
對于卷煙生產企業而言,片煙庫存受到生產、政策、企業、市場等諸多因素的影響,是一組涉及趨勢、季節和循環變動的典型時間序列數據。本研究利用時間序列模型在復雜環境下預測的可行性和有效性,以基于時間序列的指數平滑法和自適應濾波法為基礎,進一步構建組合預測模型,比較不同單一和組合時間序列模型在片煙庫存預測中的應用效果。對比不同時間序列模型的預測結果,本研究發現,基于指數平滑法建立的預測模型無法準確判斷月度片煙庫存上升或下降趨勢,建立模型的擬合值與真實值差距較大,這與前人[15-研究結果基本一致,其預測結果的RMSE、MAE和MAPE值分別達到1.93、1.47和 3.51% 。基于自適應濾波法建立的預測模型能夠較好地判斷預測對象的走勢,但隨著數據樣本的增加,擬合精度同樣有所下降[8-19,其模型預測的
RMSE、MAE和MAPE值分別為0.32、0.26和0.61% 。基于不同單一時間序列的預測結果,經自適應濾波法層層迭代的“最佳”權數修正得到的組合時間序列模型在準確判斷真實值波動趨勢的同時,預測效果不會隨著樣本數據的增加而減弱,指數平滑法組合模型預測的RMSE、MAE和MAPE值為0.91,0.69,1.75% ,自適應濾波組合模型預測的RMSE、MAE和MAPE為 0.28,0.21,0.52% 。
比較不同時間序列模型的參數計算過程,筆者發現,在指數平滑法中,當時間序列相對平穩時,選取的平滑系數 ∝ 可以較大;當時間序列波動較大時, ∝ 的取值應相對較小,以忽略遠期實際值的影響[。同樣的,在自適應濾波法和組合時間序列模型中,由于算法通過迭代獲得預測數據,當學習常數k值過大時,預測結果往往無法收斂,而當k值過小時,模型又需要迭代多次才能獲得預測結果。因而在實際應用過程中,當遇到算法無法收斂的情況時,可將 k 值縮小[23]。在不同時間序列模型的預測過程中,指數平滑法以t時期的期望值、線性增量和拋物線增量為基礎預測隨后第T期的數值。自適應濾波法先計算第一期預測值,而后代入預測下一期,依次類推,最終獲得所有預測結果23。組合時間序列模型則通過單一時間序列模型的建模值與真實值反復迭代返回一組“最佳\"權數,進而對模型的預測結果進行修正,最終得到預測結果。
在模型預測效果的指標選擇上,研究選取的RMSE、MAE和MAPE均考慮了預測值和實際值的誤差。隨著時間序列樣本數據的增加,RMSE和MAE的值均會增大,而MPAE中還計算了誤差與真實值的比例,因此可以將MAPE作為模型預測效果檢驗的主要評價指標2。比較不同時間序列模型的MAPE值,筆者發現,組合時間序列模型的MAPE值均變小,說明組合的修正效果明顯。但當原有模型間的MAPE值差異較大時,模型組合并不能彌補這種預測差異。
通過建立片煙庫存預測的時間序列模型可以更精準地掌握卷煙原料庫存的變化特征,在結合自身卷煙品牌發展戰略的基礎上,對于片煙庫存總量偏大、使用周期偏長的工業企業,應加快開展基地布局優化、配方使用和工業調劑售出,制定庫存優化的有效措施;而庫存偏小、使用周期偏短的工業企業應增加原煙采購計劃,采取調劑購進,以支撐自身卷煙品牌的平穩健康發展。
3.2 結論
本研究發現,指數平滑法對中長期片煙庫存數據的預測精度較差,自適應濾波法能夠模擬片煙庫存的變化趨勢,但預測精度隨著步長的增加而下降。組合時間序列預測模型對片煙庫存中長期預測準確精度高于上述2種單一時間序列模型。組合時間序列模型既減少了預測對象上下波動較大時的預測誤差,又避免了因樣本數據增加而導致的預測精度下降的問題,可以更精準地預測月度片煙的庫存情況,其中以自適應濾波組合時間序列模型的建模效果更好,預測誤差更小,更符合實際情況。利用自適應濾波組合時間序列模型研究片煙庫存,對卷煙工業企業更合理地開展原料保障工作具有十分重要的意義。
值得注意的是,對于片煙庫存的預測研究,除了本研究涉及的時間序列預測模型,還有諸多其他基于時間序列的預測算法,未來有待于進一步探索。
參考文獻:
[1]王宗澤.關于深化煙葉產業供給側結構性改革的思考[J].中國煙草學報,2019,25(4):113-117.
[2]王姝.M公司煙葉原料供應流程改進研究[D].南京:南京理工大學,2018.
[3]“品牌發展和原料供給”調研組.卷煙工業企業品牌發展與原料供給矛盾的分析與建議[J].中國煙草學報,2012,18(4): 94-98.
[4]姜林燦.對煙葉原料保障上水平的探討[J].中國煙草科學,2011,32(6):90-93.
[5]張良均,王路,譚立云,等.Python數據分析與挖掘實戰[M].北京:機械工業出版社,2015:119-134.
[6]高鵑,邢國平,孫德翔,等.灰色關聯支持向量機在備件庫存消耗預測中的應用[J].電光與控制,2012,19(3):100-105.
[7]KIM N,KIMM,CHOI JK.LSTM based short-termelectricity consumption forecast with daily load profilesequences[C]//2O18 IEEE 7th Global Conference on ConsumerElectronics (GCCE).Piscataway, USA: IEEE,2018:136-137.
[8]胡斌.基于時間序列分析的庫存需求預測計算系統的研究及應用[D].成都:電子科技大學,2011.
[9]喬少杰,薛騏,楊國平,等.基于動態自適應時空圖的多元時序預測模型[J].計算機學報,2024,47(12):2925-2937.
[10]瞿偉,李達,李久元,等.一種結合時序分解與相似分量重組的深度學習滑坡位移組合預測模型[J].大地測量與地球動力學,2025,45(3):221-230.
[11]陳永,詹芝賢,張薇.基于ARIMA-TCN混合模型的高速鐵路時間同步方法[J].鐵道學報,2024,46(6):90-100.
[12]于敬楠,張春霞,薛新月,等.融合趨勢嵌入和粒度增強網絡的小樣本醫學時間序列預測[J].計算機輔助設計與圖形學學報,2024,36(6):948-959.
[13]王黎明,王連,楊楠.應用時間序列分析[M].上海:復旦大學出版社,2009.
[14]盧繼強,徐峰.基于指數平滑法和回歸分析的滑坡預報模型研究[J].武漢理工大學學報,2011,33(10):88-91.
[15]張笑通.基于時間序列的卷煙需求預測模型的研究與應用[D].鄭州:鄭州大學,2016.
[16]夏貴進,張曦,張居梅,等.基于三次指數平滑法的光纖損耗預測研究[J].光通信技術,2014(1):35-37.
[17]宋芳,張亞平,張宗郁,等.基于遺傳退火三次指數平滑的期貨預測研究[J].計算機工程與設計,2012,33(5):1963-1967.
[18]湯興恒,郭強,徐天慧,等.基于多尺度核自適應濾波的股票收益預測[J].計算機應用,2023,43 (5):1385-1393.
[19]徐超,項薇,季孟忠,等.基于ARIMA與自適應過濾法的組合預測模型研究[J].計算機應用與軟件,2018,35(11):296-300,320.
[20]葛娜,孫連英,趙平,等.基于ARIMA時間序列模型的銷售量預測分析[J].北京聯合大學學報,2018,32(4):27-33.
[21]邱禧荷,茹亞軍,陳斌,等.基于DeepAR神經網絡時間序列模型的電能消耗預測[J].江蘇大學學報(自然科學版),2022,43(5):599-603.
[22]王毅輝.我國卷煙需求預測研究述評[J].中國煙草學報,2012,18(4):88-93.
[23]李穎,付金宇,張照億,等.基于自適應濾波改進算法的大連港吞吐量預測[J].重慶交通大學學報(自然科學版),2020,39(4):36-40.
[24]李莎,林暉.結合MLR和ARIMA模型的時空建模及預測[J].計算機工程與應用,2021,57(13):276-282.