劉永嘉



摘 要:目的:分析ARIMA預測和指數平滑法在遼寧省食品安全抽檢合格率預測中的可行性,并比較兩種模型的預測效果。方法:對遼寧省食品安全抽檢結果資料進行模型構建,并驗證預測結果,以預測結果的絕對誤差和相對誤差作為評價指標。結果:ARIMA模型公式為y(t)=-0.000+0.295y(t-1)+0.046y(t-2)-1.000ε(t-1),預測平均相對誤差為1.79%,平均絕對誤差為0.017;指數平滑法模型公式為y(t+1)=0.2Y(t)+0.8y(t),預測平均相對誤差為1.38%,平均絕對誤差為0.013。結論:兩種模型均可被用于食品抽檢合格率預測,其中指數平滑法預測效果更好。
關鍵詞:食品抽檢;合格率;模型預測
Abstract: Objective: The feasibility of ARIMA prediction and exponential smoothing method in Liaoning Province food safety sampling rate prediction was analyzed, and the prediction results of the two models were compared in this paper. Methods: The data of food safety sampling inspection in Liaoning Province were modeled, the prediction results were validated, and the absolute and relative errors of the prediction results were taken as evaluation indexes. Results: The ARIMA model formula is y(t)=-0.000+0.295y(t-1)+0.046y(t-2)-1.000ε(t-1), the average relative error was 1.79% and the average absolute error was 0.017. The exponential smoothing model formula was y(t+1)=0.2Y(t)+0.8y(t), the average relative error and the average absolute error were 1.38% and 0.013 respectively. Conclusion: The two models can be used to predict the qualified rate of food sampling, and the exponential smoothing method is more effective.
Keywords: food sampling inspection; qualified rate; model prediction
目前我國食品行業仍存在諸多風險,如微生物污染、重金屬超標、農藥獸藥殘留不合規等[1]。本研究擬利用食品抽檢情況資料建立預測模型,探討數學模型在實際預測中應用的可行性,為食品安全風險治理提供模型方法。
1 材料與方法
1.1 資料來源
建模所用資料來源于2019—2020年遼寧省市場監督管理局發布的食品安全抽檢信息。驗證所用數據資料來源于2021年遼寧省市場監督管理局發布的食品安全抽檢信息第1~5期。
1.2 預測方法
1.2.1 ARIMA預測
ARIMA模型構建過程[2]:①平穩性檢驗,先用時序圖初步判斷,再進行ADF檢驗最終確定數據的平穩性;②游程檢驗,只有當時間序列是非隨機序列時,才可繼續構建模型;③模型識別與擬合,根據序列特征和信息準則AIC和BIC值越低越好原則[3],分析比較不同參數時模型優化情況;④殘差白噪聲檢驗,通過Q統計量檢驗進行。
1.2.2 指數平滑法預測
指數平滑法是利用上期實際值和上期預測值,輔以平滑系數,計算得出預測值。根據時間序列圖特征初步確定擬使用的指數平滑法類型。根據時間序列數據的數量確定擬使用的初始值SO。根據RMSE值越小越好的原則[3],配合不同參數組合設置下模型的預測效能,最終確定平滑系數α值和平滑類型。
1.3 分析方法
數據整理使用WPS Office 2019,ARIMA模型和指數平滑法模型構建、模型檢驗、擬合與預測使用在線分析平臺SPSSAU。預測效能評價指標:預測結果的相對誤差和絕對誤差的絕對值。
2 結果與分析
2.1 遼寧省食品安全抽檢合格率的時序特征
對遼寧省2019—2020年食品安全監督抽檢情況資料進行整理,觀察抽檢合格率時間序列圖(圖1),抽檢合格率總體呈現水平向下波動。
2.2 ARIMA預測
2.2.1 平穩性檢驗
由圖1可知序列總體斜向下,說明進行ADF檢驗,其中差分階數為1,檢驗結果見表1。由表1可知,該序列ADF檢驗的t統計量為-5.478,P值為0.000,1%、5%、10%臨界值分別為-3.517、-2.899、-2.587。P=0.000<0.01,因此推斷此時序列平穩。
2.2.2 游程檢驗
游程分析結果見表2。由表2可知,P<0.05,說明該時間序列的發展不隨機,有規律可循,可以進一步分析。
2.2.3 模型識別與擬合
根據信息準則AIC和BIC值越低越好原則,結合時序圖特征,分析比較不同參數時模型優化情況,得出模型參數,如表3所示。則最優模型為:ARMA(2,1,1),模型公式為:
y(t)=-0.000+0.295y(t-1)+0.046y(t-2)-1.000ε(t-1)(1)
式(1)中:y(t)表示差分運算中的當前值,t表示時序數,ε表示誤差。
2.2.4 殘差白噪聲檢驗
利用Q統計量進行白噪聲檢驗,結果見表4。由表4可知,Q6、Q12、Q18的P值均>0.1,說明在0.1的顯著性水平下,模型的殘差是白噪聲,滿足要求。
2.2.5 模型預測
預測結果見表5,整體預測值的相對誤差較低,預測結果較理想。
2.3 指數平滑法預測
2.3.1 指數平滑法模型構建結果
模型公式為y(t+1)=0.2Y(t)+0.8y(t),y表示預測值,t表示時序數,Y表示實際值。模型擬合的RMSE值為0.011。
2.3.2 模型預測
預測結果見表6,整體預測值的相對誤差很低,預測精度較高。
2.4 兩種模型預測效能比較
表7為兩種模型對2021年第1~5期遼寧省食品安全抽檢合格率預測效能比較,可知指數平滑法預測效果更好。
3 結論與討論
近年來,食品安全風險治理一直是公眾關心的問題,食品安全風險監測預警技術手段是食品安全風險治理的關鍵[4]。時間序列預測手段適用于單獨的一串時間序列數據,簡便高效。本研究通過構建ARIMA模型和指數平滑法預測模型,分析比較了兩種模型對食品安全抽檢合格率的預測效能,結果表明:2種預測結果的相對誤差均在5%以內,其中ARIMA模型除第3期以外的相對誤差均在1%以內,指數平滑法除第2期和第3期以外的相對誤差均在1%以內,可見兩種模型預測精度都很理想[5],均可被用于食品安全抽檢合格率預測的評估預警中。通過比較可知指數平滑法預測效果更優。
觀察2種模型預測結果發現,前幾期預測值總體均低于后續預測值,由此推斷,ARIMA模型和指數平滑法短期預測更準確。本研究建模只考慮抽檢期數,不考慮其他因素(如食品安全相關政策的改變、食品安全突發事件的影響、食品檢驗檢測能力的提高及食品抽檢時間間隔的變化等),建模效果的優劣很大程度上取決于食品抽檢資料的質量。因此提高食品安全抽檢的科學性,加強食品檢驗檢測行業能力水平,提升抽檢數據網絡通告的時效性,對于模型更新優化、提高預測精度就顯得至關重要。本研究是食品安全風險預警技術手段的重要補充,為及時預測食品風險、科學規劃食品抽檢提供理論支撐和技術指導。
參考文獻
[1]佚名.中共中央國務院關于深化改革加強食品安全工作的意見[J].中國農村科技,2019(12):26.
[2]于林鳳,吳靜,周鎖蘭,等.ARIMA季節模型在我國丙肝發病預測中的應用[J].鄭州大學學報(醫學版),2014,49(3):344-348.
[3]王永斌,柴峰,李向文,等.ARIMA模型與殘差自回歸模型在手足口病發病預測中的應用[J].中華疾病控制雜志,2016,20(3):303-306.
[4]劉克斌.國內外食品安全風險監測發展狀況[J].河南預防醫學雜志,2020,31(5):328-331.
[5]嚴婧,楊北方.指數平滑法與ARIMA模型在湖北省丙型病毒性肝炎發病預測中的應用[J].中國疫苗和免疫,2017,23(3):292-297.