舒服華
(武漢理工大學 繼續教育學院,湖北 武漢 430070)
茶位列世界三大飲品之首,茶葉中含有多種礦物質元素、茶多酚、維生素、黃酮等對人體健康有益的物質。全世界有30多億人在飲茶,接近占總人口的一半。中國是茶葉的故鄉,飲茶歷史有4000多年,中國人喜歡喝茶,聞名遐邇,有接近35%的人口愛喝茶。當然,中國也是茶葉生產大國,2020年茶葉產量接近300萬噸[1],占全球產量的45%。茶葉是我國對外貿易的傳統產品,中國茶葉對外貿易有1500余年歷史,目前我國仍然是茶葉出口大國,2019年出口茶葉34萬多噸,價值20多億美元。茶葉種植是我國廣大農村地區的拳頭經濟作物之一,不僅促進了我國的農業產業化,帶動了鄉村經濟發展,還成為山區農民脫貧致富的重要載體。我國的制茶者在繼承傳統的制作工藝與方法、發揚光大老字號優秀品牌的同時,積極研究并開發了一大批新品種,創新了制作手法,創立了許多新品牌,使茶葉新品層出不窮,極大地滿足了民眾對高品質茶飲的需求。此外,過去滿目瘡痍的荒山禿嶺通過種茶也變得充滿生機,取得了經濟效益和生態效益的雙豐收。
安徽是我國的主要產茶區之一,域內有黃山毛峰、太平猴魁、六安瓜片、祁門紅茶等享譽國內外的知名茶品,是安徽省農村農業產業化的重要代表。科學預測我國茶葉產量,對于調整優化種植結構、穩定茶葉種植面積和產量、提高產品品質和附加值、保持市場供需總體平衡、提高種植效益、推動茶葉產業有序有效發展等具有積極意義。
影響茶葉產量的主要因素有種植面積、種植結構、種植技術、氣候狀況等。種植面和種植結構雖然每年都在調整變化,但大多具一定的規律性,不會出現大起大落;種植技術在各地的指導和培訓下,一般在逐步提高;氣候狀況可能局部地區會出現異常,但就全國范圍來說影響有限。綜上所述,如果政局、突發事件、自然災害等因素變化不大,茶葉產量不會出現大起大落。這樣,我們就可以通過挖掘茶葉產量歷史數據的隱含息來預測茶葉產量未來變化的情況。
傳統指數平滑法在預測較長的時間序列時,后期的值容易受到前期數據的干擾,影響預測精度。新陳代謝指數平滑法作為一種改良的指數平滑法,把長的時間序列按順序分成較短的若干時間序列,縮短建模樣本的長度,通過不斷刪除舊信息和添加新信息,實現新舊信息不斷交換,能充分利用有價值的信息,舍棄無價值的信息,提高模型的適應性和預測精度。研究通過對比2種指數平滑法對我國2006—2020年茶葉產量預測的結果,選取二者中準確度更高的方法預測2021年和2022我國的茶葉產量。
指數平滑法原理是:任意一期的指數平滑值都是本期實際觀察值與前一期指數平滑值的加權平均值。根據平滑次數不同,指數平滑法分為一次指數平滑法、二次指數平滑法和三次指數平滑法等,一般平滑次數越多,預測值越光滑,需要根據樣本的特點選擇恰當的平滑次數。指數平滑法的基本計算公式為[2-3]:
(1)

指數平滑系數(權數)α對預測結果有較大的影響,α影響各期權重的變化快慢,α取小值表示各期觀察值的權數由近及遠緩慢地變小,近期數據的變化對預測結果影響大;α取大值表示各期觀察值的權數由近及遠緩慢地變大,近期數據的變化對預測結果影響小。指數平滑系數α根據數據分布的特點選取,如果數據序列波動不大,α宜取小值;如果數據序列波動較大,則α宜取大值。α的確定一般采用試算法,以預測結果的均方誤差M、平均誤差ε、近期誤差綜合評定。預測結果的均方誤差M定義為:
(2)
三次指數平滑的計算公式為[4-5]:
(3)
(4)
(5)


(6)
式中,at、bt、ct為平滑系數,其計算公式分別為:
(7)
(8)
(9)
從指數平滑法的基本原理可知,越遠的數據對近期數據預測的作用越小,價值越小;而越近的數據對近期數據預測影響越大,價值越大。當需要預測的時間序列比較長時,如果采用所有數據統一建模,遠期的歷史數據,不僅對近期數據預測沒有太大的價值,甚至還會對其預測產生行干擾,起到相反的作用。
新陳代謝指數平滑法的基本思想是:對于較長時間序列,首先按照順序,從第一個數據開始,選取一段合適長度的數據,組成小樣本,運用指數平滑法建模,預測它們的數值。然后刪除第一個數據,按順序在后添加一個數據,組成等長度的數據樣本,重新建模預測添加的新數據的值。通過重復以上過程,建立多個等維度的指數平滑模型,直到將原序列中所有的數據預測完畢。最后,以最后一個模型為基礎,向外延伸,預測原始時間序列之后的數據。這樣,保持模型維數不變,通過不斷加入新信息,刪除舊信息,進行信息新陳代謝,分步預測后期的數據,排除歷史數據的干擾,從而達到提高模型整體預測精度的目的[9]。
由圖1可知:2006-2020年間,除2018年外,我國茶葉產量均呈增長態勢。但增長幅度不均衡,數據序列呈不光滑、凸凹不一致的雜亂分布。如果采用整個長度的數據建立指數平滑法模型進行預測,效果可能不理想,采用新陳代謝指數平滑模型預測效果會更好。

注:數據來源于國家統計局2006—2020年國民經濟和社會發展統計公報。圖1 2006—2020年我國茶葉(毛干茶)產量統計數據
設2006—2020年我國茶葉產量為原始時間序列Xt={x(t)},t=1,2,…,15,則:Xt=[93.5,102.8,116.5,135.9,147.5,162.3,179,189.69,209.19,227.76,244,260.9,261.6,279.3,298.6]。
為了比較模型的性能,分別用如下兩種方法進行預測。
以整個Xt為樣本建立三次指數平滑模型,首先確定指數平滑系數α。嘗試平滑系數取不同值的效果。α取不同值時M和ε如表1,α取不同值時的擬合曲線如圖2。
由表1和圖2可知,當α=0.15時,平均預測誤差ε=4.7782%最小,均方誤差M=45.794與最小值43.868差距不大。即α的最佳值為0.15,對應傳統三次指數平滑法的平均擬合誤差為4.7782%。由此得到模型的相關數據見表2。

表1 指數平滑系數取不同值時的M和ε

圖2 傳統指數平滑法不同α值的擬合曲線

表2 傳統三次指數平滑模型相關數據
首先確定新陳代謝指數平滑模型的維數,維數太多,達不到新模型的效果,維數太少,信息丟失量較大,一般選取10~15個數據。本研究取12個數據,即維數為12,那么要完成對原始序列15個數據的預測,需要建立4個指數平滑模型。
以第一模型為例,樣本為Yt1=[93.5,102.8,116.5,135.9,147.5,162.3,179,189.69,209.19]。以Yt1建立三次指數平滑,預測樣本中的值。去掉數據93.5,在后添加數據227.76,構成等維的樣本Yt2=[102.8,116.5,135.9,147.5,162.3,179,189.69,209.19,227.76],以Yt2預測添加數227.76的值。同理,直到預測完樣本中的最后一個數值298.60。這4個模型的平滑系數α分別為0.17、0.10、0.10、0.12,預測結果見表3。

表3 新陳代謝指數平滑模型相關數據
由表3可知,新陳代謝指數平滑法的平均預測誤差為3.3415%,比傳統三次指數平滑法的4.7782%降低了30.0688%,尤其是后期預測誤差減小幅度更大,最近3年的預測誤差均小于1%。而預測模型的性能優劣主要表現在后期預測誤差上。由此可見,新陳代謝指數平滑法效果是很顯著的。兩個模型的預測曲線見圖3,可見新陳代謝指數平滑模型預測曲線更接近實現曲線。

圖3 我國茶葉產量預測曲線及比較
預測2021年和2022年我國茶葉產量。以2020年為基年,由表2中的相關數據at、bt,ct的值,根據式(6)計算2021年、2022年(T=2、3)我國茶葉產量的預測值。
傳統指數平滑模型預測值為:
Y2021=299.5871+17.47612×2+0.316733×4=335.8063。
Y2022=299.5871+17.47612×3+0.316733×9=354.8666。
新陳代謝指數平滑模型預測值為:
Y_2021=287.6700+13.42567×2+0.233516×4=315.4554。
Y_2022=287.6700+13.42567×3+0.233516×9=330.0487。
傳統指數平滑模型預測2021年的漲幅達12.4602%,而2020年的增幅才6.8948%,顯然,傳統指數平滑模型預測值太高,可信度不大。新陳代謝指數平滑模型預測的增幅為5.6448%。基數越大,增長越慢。新陳代謝指數平滑模型預測增幅與2020年接近,比較合理,可信度較高。
茶葉種植是我國農業生產的重要組成部分,做好茶葉種植是推動農業產業化發展的有效途徑。此外,茶葉種植還有綠化植被、涵養水源、改善土質的作用,對保護生態環境具有積極的影響。科學預測我國茶葉產量,有助于穩定種植面積、優化種植結構、促進種植技術發展、提高茶葉品質和效益、推動我國茶葉產業健康發展。運用新陳代謝三次指數平滑法預測我國茶葉產量,取得了很好的效果,平均預測誤差為3.3415%,比傳統三次指數平滑法的4.7728%減小了30.0688%,最近3年的預測誤差均小于1%。由模型預測得到2021年和2022年我國茶葉產量分別為315.4554萬噸和330.0487萬噸,這一預測結果也比傳統三次指數平滑法要合理、可靠。研究對科學預測我國茶葉產量具有一定的參考價值。