胡克滿,胡海燕
(寧波職業技術學院 a電子信息工程學院,b科技與產學合作處,浙江 寧波 315800)
隨著人們生活水平的日益提高,人們對茶葉的需求也越來越大,茶葉與可可、咖啡被視為世界上三大最受歡迎的飲料。根據歷史記載,我國在很早之前,古人就對茶文化有一定的研究,《茶經》等書籍是我國古人對茶文化進行研究留下的寶貴精神財富。我國也是茶葉重要的生產國和出口國[1]。據統計,2016年我國茶葉產量為243萬t,比2015年增加了18.1萬t[2]。我國茶葉生產地主要集中在亞熱帶地區,自然氣候對茶葉產量影響較大[3]。除了光照、雨水、溫度、濕度、土壤等自然因素,非自然因素也對茶葉產量有影響,例如:茶葉采摘面積、城市居民茶葉消費價格指數、城鎮居民人均可支配收入指數等人為因素引起的茶葉需求供求關系,影響當年的茶葉產量。無論對茶農還是銷售商而言,每年茶葉的產量都是人們最為關注的因子之一。氣候因素不受人為控制,茶農和銷售商的經濟來源一定程度上受自然氣候的影響,隨著衛星技術、計算機技術等的發展,目前國內的氣象預報也越來越準確,茶葉生產者可以根據天氣預報情況及時做出相應的補救措施。非自然因素引起的供需關系是大多數人始料不及的,比如在過去幾年中曾發生的大蒜、綠豆等因非自然因素導致的供需關系失衡。如何根據當年的非自然因素信息,對茶葉產量進行有效預測,從而避免不必要的經濟損失具有一定的現實意義。
隨著計算機和數學的發展,有關預測模型倍受國內外專家學者關注。徐江等[4]證明了灰色理論在汽車造型預測中的可行性;LEE等[5]利用灰色理論對能源的消耗進行了預測;孔雪等[6]對灰色預測模型應用現狀進行了綜述。張彪等[7]利用BP神經網絡對蘋果制干進行了評價;戶佐安等[8]運用BP神經網絡對交通信息量進行了預測。楊鋒等[9]運用灰色神經網絡模型對強力旋壓連桿的襯套屈服強度進行了預測;李彬楠等[10]運用灰色理論和BP神經網絡模型對土壤中的水分特征曲線進行了預測。綜上所述,無論是灰色理論還是BP神經網絡都在預測模型中發揮了重要的作用,但是由于計算和預測茶葉產量的過程受到很多因素影響,目前未見有較好的預測模型報道。本研究通過對影響茶葉產量的諸多因素進行分析,選取具有一定代表性的少量參數作為預測因變量。其中,自然因素包括平均光照時間、平均降水量、平均氣溫、平均濕度、土壤成分、蟲害等,非自然因素包括人為茶葉采摘面積變化、城市居民茶葉消費價格指數、城鎮居民人均可支配收入指數、茶葉認知等,但是這些信息仍然屬于部分信息。灰色系統理論可以在部分信息已知的條件下進行分析[11],因此可以利用該理論對茶葉產量進行預測。神經網絡的特征是具有適應性和自學能力強,文章將神經網絡與灰色理論結合進行優化,從而提高預測茶葉產量的精確度。
灰色理論數學模型具有利用部分信息、計算簡單等特征,是我國學者鄧聚龍教授提出的,將模型中無規律的數據進行變換處理成為有序的序列?;疑碚摂祵W模型針對原始數據序列進行累加,使得數據具有一定的規律性,再對其進行曲線擬合[12]。令時間數據序列為x0:
(1)
灰度模型對時間數據序列x0做累加后獲得新的數據序列x1,x1中第t時刻的數據為原始時間數據序列x0的前t項數據之和,即:
(2)
根據獲得的新數據序列x1,構建微分方程,得到
(3)
式中:a為發展灰數,u為內生控制灰數。
整理方程得到解為:
(4)


t=n,n-1,…,3,2。
(5)
由此可見,灰色數學模型是將時間序列數據x0直接轉換成為微分方程,利用系統信息進行模型量化,可以在獲得部分信息的情況下進行估算,獲得預測值。
人工神經網絡(artificial neural network,ANN)近幾年來在人工智能方面得到廣泛的應用,其主要特征為類似人腦的神經元網絡對信息進行處理,按照一定的規律構建模型,輸入層與輸出層之間以不同方式組成復雜的網絡結構,具有自適應性和自學習能力的特征。待處理的數據信息從輸入層輸入,通過隱含層的計算處理到輸出層輸出結果,任何一層的神經元裝填及其數據計算結果都會影響后面一層的數據處理結果。通常在輸出層和預期的結果進行比較,根據誤差反向傳播多次迭代直至達到誤差允許范圍內,或者完成設定的迭代次數[13]。BP神經網絡拓撲結構如圖1所示。預測函數的自變量為神經網絡的輸入參數,函數的因變量為神經網絡計算結果的輸出值。因此,神經網絡構成的函數映射關系為由n個函數自變量從輸入層輸入,產生m計算機結果從輸出層輸出。

x1,x2,…,xn為BP神經網絡的輸入參數,神經網絡的計算結果表示為Y1,Y2,…,Ym,BP神經網絡權值用ωij和ωjk表示圖1 BP神經網絡拓撲結構
對于多個變量參數的灰色神經網絡模型優化方程可以表示為:
(6)
式(6)中,y1為系統模型的輸出參數,y2,y3,…,yn為系統模型的輸入參數,a,b1,b2,…,bn-1為系統模型的方程系數。其時間相應函數為:
(7)
令
(8)
將式(7)和式(8)整理得到:
(9)
將整理得到的式(9)映射到BP神經網絡中,獲得n個輸入層參數及1個輸出參數預測值的灰色神經網絡優化模型,圖2為灰色神經網絡拓撲結構圖,根據若干個自變量計算獲得1個預測值。

x1,x2,…,xn為模型中的輸入參數,ωij、ωjk模型的權值,輸出層Y1為系統模型的輸出參數圖2 灰色神經網絡拓撲結構
基于灰色神經網絡的茶葉產量預測算法模型流程如圖3所示。其中,灰色神經網絡構建的輸入數據與輸出數據確定灰色神經網絡的結構。將非自然因素如茶葉采摘面積變化、城市居民茶葉消費價格指數、城鎮居民人均可支配收入指數等作為輸入數據,構成三維數組;預測值為當年的茶葉產量,為1維數組。

圖3 灰色神經網絡模型流程
系統模型以浙江省2001—2011年的茶葉產量、采摘面積、城市居民茶葉消費價格指數、城鎮居民人均可支配收入指數等作為輸入數據和輸出數據(表1)進行測試。所有數據均通過網絡查詢《中國年鑒統計數據庫》獲得,原始數據均來自歷年的《浙江統計年鑒》《中國統計年鑒》。
在預測過程中,特別注意輸入和輸出數據的選擇。本系統模型的訓練數據集由2001—2006年的原始數據組成,系統模型通過多次迭代后結果如圖4所示。

表1 2001—2011年浙江省茶葉產量情況
注:面積為茶葉采摘面積(103hm2);收入指數為城鎮居民人均可支配收入指數(上年=100);價格指數為城市居民茶葉消費價格指數(上年=100)。

圖4 系統模型多次迭代結果
將訓練權值作為對2008—2011年數據進行預測判斷的參數,并對茶葉預測產量與實際值進行比較,結果見表2。由表2可知,本文優化模型2008—2011年預測產量與實際產量的平均相對誤差為1.35%,2011年預測值與實際值較接近,而BP神經網絡模型預測產量與實際產量的平均相對誤差為4.47%,可見本文優化模型可有效預測茶葉產量,優化后的系統模型優于現有的BP神經網絡算法。

表2 2008—2011年浙江茶葉預測產量與實際產量
對茶農和經銷商等用戶而言,茶葉產量直接影響其經濟收入,而影響茶葉產量的因素較多,比如:光照、溫度、濕度、土壤、蟲害及非自然因素等,眾多影響因素導致人們無法很好地估算茶葉產量。本文通過灰度理論結合神經網絡系統的適應性及自學習能力,選取相對容易獲得的采摘面積、城市居民茶葉消費價格指數、城鎮居民人均可支配收入指數等數據作為估算參數,通過優化的灰色神經網絡模型進行產量預測,結果表明,優化后的系統模型能夠較好預測當年的茶葉產量。由于提供的歷年相關數據量有限,故其迭代和收斂效果相對偏弱。如果系統模型的訓練樣本足夠,獲得更多歷年相關參數,系統模型的迭代次數、函數的收斂性及預測值的評價誤差率可能更優。