李 兆
(中國人民銀行哈爾濱中心支行,哈爾濱150001)
2005年的“阜陽奶粉事件”和2008年的“三聚氰胺”事件給勢頭正盛的中國奶制品行業帶來致命性打擊,受此影響,行業內不少企業生產停滯,奶制品總產量首次出現負增長。三鹿、蒙牛、雅士利、伊利等眾多品牌泥足深陷,消費者對國產奶粉失去信任,2009年開始嬰幼兒奶粉進口量出現爆發式增長。受到國際奶源價格、國內奶制品需求、進口奶粉數量、生產周期等因素的影響,原料奶價格出現了較大幅度的波動。原料奶價格關系到廣大奶制品企業和眾多奶農的生產和發展,同時關系到奶制品價格,對居民生活影響巨大。原料奶的未來價格走勢一直是理論研究的重點。近年,已經有多種方法應用于原料奶價格預測中,如Holt-Winters季節乘積模型、ARIMA模型、時間序列分析等。上述模型和方法不能對原料奶價格的非線性特征、周期性因素、突發性事件進行良好的解釋和預測,同時影響原料奶價格形成的因素眾多,無法全部量化研究?;诖吮疚倪x用了Elman神經網絡模型對原料奶價格走勢進行預測,并取得了良好的效果。
神經網絡是20世紀80年代由美國物理學家Hopfield提出的一種基于神經科學、數學、物理學等多個學科發展而來的技術。神經網絡通過模仿人腦神經元信息處理機制建立起數據處理模型,是對人類大腦的簡化和模擬。神經網絡由大量人工神經元相互連接進行計算,神經元可以根據外界數據的變化發生改變,連接各神經元的權值通過對信息的不斷學習發生變化,最終獲得解決問題的能力。
神經網絡可以通過對樣本的訓練實現從數據輸入到數據輸出的任意非線性函數關系的映射,通過這種映射得出數據的內在規律。神經網絡的特征有以下幾種。一是自學習、自適應性。神經網絡可以通過自主學習、訓練、發掘歷史數據隱含的規律,通過調節權值和閾值改變自身性質以適應環境。學習功能對時間序列預測具有重要意義。二是非線性特征。由于價格變化受到供需、政策、環境等復雜因素影響,傳統的線性預測模型往往難以在短時間內找出影響變量,對價格趨勢作出準確判斷。非線性的神經網絡可以對復雜的、缺乏規律的數據進行處理,具有無可比擬的優勢。三是容錯性。神經網絡對信息的儲存是分散的,每個神經元都接受信息并單獨進行運算輸出結果,因此網絡中局部神經元損壞不會影響神經網絡的整體功能。由于神經網絡具有上述特點,本文將使用該模型對原料奶短期價格走勢進行研究。
Elman神經網絡是一種典型的局部回歸網絡,它由輸入層、隱含層、連接層和輸出層組成。連接層有一個延遲單元,可以記憶過去的狀態,并在下一時刻作為隱含層輸入,因此該模型具有動態記憶功能,比較適合處理時間序列問題。假如采用前n期的數據預測第n期的數據,Elman網絡結構如圖1所示。

圖1 Elman網絡結構
Elman網絡將數據分為訓練樣本和測試樣本。抽取x1——xn作為第一個訓練樣本,這里用x1、x2…xn-1作為自變量,xn作為目標變量;抽取x2——xn+1作為第二個訓練樣本,這里用x2、x3…xn作為自變量,xn+1作為目標變量,以此類推。
原料奶屬于鮮活的畜牧業產品,價格在短期內波動幅度較大,影響因素包括產量、需求量、地理位置、稅收政策、天氣因素、成產成本、奶產品銷售價格等。傳統的計量模型在預測原料奶未來價格時往往會出現重要影響因素遺漏和政策因素難以量化成數據的問題,計量結果難以準確預測未來價格。神經網絡模型的自學習和非線性特征可以通過對網絡訓練尋找時間序列的隱含規律和特征,并將規律和特征在預測中延續下去。因此,可以采用過去的原料奶價格預測其未來價格。
本文整理了農業部市場與信息經濟司2009年1月至2017年11月每月發布的《農產品供需形勢分析月報》中原料奶月度平均收購價格,單位為元/千克,共計107個數據。為了加快模型訓練的收斂速度并消除各向量的量綱差異,避免預測誤差。首選使用mapminmax方法對矩陣進行歸一化處理,將矩陣的每一行處理成-1至1之間。
產量、需求量、地理位置、稅收政策、天氣因素、成產成本、奶產品銷售價格這些原料奶價格影響因素在短期內具有一致性。從原料奶價格走勢中也可以看出,每半年的價格變化趨勢是接近一致的。因此本文在構造樣本集時選擇每6個數據樣本作為自變量,第7個數據樣本作為目標變量。這樣,將原本107個數據向量轉化為7*101的矩陣,該矩陣每一列均為一個樣本。
本文將2009年至2016年的樣本數據作為訓練樣本,將2017年的樣本數據作為測試樣本。即將前90個樣本作為訓練樣本,后11個樣本作為測試樣本。
使用MATLAB神經網絡工具箱中的elmannet函數構建模型。神經網絡的隱含層神經元數量會影響網絡的預測能力。測試后,本文設置隱含層神經元個數為15個,最大迭代次數為2000次。訓練過程如圖2。

圖2 Elman網絡結構
將歸一化處理后的原料奶價格輸入Elman反饋網絡并進行訓練。對測試樣本和預測樣本進行測試和預測。因為進行測試時使用的是歸一化后的數據,這里將實際輸出結果反歸一化為正常的數據。訓練數據和測試數據的擬合效果如圖3所示??梢钥闯鐾ㄟ^訓練得到的Elman輸出值和訓練數據和測試數據本身擬合度很高。其中訓練數據的模型的均方差值為9.561e-4,測試數據模型的均方誤差值為3.776e-4。

圖3 擬合結果
本文選用了2017年的原料奶價格作為測試數據,輸入訓練好的Elman網絡模型中后得到預測值(見下表),測試樣本的相對誤差在0.07%至0.99%之間,模擬精度比較高。這表明訓練好的Elman網絡模型對測試數據也具有很好的適應性。該方法是測原料奶價格走勢的一個比較準確的方法。同時這種方法也可以運用于其他農畜產品價格預測中。

表 2017年原料奶價格預測結果
Elman人工神經網絡模型具有自適應、自學習的能力,能夠找到時間序列中輸入—輸出之間的非線性映射關系。實證結果表明,使用Elman神經網絡模型能夠較為準確的預測原料奶短期價格走勢,具有非常高的精準度,相對其他價格預測方法具有一定優勢。這一研究對原料奶價格建模和預測、幫助奶產品企業制定生產采購計劃具有理論和實踐意義。
參考文獻:
[1] 陳 思,錢貴霞.原料奶價格波動及其調控政策[J].農業展望,2011(6).
[2] 張喜才,張利癢.原料奶價格形成機制的特征、模式與政策建議[J].中國乳業,2010(4).
[3] 孫紅敏,吳靜婷,李曉明.基于改進BP神經網絡的價格預測模型研究[J].東北農業大學學報,2013(8).
[4] 賀艷輝,袁永明,張紅燕,等.基于神經網絡的水產品價格預測模型研究[J].農業網絡信息,2010(11).