[摘 要]美國農戶(農場主)大豆種植意愿的變化對美國及全球大豆市場都具有很強的影響,研究美豆種植意愿的變化有助于我們對全球大豆市場的可能變化進行預判。本文根據美國農業部的數據報告,分析整理,結合三個與大豆種植意愿密切相關的因素構建一元回歸模型,并對預測性能進行比較分析。結果表明,基于上年度種植意愿的預測模型能夠解釋美國農戶大豆種植意愿76%的變化。而對這一模型的誤差分析發現,模型最大的兩次高估都發生在庫存處于相對極高的年份,而模型最大的兩次低估則發生在庫存處于相對極低的年份。
[關鍵詞]預測 美國 大豆種植意愿
一、引言
美國是世界上最主要的農產品生產和出口大國,而中國又是其出口的主要對象,我國每年從美國大量進口大豆、棉花等大宗農產品,中美兩國之間存在明顯的農產品進出口博弈關系。在這種博弈關系中,加強農業情報信息的分析研究,對于提高我們“知彼”的能力非常重要。本文從定量角度預測大豆種植意愿具有很強的現實意義。
國外基于美國農業部所提供的數據主要用于期貨市場的分析研究,而國內基于國外農業情報信息的定量研究目前還很少。李洪斌等人在收集1998-2008年美國農業部相關報告數據的基礎上,利用相關分析和回歸分析研究美國四種農產品(小麥、玉米、棉花、大豆)的季末庫存對大豆、玉米種植意愿的影響。為了進一步深入研究美國農場主(農戶)大豆種植意愿的變化,本文對1981-2009年美國農業部的相關報告數據進行收集,分析研究農產品比價、庫存消費比以及上年度種植意愿對美國農戶大豆種植意愿的影響,并構建預測模型來預測美國農戶的大豆種植意愿。
二、數據收集與整理
研究數據皆源自于美國農業部1981-2009年出臺的相關數據。美國農業部(簡稱USDA)按照周、月時間規律出臺各個農產品數據報告,包括大豆、玉米、小麥、棉花等農產品的出口銷售報告、供需報告,以及年度種植意愿報告。
美國農業部每年3月底發布全美農戶的大豆年度種植意愿(以總的種植面積來度量),為了研究USDA在之前的2月報告、1月報告、上一年12月報告以及上年度種植意愿報告中是否包含可以用于預測全美農戶大豆種植意愿的有用信息,作者在詳細整理上述報告的基礎上,計算出2月、1月和12月報告數據對應的庫存消費比數據和農產品比價數據。
由于美國大豆銷售的核心季節是每年大豆收獲后的12月份及次年的1月和2月,所以相關分析利用的農產品比價數據和庫存消費比數據都是來自上述三個月份的USDA報告。總體上,作者首先收集1980-2008年12月份大豆、玉米、小麥、棉花的價格及次年1、2月份的價格,計算各月份大豆與其他三種作物的比價(價格之比);然后收集美國及世界1981-2009年這四種作物在大豆核心銷售季節的總供給量、季末庫存量,計算各種農產品的季末庫存消費比;另外搜集USDA在1981-2009年3月底種植意愿報告給出的大豆種植意愿。
三、數據相關分析
影響大豆種植意愿的因素有很多,如農產品補貼政策、氣候環境、農產品比價因素(反映競爭作物相對種植收益)及季末庫存等等。本文主要關注農產品比價、季末庫存及上一年度的種植面積對本期大豆種植意愿的影響,預測模型的自變量從大豆滯后一期種植意愿(即上年度種植意愿)、四種農作物的季末庫存和比價進行選擇確定。
1. 比價與種植意愿相關分析
根據12月、1月和2月USDA報告都可以計算大豆玉米比價、大豆棉花比價、大豆小麥比價。在相關分析之后,我們發現12月報告計算得到的比價序列與大豆種植意愿之間的相關系數,明顯高于1月和2月報告獲得的比價序列與大豆種植意愿的相關系數。這表明,USDA的12月報告相對次年的1月和2月報告,對分析次年3月的大豆種植意愿具有更高的價值。所以,后面相關分析的結果都是基于12月報告給出的,而回歸預測和組合預測采用的比價數據也都是基于12月報告。由表1的結果可以看出,三種比價中,大豆棉花比價與大豆種植意愿的線性相關性最高,相關系數為0.4685。所以,在后面的預測建模中選擇大豆棉花比價作為一個自變量(記作 ,)。
2. 大豆種植意愿的自相關分析
由于農戶(農場主)可以具有一定的種植習慣(慣性),所以本文還對大豆種植意愿時間序列進行了自相關分析。結果表明,農戶本年度的種植意愿與上年度大豆種植意愿具有很強的正相關性(相關系數為0.873),但與更早年份的種植意愿相關性很弱。這一結果說明,上年度的大豆種植意愿對分析本年度的大豆種植意愿具有非常高的價值。因此,后續的預測分析中將上年度大豆種植意愿(滯后一期的大豆種植意愿)作為自變量(記作)。
注:① 相對于1月和2月報告,由12月份報告計算得到的比價序列、庫存消費比序列與大豆種植意愿序列具有更強的相關性,因此本表僅給出了基于12月報告計算得到的比價序列、庫存消費比序列與大豆種植意愿序列的相關系數;② 進行相關分析的原始數據都是來自USDA相關數據報告。
3. 農產品季末庫存消費比與大豆種植意愿相關分析
基于美國農業部12月、次年1月和2月報告(1980-2009),我們收集并整理出大豆、玉米、小麥、棉花四種旱作農產品的美國季末庫存消費比序列與全球庫存消費比序列。然后分別計算不同月份四種農產品全球和美國庫存消費比與美國農戶大豆種植意愿的相關系數。結果發現,相對次年1月和2月報告,12月報告計算出的庫存消費比序列與美國農戶大豆種植意愿具有更強的相關性。這說明上年12月報告的庫存消費比數據相對1月和2月報告,在分析美國大豆種植意愿時具有更高的價值。表1是相關分析的具體結果。由表1還可以看出,相對其他三種農產品,美國大豆季末庫存消費比與種植意愿的相關性最強(線性相關系數為-0.4227)。此外,相對四種農產品的全球季末庫存消費比,美國大豆季末庫存消費比與大豆種植意愿的相關性也是最強的。所以,后續的預測分析中,美國大豆庫存消費比將作為預測模型的自變量,記為。
四、預測研究
通過前面的相關分析,我們選擇大豆棉花比價、上年度美國大豆種植意愿和美豆季末庫存消費比作為美國大豆播種意愿預測研究的自變量。在預測建模過程中,首先利用三個自變量分別建立線性回歸模型,然后利用三個一元線性回歸模型進行組合來構造組合預測模型。
1. 基于大豆棉花比價建立一元線性回歸模型(模型1)
建立一元線性回歸預測模型,其中、是未知參數,表示第年大豆棉花比價(預測本期種植意愿用到上一年度12月份的比價信息,t從1981—2009年)。對一元回歸模型擬合得預測模型。檢驗通過,回歸模型顯著;該模型的可決系數為0.2195;另外得到的一組預測值,其絕對誤差百分比的標準差為4.507,平均絕對誤差百分比為7.788。
2. 基于滯后一期大豆種植意愿建立一元回歸模型(模型2)
建立一元線性回歸模型,模型擬合結果為=7002,=0.89872,繼而得到回歸模型。 檢驗通過,回歸模型顯著;該模型的可決系數為0.76246,表明該模型可以解釋美國農戶大豆種植意愿76%以上的變化;的絕對誤差百分比的標準差為3.328,平均絕對誤差百分比為3.732。
3. 基于美豆季末庫存建立一元回歸模型(模型3)
模型3中應選擇美國大豆季末庫存消費比作為自變量,建立一元線性回歸模型:。確定未知參數和的值,得回歸模型。檢驗通過,回歸模型顯著;計算得該模型的可決系數為0.17866;的絕對誤差百分比的標準差為4.120,平均絕對誤差百分比為8.390。
對上述單一回歸模型分析發現,模型1和模型3僅能解釋種植意愿20%左右的變化,而比價和庫存本是影響種植意愿的兩個主要因素,其解釋能力很小的內在原因要充分考慮到美國政府的農業相關政策等。模型2的自變量解釋能力高達70%以上,其誤差百分比的標準差及平均誤差百分比在三個單一線性回歸模型中也是最小的。為尋求更好的預測模型以達到更好的預測效果,因而考慮建立組合模型來進行預測。一般而言,組合預測模型能夠綜合各單項模型的信息,以產生更好的預測結果。
4. 性能比較與誤差分析
由表2的數據可以看出,基于滯后一期種植意愿的模型2對種植意愿的解釋能力最強,可決系數達76%,其平均絕對誤差和絕對誤差百分比的標準差也最小。這幾項重要指標說明在實際預測中,我們可以考慮主要采用模型2來進行預測。
模型2的平均絕對誤差百分比是3.732%,而圖1是模型2對1982至2009共計28年的誤差百分比歷史。由圖中可以看出,除1987年、1997年、2007年和2008年之外,其他年份模型2對美豆種植意愿的絕對誤差百分比都沒有顯著高于5%。為此,我們對這四年的情況進行了詳細分析,希望尋找這四年預測誤差特別大的原因。
模型2對2007年和1987年種植意愿的預測分別高出實際值13.4%和10%(參見圖1),是模型2對種植意愿的最大的兩次高估。2007年年初USDA對美豆庫存消費比預估為18.3%,處于過去10年的最高水平;而1987年年初USDA對美豆庫存消費比預估值為31.9%,處于過去10年的次高水平。模型2的兩次最大的高估,都是發生在庫存處于相對極高的年份。所以,在庫存處于相對極高的年份,利用模型2預測種植意愿,要充分警惕模型預測值過分高估的可能性。
模型2對1997年和2008年種植意愿的預測分別低于實際值8.2%和10%(如圖1),是模型2對種植意愿的最大的兩次低估。2008年年初USDA對美豆庫存消費比預估為6.2%,處于過去10年的次低水平;而1997年年初USDA對美豆庫存消費比預估值為6.1%,處于過去10年的最低水平。模型2的兩次最大的低估,都是發生在庫存處于相對極低的年份。所以,在庫存處于相對極低的年份,利用模型2預測種植意愿,要充分警惕模型預測值過分低估的可能性。
五、結論
本文通過對影響大豆種植意愿的三個主要因素進行分析,建立與此相對應的一元線性回歸模型,并對比分析各個模型的預測性能。在相關分析研究中發現,大豆棉花比價、美豆季末庫存及上年度種植意愿與大豆種植意愿具有較強的相關性。其中,美豆種植意愿與上年度種植意愿相關性最強,與美豆季末庫存次之,與大豆棉花比價最次。美豆庫存與大豆種植意愿負相關,這與文獻的結論一致。不過本文發現美豆種植意愿與上年度種植意愿有更強的相關性,是本文不同之處。
全部數據集僅28年(28個數據點),不適合進行擬合參數過多的模型。所以,本文僅分別建立三個單變量(兩個參數)的一元線性模型,各自以比價、庫存和上年度種植意愿為自變量。三個模型對比后發現,基于上年度種植意愿的線性預測模型預測效果最好,可決系數達76%。而基于比價的模型解釋能力最小,僅為20%左右。其中原因可能是美國政府對不同農產品的補貼不同,導致比價不能很好地反映相對種植收益。
本文還對利用上年度種植意愿預測當年度美豆種植意愿模型的誤差進行了詳細分析,發現模型最大的兩次高估都發生在庫存處于相對極高的年份,而模型最大的兩次低估則發生在庫存處于相對極低的年份。所以,利用基于上年度種植意愿的模型預測種植意愿,在庫存處于相對極低的年份,要充分警惕模型預測值過分低估的可能性;反之,在庫存處于極高的年份,要充分警惕模型預測值過分高估的可能性。
參考文獻:
[1] 李洪斌 曹曉飛:農產品庫存對全美農戶大豆種植意愿的影響, 商場現代化, 2009, 33
[2] 李洪斌 葉 飛:農產品庫存對全美農戶玉米種植意愿的影響, 商場現代化, 2009, 26
[3] 美國農業部a. 油籽世界市場與貿易月度報告, 1981-2009, 3
[4] 美國農業部b. 種植意愿報告, 1981-2009
[5] 美國農業部c. 谷物世界市場與貿易月度報告, 1981-2009, 3
[6] 美國農業部d. 棉花世界市場與貿易月度報告, 1981-2009, 3