李干瓊,許世衛,李哲敏,董曉霞
(中國農業科學院農業信息研究所 農業部智能化農業預警技術重點開放實驗室,北京 100081)
我國是世界水果生產大國,產量多年穩居世界第1。水果產業在我國農業產業中占據重要地位,是繼糧食、蔬菜之后的第三大農業種植產業,也是許多地方農民致富的支柱產業。近年來我國農產品市場波動風險加大,包括水果在內的多種農產品市場價格循環漲跌時有發生。2006年上半年豬肉價格持續下跌,2007年下半年出現暴漲,2009年上半年又大幅度下降,2010年低位運行,2011年又出現暴漲,據農業部監測2011年7月份全國批發市場豬肉價格漲至每公斤26.0元以上,價格波動如此之大實屬罕見。近兩年尤為突出,2010年上半年相繼出現大蒜、玉米、辣椒、綠豆、生姜等農產品價格暴漲,再到下半年的棉花、白糖、蘋果的大幅上漲;2011年4月份山東卷心菜價格一度跌至每斤8分錢,5月份海南香蕉經歷了過山車,香蕉價格一個月內從每公斤6.8元跌至1.2元。在我國經濟走向市場化、國際化的今天,較大的農產品市場風險已嚴重影響到農業的穩定和國計民生。因此,科學分析我國水果市場收益率分布(或稱市場價格波動率分布),有助于準確分析與研判市場價格風險,為農業管理部門提供決策依據。
假設變量x的概率密度函數為f(x),且f(x)=F'(x),∫f(x)dx=1,則有:

其中,K(·)為kernel函數,K(u)=I(||u≤1/2),滿足條件:∫K(x)dx=1;∫xK(x)dx=0;∫x2K(x)dx<∞ 。h為窗寬(bandwidth)。可知,核密度估計需要選擇核函數和窗寬。常見的kernel函數有以下4種:
③二次核函數(Quadratic kernel(p=4)):
④三角核函數(:K(x)=(1-|x)I|x|≤1
選擇合適的窗寬是核函數密度估計的關鍵所在。理論上,最優窗寬的選擇是基于估計密度與真實密度之間誤差最小來考慮的,即的MSE最小。MSE可表示如下:


可以證明:

當n→∞時,h→0,nh→∞,這時有

故式(2)又可表示為:

在實際應用中,常用的窗寬選擇方法有4種:least squares cross-validation method(簡稱LSCV法;Rudemo,1982;Bowman,1984)、拇 指 法(rule-of-thumb;Silverman,1986)、插 入 法 (plug-in)、LCV 法 (likelihood cross-validation)。本研究最優窗寬h的選擇采用LSCV法,即ISE滿足:

式(6)中的窗寬h初始值選取可采用采用拇指法確定,即h1=1.06σn-1/5或h2=0.9An-1/5,其中A=min(σ,R/1.34),σ是樣本標準差,R是上分位數(0.75)和下分位數(0.25)的區間值。由于σ易受樣本離群數據(outliers)的影響,故采用h2作為初始值。由于密度函數估計結果對窗寬h的選擇更為敏感,而對核函數的選擇不敏感,因此本研究中kernel函數采用高斯函數。
采用核密度估計得到農產品市場收益率的概率密度函數后,累積概率密度函數可表示為依據指定的波動區間,可計算相應的概率為:

本研究水果主要包括富士蘋果、甜橙、鴨梨、國光蘋果、蜜桔、香蕉、西瓜、菠蘿、臍橙、巨峰葡萄、蘆柑、桃子等12個品種。原始價格數據來源于農業部522個定點批發市場的日價格監測數據,全國日批發市場價格為522個批發市場大宗價的加權平均,全國月度批發市場價格采用全國日價格的平均值,數據起止期間為2000年1月~2010年12月。
關于市場收益率的表示方法有算術收益率和對數收益率兩種方法,本質上沒有區別,也不影響收益率分布的估計。本研究采用算術收益率表示(價格波動率),用Pi,t(i=1,2,…,12)分別表示12種水果的價格序列,則收益率可表示為:Ri,t=(Pi,t-Pi,t-1)/Pi,t。
表1為水果品種市場收益率(價格波動率)的基本統計量。可以發現:1)富士蘋果、鴨梨、臍橙市場收益率為偏度值為負,表明其市場收益率的概率密度分布為左偏分布,其他9個品種為右偏分布;2)12個水果品種的峰度值均大于3,表明都呈“尖峰厚尾”分布。3)標準差來看,桃子價格波動最為劇烈,其次為甜橙;(4)JB統計量表明,甜橙、鴨梨、蜜桔、西瓜、蘆柑和桃子等市場收益率明顯不服從正態分布。

表1 水果市場收益率基本統計量分析
本研究采用的軟件為R2.11.1,結果如下:
根據序列Ri,t,采用LSCV法和拇指法確定的窗寬如圖1所示。其中,hopt表示根據LSCV法確定的最優窗框,h表示根據拇指法確定的窗框。由CV曲線圖可以看出(根據式(6)計算),大多數情況下拇指法確定的窗框h不是最優的,只有CV值為曲線最低點時所確定的窗寬才是最優的。圖1表明,只有富士蘋果和國光蘋果采用兩種方法確定的窗寬是無差異的,其他品種由LSCV法確定的窗寬都要優于拇指法。

圖1 基于LSCV法和拇指法確定的不同水果品種窗寬比較

圖2 不同水果品種市場的收益率分布
根據最優窗寬值(hopt),得到不同水果品種序列Ri,t的概率密度分布如圖2所示。從中可以看出,只有富士蘋果和國光蘋果比較接近正態分布,其他水果品種呈現“尖峰厚尾”分布比較明顯。其中甜橙、蜜桔、桃子等的收益率分布相類似,為明顯的右偏分布。
根據窗寬和核函數,由式(1)得到不同水果品種市場收益率(價格波動率)的概率密度函數分別如下:

根據式(7)、式(8)和式(9),計算的全國不同水果品種批發市場價格波動區間的概率值見表2。水果價格波動區間的制定參照了農業部有關農產品價格波動幅度界定標準,將監測預警的警級劃分為4個等級,即無警(0~±5%,用綠燈表示)、弱警(±5%~±10%,用藍燈表示)、中警(±10%~±15%,用黃燈表示)和強警(±15%以上,用紅燈表示)。表2可以得出幾點結論:1)大多數水果品種漲價的概率高于降價的概率,即出現價格上漲的概率在50%以上;只有香蕉和蘆柑的漲跌風險基本相當;2)從全國不同水果品種出現強警(紅燈區域)的情況來看,桃子的風險最大,出現概率高達69.93%;其次為西瓜,出現強警的概率為67.70%;巨峰葡萄和甜橙漲跌幅度在15%的概率也都在50%以上;香蕉的風險最小,出現強警的概率僅為9.76%。

表2 全國水果批發價格波動區間的概率值
通過本研究,可以得出以下基本結論:非參數核密度估計結果表明,不同水果品種的市場收益率分布存在差異,且不服從的正態分布,尤其甜橙、鴨梨、蜜桔、西瓜、蘆柑和桃子等與傳統經驗分布差異大;水果的市場收益率分布是不對稱的,本研究的水果品種中有10種漲價的風險要大于降價的風險,即漲價的概率為50%以上,只有香蕉和蘆柑2個品種的漲跌概率基本相當;水果總體上屬于季節性產品,不同上市季節價格差異較大,也即價格季節性波動尤為明顯,從全國不同水果品種出現強警(紅燈區域)的情況來看,桃子的風險最大,出現概率高達69.93%;其次為西瓜,出現強警的概率為67.70%;香蕉的風險最小,出現強警的概率僅為9.76%。
本研究采用非參數核密度估計得到了12種水果品種價格波動的概率密度分布,與傳統的參數估計結果相比更為準確,但也都是非條件的概率密度分布。條件概率密度分布(conditional density)能夠提供更加充分的信息,而農產品市場領域關于這方面的研究剛剛起步。
[1]Izeman AJ.Recent Developments in Nonparametric Density Estimation[J].Journal of the American Statisti?cal Association,1991,86(413).
[2] Jones MC,Marron JS,Sheather SJ.A Brief Survey of Bandwidth Selection for Density Estimation[J].Journal of the American Statistical Association,1996,91(433).
[3] Cao R,Delgado MA,Gonzalez-manteiga W.Nonpara?metric Curve Estimation:an Overview[J].Investigacions Economicals,1997,(2).
[4] Li Q,Racine J.Nonparametric Estimation of Distribu?tions with Categorical and Continuous Ddata[J].Journal of Multivariate Analysis,2003,(86).
[5] Li Y,Singii RS,Sun YG.Goodness-of-fit Tests of a Pa?rameric Density Functions:Monte Carlo Simulation Studies[J].Journal of Statistical Research,2005,39(2).
[6] Shabri A.Nonparametric Kernel Estimation of Annual Maximum Stream Flow Quantiles[J].Matematika,2002,18(2).
[7] 陳啟歡.中國股票市場收益率分布曲線的實證[J].數理統計與管理,2002,21(5).
[8] 封建強,王福新.中國股市收益率分布函數研究[J].中國管理科學,2003,11(1).
[9] 唐林俊,楊虎.滬深股市收益率分布特征的統計分析[J].數理統計與管理,2004,23(5).
[10] 曹志廣,王安興,楊軍敏.股票收益率非正態性的蒙特卡羅模擬檢驗[J].財經研究,2005,31(10).
[11] 張峭,王川,王克.我國畜產品市場價格風險度量與分析[J].經濟問題,2010(3).
[12] 王川.基于VaR的我國糧食期貨市場基差風險度量與分析[J].農村經濟與科技,2010,(7).
[14] 譚英平.非參數密度估計在個體損失分布中的應用[J].統計研究,2003,(8).
[15] 梁來存.我國糧食單產保險純費率厘定的實證研究[J].統計研究,2010,27(5).
[16] 李干瓊,許世衛,李哲敏等.中國蔬菜市場價格短期波動與風險評估[J].中國農業科學,2011,44(7).