張莉莉 趙喜梅
摘 要:本文從建模的角度分析“碧玉”獼猴桃果實縱橫徑的生長數據,給出適合該數據的一種非線性SUR模型。將縱徑和橫徑的生長看成一個整體,利用非線性SUR模型模擬其生長過程,通過R語言編寫程序,求出模型中參數的極大似然估計及模型的擬合優度。得到獼猴桃果實縱徑和橫徑的生長曲線,說明本文非線性SUR模型的有效性。
關鍵詞: 非線性;SUR模型;獼猴桃;生長曲線
中圖分類號:O212 文獻標識碼:A DOI:10.11974/nyyjs.20180333003
引言
SUR(Seemingly Unrelated Regression)回歸模型[1]也稱半相依回歸模型,是聯立方程模型,方程之間因誤差項的跨方程相關而互相聯系,在生物、遺傳、醫學等領域都有重要應用[2]。有關SUR模型的統計研究已有很多成果,如文獻[3-5],其中文獻[5]系統研究了線性和非線性SUR模型及其在醫學中的應用,并指出當模型中方程間的非線性函數形式不同時,SUR模型下的參數估計優于普通非線性最小二乘估計。
對植物及其果實的生長動態進行研究有助于掌握植物的生長發育規律,而植物生長曲線的擬合可以直觀的表現其生長動態。目前有關植物生長動態的研究已有大量成果,如文獻[6]在溫室與露地2種環境下對無核早紅葡萄的生長動態進行了比較研究,文獻[7]利用二次曲線分別對“碧玉”獼猴桃果實縱徑和橫徑的生長動態進行了曲線擬合。
針對文獻[7]提供的生長數據,本文基于非線性SUR模型,充分利用模型中不同方程提供的信息,將縱徑和橫徑的生長看成一個整體,利用R語言(版本3.3.3)編寫程序,運用擬牛頓算法(BFGS)得到了非線性SUR模型參數的極大似然估計值,繪制出“碧玉” 獼猴桃果實縱徑和橫徑的生長曲線,進一步分析了獼猴桃果實縱徑和橫徑的生長規律。
1 非線性SUR模型
一般的,非線性SUR模型的形式[8]為
(1)
其中,yi=(yi1,yi2,…,yin)為的觀測數據,ti=(ti1,ti2,…,tin)為的觀測時間,是待估參數向量,是非線性函數,ei=(ei1,ei2,…,ein)為的誤差向量,i=1,2,…,m,V為協方差矩陣。
本文考慮如下含2個方程的非線性SUR模型
(2)
其中是第1個方程中的待估參數,ai(i=0,1,2,3,4)是第2個方程中的待估參數;協方差矩陣表示∑與In的
Kronecker乘積,
模型(2)中的2個方程的非線性函數表達式不統一,且隨機誤差具有相關性 。如果不同方程的非線性函數表示不同群體的擬合曲線,則此模型表示第1個群體的擬合曲線為Logistic曲線,第2個群體的擬合曲線為多項式曲線,均可表示群體的“S”型生長曲線。
如記
則模型(2)可表示為
(3)
2 參數估計及擬合優度檢驗
記模型(3)中的未知參數向量為
,其對數似然函數為
其中,
本文中,模型(3)中未知參數向量包含11個參數,極大似然估計記為
要求其具體表達式很繁瑣,甚至有些參數的極大似然估計并求不出顯式解,對于具體的實際問題,可借助于計算機軟件求解更為方便。本文基于R語言利用擬牛頓算法(BFGS)求各參數的極大似然估計值。
將參數的極大似然估計值代入模型中各方程,便可得2個相關群體的擬合曲線,進而可對2群體的生長動態進行整體把握。對每一方程或群體的擬合曲線,利用決定系數
和統計量來
判斷曲線擬合的優劣程度,其中表示第個個體的實測數據,為擬合值。越接近于1,或對給定的顯著性水平,若,則表示曲線擬合的越好[9]。
3 獼猴桃果實生長趨勢分析
不同品種的獼猴桃果實,其生長曲線可能會不同。一般獼猴桃果實縱橫徑的生長趨勢呈“S”或“雙S”型曲線[10]。有關不同品種獼猴桃果實的生長曲線已有大量文獻對其研究,但大多都是單獨描述某一性狀且只描述其生長的動態變化過程,繪制出折線圖,并沒有給出擬合度較高的生長曲線。文獻[7]以直線和二次多項式分別對獼猴桃果實縱徑和橫徑的生長曲線進行擬合,盡管二次多項式的擬合優度R2較高,均在0.9以上,但實際上其擬合效果并不好。
同一果實的縱徑和橫徑的生長存在高度相關性,將縱徑和橫徑的生長看成一個整體,而不是孤立的分析他們各自的生長過程更符合實際。針對文獻[7]中的“碧玉”獼猴桃果實縱橫徑的生長數據(圖1、表1),縱徑與橫徑的相關系數為0.9883095,通過其散點圖(圖1)發現,縱橫徑的生長趨勢均呈“S”型曲線,利用R語言編寫程序對縱橫徑生長數據單獨進行曲線擬合,發現利用Logistic曲線和四次多項式曲線分別描述其生長趨勢效果較好。為使得擬合效果更好,本文選擇在非線性SUR模型(2)的框架下,將縱徑和寬橫徑的生長看成一個整體,充分利用不同方程提供的信息,在R語言中,根據擬牛頓算法,求出模型(2)中各參數的極大似然估計值(表2),進而得到縱 徑和橫徑生長的擬合數據(表1),擬合縱徑和橫徑的生長曲線(圖1),并求出模型的擬合優度(表2),為獼猴桃果實的生長發育過程提供一定的參考,也進一步說明本文模型的有效性。
根據參數的估計值(表2)可得,縱徑的擬合曲線為,橫徑的曲線為
。
兩曲線的擬合效果都很好(圖1),且擬合優度也較高,統計量都小于0.05水平下的臨界值,也都接近于1,優于文獻[7]的結果。
4 討論與結論
本文以“碧玉”獼猴桃果實縱橫徑的生長數據[7]為例,給出擬合曲線及曲線的擬合優度,從建模的角度描述了獼猴桃果實縱橫徑的生長過程,也說明了本文模型的有效性。
非線性SUR模型(1)將聯立的非線性方程看成整體來研究,不僅利用了其他方程提供的附加信息,而且可以得出模型中各方程的參數估計及不同方程間相關程度的估計,可用于描述方程內部具有方差齊性而跨方程間具有相關性的實際問題。
參考文獻
[1] Zellner A.An efficient method of estimating seemingly unrelated regressions and tests for aggregation bias[J].J.American Statistical Association,1962,298(57):348-368.
[2]張莉莉.簡約SUR模型參數的協方差改進估計[J].大學數學,
2011,27(2):119-122.
[3]馬鐵豐,王松桂.半相依回歸模型參數的協方差改進估計[J].工程數學學報,2008,25(6):1074-1080.
[4]張莉莉,史建紅.半相依線性回歸模型的影響分析[J].數學雜志,2010,30(1):137-144.
[5]梁洪川.似乎不相關回歸模型及其在醫學中的應用[D].太原:山西醫科大學公共衛生學院,2006.
[6]高美英,程麗麗,閆虎斌.溫室與露地無核早紅葡萄果實生長動態比較研究[J].山西農業大學學報(自然科學版),2007,27(1):42-45.
[7]張欣倩,尚永勝,李成業.“碧玉”獼猴桃果實生長動態及相關性分析[J].吉林林業科技,2016,45(2):10-13.
[8] Judge,Hill,Grittiths,et al.lntroduction to the theory and practice of econometrics(Second Edition)[M].New York:John Wiley & Sons,Inc,1988.
[9]范國兵.一種估計Logistic模型參數的方法及應用實例[J].經濟數學,2010,27(1):105-110.
[10]金方倫,周光萍,黎明,等.中華獼猴桃新蔓生長與果實生長發育動態分析[J].北方園藝,2013(21):12-17.
[11]茆詩松,王靜龍,濮曉龍.高等數理統計(第二版)[M].北京:高等教育出版社,2006.
[12]薛毅,陳立萍.統計建模與R軟件[M].北京:清華大學出版社,2007.
作者簡介:張莉莉(1981–),女,山西廣靈人,碩士,講師,研究方向:概率統計及其應用。