劉 鋒,王利兵,徐振樞
(重慶理工大學數學與統計學院,重慶 400054)
小麥的抗倒伏性受許多外界和內部因素的影響,例如風力大小、種植密度、雨量等。這些指標對于小麥抗倒伏性產生不同情況的影響。但是,小麥自身的抗倒伏性對于小麥生產也至關重要,很多學者研究了農作物抗倒伏性與自身的指標之間的關系[1-5],例如文獻[1]利用通徑分析對抗倒伏性進行研究,文獻[2]研究了小麥形狀與抗倒伏性之間的關系,文獻[3]研究了小麥抗倒伏性在小麥生長的不同時期所造成的影響。通過增強小麥的抗倒伏性,可以更有效地讓小麥達到成熟,從而增加小麥產量。袁志華等[4]通過力學研究了農作物抗倒伏性,董琦等[5]通過基部莖節形態結構特征對抗倒性進行了研究。
根據資料:

上述公式中莖稈鮮重與莖稈重心高度都是可以通過測量得到的,而機械強度往往不容易獲得,因此,莖稈機械強度對于小麥抗倒伏性是非常重要的。
本文研究了小麥的機械強度與小麥自身各指標之間的關系,主要應用半參數變系數部分線性模型來對小麥機械強度與小麥自身各指標參數之間關系進行研究,從而建立機械強度(Ms)和小麥自身各指標之間的模型,提高小麥的機械強度(Ms),增強小麥的抗倒伏性。
半參數變系數部分線性模型的具體形式是:

顯然模型(1)包含了許多通常的參數、半參數和非參數模型,例如:當θ(·)=θ(其中θ是一個常向量)時,模型(1)退化成為一個線性度模型;當q=1,z=1時,則模型(1)退化為部分線性模型。
對于模型(1),需要對未知參數和未知函數部分進行估計。模型(1)有很多種估計方法,Zhang等[6]將模型分成線性部分和非線性部分,用兩部估計的方法得到參數與非參數的估計,并且證明了它們的最優收斂速度;Li等[7]用核函數和最小二乘的方法得到了參數與非參數的估計;Fang和Huang[8]用profile最小二乘方法得到了非參數的估計;Zhou和You[9]用最小二乘和經驗似然方法得到了參數與非參數的估計。
本文結合最小二乘估計和非參數估計的方法,得到參數 β =(β1,β2…βp)和非參數函數θ(·)=(θ1(·),θ2(·)…θk(·))的估計。
對于任意給定的 β =(β1,β2…βp),則模型(1)可以寫成

或者

則模型(1)成為一個變系數模型,可應用局部線性回歸技術估計函數。
對于任意給定的T0,局部線性趨近θ(T0),泰勒展開θj(T)得到:

應用權局部最小二乘法來找到 aj,bj,j=1,…,k,即極小化下式:

其中:Kh(·)=K(·/h)h是任意給定的核函數;K(·)是任意的核函數;h是帶寬。
令


因此

令


其中:


缺失數據在日常生活和科研中是常常遇到的,由于某些原因,使得原本完整的數據變成了缺失數據。分析中只能采用部分數據,而不能選用所有的數據。
對于缺失數據的分析,首先設定缺失指示變量,即

本研究是自變量的數據缺失,采用文獻[7]中所使用的方法,借補估計:

從而得到模型的借補值。
數據來源于2011年全國研究生數學建模數據c題,本文選取2007年矮抗58品種小麥的幾個不同時期生理指標作為研究對象,包括小麥各節長度、粗度,單個小麥的重心高度、莖稈壁厚、穗重等對小麥抗倒伏性研究較為重要的指標。
2.2.1 矮抗58乳熟期分析
首先選取一些指標,令:y為機械強度;x1為莖稈重心;x2為基部第5節長度;x3為基部第5節粗度;x4為基部第4節長度;x5為基部第4節粗度;x6為基部第3節長;x7為基部第3節粗度;x8為基部第2節長度;x9為基部第2節粗度;x10為莖稈壁厚;x11為麥穗鮮重。
對于以上指標,有些顯然有很強的相關性,那么就需要降維。本文采用因子分析方法。
由于存在不確實數據,需要用本文1.3節方法進行借補,然后進行相關性分析。之后對數據進行標準化,得到了如表1所示的相關系數矩陣。

表1 矮抗58機械強度與主要指標之間的相關系數矩陣
從表1可以看出,這些指標之間存在著很強的相關性,因此通過因子分析進行降維。通過數據模擬,得到前3個成分的累積貢獻率達到86.369%,取這3個成分進行分析,具體形式為 :


將得到的3個成分與小麥機械強度作散點圖,見圖1~3。

圖1 矮抗58第1成分與機械強度之間關系

圖2 矮抗58第2成分與機械強度之間關系

圖3 矮抗58第3成分與機械強度之間關系
從圖1~3可以看到,小麥機械強度與第1成分有較為明顯的線性關系,而第2、第3成分與小麥機械強度之間沒有具體的函數形式。
采用半參數變系數擬合數據,核函數選取為k(t)=15·(1-t2)2/16,窗寬選擇為 h=0.549 280 3,得到擬合方程為

將y的真實值與估計值比較,如圖4所示,其中實線代表真實值,虛線是估計值。從圖4可以看出大部分估計值符合實際情況。對于一些突出的點,由于源數據存在奇異情況,可以忽略。

圖4 y的真實值與估計值的比較
2.2.2 矮抗58開花期分析
下面分析開花時期的數據。與以上分析相同,首先得到如表2所示的相關系數矩陣。

表2 矮抗58開花期強度與主要指標之間的相關系數矩陣
同樣,采用因子分析的方法得到小麥品種矮抗58的機械強度與各個指標之間的關系。通過數據模擬,前3個因子組合的貢獻率達到了79.241%。取這3個成分為主成分,進行進一步分析,具體形式為:

可以得到3個成分與小麥機械強度之間的散點圖,如圖5~7所示。

圖5 矮抗58開花期第1成分與機械強度之間關系

圖6 矮抗58開花期第2成分與機械強度之間關系

圖7 矮抗58開花期第3成分與機械強度之間關系
由圖5~7可以看出,矮抗58小麥機械強度與第1成分是線性相關的,而與第2成分是無法得到具體函數形式的。這里核函數選取為

窗寬選擇為h=0.554 944 2。
應用非參數最小二乘估計,得到如下擬合方程:

將真實值與估計值進行比較,結果見圖8。其中實線代表真實值,虛線是估計值。

圖8 真實值與估計值模擬比較
由此可以得到各個時期的小麥的機械強度與小麥自身之間的關系。
同樣利用此方法也可以得到2008年與2011年的另外兩個小麥品種在這兩個年度中樣品的平均機械強度(機械強度的平均值),參見表3。

表3 3個年度2個小麥品種機械強度 kg
本文將半參數變系數部分線性模型應用到小麥抗倒伏性的研究中,獲得了對小麥抗倒伏性起到關鍵作用的機械強度指標的計算方法,得到的矮抗58小麥的抗倒伏性結果,對于今后小麥的抗倒伏性研究有一定的指導意義。
本文還有以下問題還需要進一步研究:首先,由于數據給定的范圍較為有限、樣本量有限等,模型的精度還有待進一步的提高;其次,選用模型的估計方法是最小二乘估計,這種估計方法對于邊界值的處理一般存在偏差,這也是為什么模擬的邊界值都存在很大的差異;最后,得到的數據很多是存在歧義的,雖然做了一些簡單的處理,但是結果不是很理想。
[1]田保明,楊光圣,曹剛強.農作物倒伏及其影響因素分析[J].中國農學通報,2006,22(4):163-167.
[2]王勇,李斯深,李安飛,等.小麥種植抗倒性的評價和抗倒性裝的相關與通徑分析[J].西北植物學報,2000,20(1):79-85.
[3]余澤高,李志新,嚴波.小麥莖稈機械強度與若干形狀的相關性研究[J].農業工程學報,2007,23(7):14-18.
[4]袁志華,馮寶萍,趙慶安,等.作物莖稈抗倒伏的力學分析及綜合評價探討[J].農業工程學報,2002,18(6):30-31.
[5]董琦,王愛萍,梁素明.小麥基部莖節形態結構特征與抗倒性的研究.[J].山西農業大學學報,2003,23(3):188-191.
[6]Zhang W,Lee W J,Song X.Local polynomial fitting in semivarying coefficient models[J.]J Multi Anal,2002,82:166-188.
[7]Li Q,Huang C J,Li D.Semiparametric smooth coefficient models[J].J Bus Econ Statist,2002,3:412-422.
[8]Fan J,Huang T.Profile likelihood inferences on semiparametric varying-coefficient partially linear models,Manuscript[D].Chapel Hill,USA:University of North Carolina,2002.
[9]You Jinhong.Gemai ChenEstimation of a semiparametric varying-coefficientpartially linear errors-in-variables model[J].Journal of Multivariate Analysis,2006,97:324-341.