鄭 春 茂
(國家林業(yè)局華東林業(yè)調(diào)查規(guī)劃設(shè)計院 浙江杭州 310019)
假定隨機變量y與x滿足下列模型:

式中:y為應(yīng)變量;x位自變量;ε表示回歸模型的誤差項。采用普通回歸建立模型的先決條件,誤差項ε必須滿足“零數(shù)學(xué)期望、獨立、等方差”3個基本假設(shè),才能獲得模型的最優(yōu)估計。而誤差項的方差經(jīng)常會隨著自變量的變化,產(chǎn)生規(guī)律性的增加或減少,回歸模型不滿足“等方差”的條件,也就是回歸模型存在異方差性,就不能獲得最優(yōu)估計。
為解決誤差項ε的異方差性問題,應(yīng)設(shè)法校正原有的模型,使校正后的模型其誤差項具有常數(shù)方差,而模型的校正取決于方差與自變量xi之間的關(guān)系。假設(shè) εi的方差與xi的函數(shù)呈比例關(guān)系,即:

這里2σ 是一個有限常數(shù)。于是用去除原有模型,可使新模型的誤差項具有常數(shù)方差。用這種變換后的模型進行回歸估計,即為加權(quán)最小二乘法,簡稱加權(quán)回歸。


明確了權(quán)函數(shù)的結(jié)構(gòu)式以后,需要將生物量模型進行變換,要求模型變換后實現(xiàn)系統(tǒng)誤差(σ)最小,使用表達式描述為:

上式可以化為:

從(5)式可以看出,系統(tǒng)誤差最小的理想情況為:

也就是滿足下面表達式為最佳:

其中,f(x)為普通回歸的擬合值;M為樣本觀察值;D為胸徑;H 為樹高;V為材積。
生物量建模數(shù)據(jù),按樣本的部位可以分解為樹干、樹枝、樹葉和樹根,要求各部位單獨建立回歸模型,樣本樹枝的生物量因生長環(huán)境的不同,差異明顯,使用普通回歸的擬合結(jié)果存在異方差性,故選取2010年櫟類樹枝樣本數(shù)據(jù),采用加權(quán)回歸估計,并對估計結(jié)果進行分析和對比。普通回歸和加權(quán)回歸擬合過程使用中國林業(yè)科學(xué)院編制的軟件ForStat 2.0版。
實際用于生物量建模的櫟類樹枝樣本數(shù)量n=145,自由度p=3,使用回歸模型結(jié)構(gòu)式為:

其中,M表示生物量、D為樣本胸徑、H 為樹高、V為材積。
普通回歸的擬合結(jié)果如下:

附表一 普通回歸擬合結(jié)果表

按普通回歸擬合結(jié)果建立的回歸方程,可以計算櫟類樹枝生物量的擬合值由此可以建立櫟類樹枝的回歸方程:,再將生物量觀察值與擬合值相除,其結(jié)果作為加權(quán)回歸的觀察值:

根據(jù)權(quán)函數(shù)的變換方法,可以將回歸模型結(jié)構(gòu)式調(diào)整為:

按此模型結(jié)構(gòu)式進行回歸計算,得到加權(quán)回歸擬合結(jié)果:

附表二 加權(quán)回歸擬合結(jié)果表
加權(quán)回歸參數(shù)應(yīng)用于普通回歸方程,建立櫟類樹枝的加權(quán)回歸方程:

有許多指標對回歸模型的擬合結(jié)果進行評價,現(xiàn)選擇總相對誤差、總系統(tǒng)誤差、平均相對誤差、預(yù)估誤差、復(fù)相關(guān)系數(shù)等作為評價指標,對普通回歸和加權(quán)回歸的擬合結(jié)果進行分析對比,計算公式如下:


平均相對誤差:

預(yù)估誤差:

復(fù)相關(guān)系數(shù):

各項指標具體的計算結(jié)果如下:

附表三 回歸模型評價指標
從表中分析,采用加權(quán)回歸,擬合結(jié)果的總相對誤差、總系統(tǒng)誤差、平均相對誤差指標不同程度下降,而預(yù)估誤差、復(fù)相關(guān)系數(shù)等指標有所提高,說明使用模型本身構(gòu)造權(quán)函數(shù)對模型的變換,不僅消除了普通回歸存在的異方差性,同時可以提高模型擬合結(jié)果的質(zhì)量。
[1] 唐守正.多元統(tǒng)計分析方法.北京:中國林業(yè)出版社,1984.
[2] 張會儒,唐守正,胥輝.關(guān)于生物量模型中異方差問題.林業(yè)資源管理,1999,01.
[3] 曾偉生,駱期邦,賀東.論加權(quán)回歸與建模.林業(yè)科學(xué),1999,35.