楊嘉龍,肖生苓
(東北林業大學 工程技術學院,哈爾濱 150040)
自國際林聯(IUFRO)1994年出版《國際森林監測指南》將生物量列為全球、區域和國家級森林資源監測的重要內容,越來越多的專家和學者提出了更新的生物量研究方法和理論,從變量選取到模型優化,生物量模型經歷了從線性到非線性的結構轉變。目前,應用最廣泛也最被認可的是建立非線性的相容性生物量模型[1-5]。非線性模型對生物量的擬合效果比線性模型好,模型評價指標更高,更加符合林木的生長規律。相容性生物量模型通過以總量或樹干生物量為基礎的分級控制理論,能夠很好的解決的總量和分量不相容的問題,而且模型檢驗指標滿足建模要求。
非線性生物量模型的構建不同于線性生物量模型,其中最主要的原因就是非線性模型中變量的方差非齊性,線性生物量模型的構建就是基于方差齊性的假設前提,模型的誤差項期望Eζ=0,得到線性模型的最優估計。而實際中,誤差項的方差隨自變量的變化而變化,如果忽略了模型中的異方差性,將會造成模型的參數估計值變化,不僅降低模型的估計精度,還會使估計值的檢驗和置信區間失效。為此,對模型的異方差檢驗和消除就顯得尤為重要。
由于調查數據往往存在測量誤差,以及樣本數據具有的個體差異性和建模模型的忽略因素,導致估計結果存在異方差性,在數據處理時,往往首先要檢驗誤差項間是否有異方差存在,從而不影響模型的建立和參數的估計。可采用的檢驗方法有:圖示檢驗法、帕克(Park)檢驗、巴特利特(Bartlett)檢驗、格萊澤(Glejser)檢驗、斯皮爾曼(Spearman)等級相關檢驗、戈德菲爾特-匡特(Goldfelt-Quandt)檢驗、布勞特-陪干-戈弗雷(Breusch-Pangan-Godfrey)檢驗、懷特(White)檢驗、ARCH(自回歸條件異方差)檢驗、Wald檢驗、拉格朗日乘數檢驗和似然比檢驗[6]。其中,比較常用的是圖示檢驗法、格萊澤(Glejser)檢驗、斯皮爾曼(Spearman)等級相關檢驗和懷特(White)檢驗。


圖1 幾種可能存在異方差的殘差示意圖
圖示檢驗法雖然簡單直觀,但是只能夠作為一種趨勢的判定,不能通過圖形看出引起異方差的變量,也得不到異方差的具體形式。
格萊澤(Glejser)檢驗是基于殘差和解釋變量間有顯著成立的關系,如果方程存在異方差,那么異方差與解釋變量的冪相關,假設異方差σi與第j個解釋變量的關系如下:
(1)
由于異方差σi是經過檢驗后計算所得,格萊澤利用殘差絕對值|ei|代替異方差σi,得到:
(2)
假如δ1=0,則可以認為異方差σ1與xi無關,即隨即擾動項ui的方差與xj無關;δ1≠0,則隨即擾動項ui的方差與xj的變化相關。異方差檢驗就轉化為對δ1是否為0的檢驗,用T檢驗,如果參數δ1顯著的不為0,則認為存在異方差。
此檢驗不僅能對異方差的存在作出判斷,而且還能得到異方差隨變量變化的具體形式,檢驗需要大量樣本數據,而且誤差項本身可能含有異方差。
斯皮爾曼(Spearman)等級相關檢驗不用考慮模型參數,類似于格萊澤(Glejser)檢驗,通過檢驗殘差和解釋變量是否有顯著關系,來判定異方差性。基于公式(1)將求得的隨機變量的殘差ei取絕對值,并與xi以升序或降序排列,按斯皮爾曼(Spearman)等級相關系數計算公式:
(3)
式中:Di=xi-ei,N為樣本個數。

檢驗需要對殘差和解釋變量進行排序,樣本容量過小會導致數據變異程度較大,降低檢驗可信度,而且此檢驗也無法給出異方差的具體形式[7]。
懷特檢驗能夠將殘差與不同形式的自變量結合起來,建立多元回歸方程,其基本多元回歸方程形式如下:
yi=δ0+δ1x1i+δ2x2i+δ3x3i+…+σnxni+ui。
(4)
再通過建立輔助回歸模型的方式來判斷回歸方程的異方差性,假設自變量含3種形式,其輔助回歸模型形式[8]為:

(5)
以上常用檢驗除格萊澤(Glejser)檢驗能得到異方差的具體形式,其余檢驗只能驗證異方差性,圖示檢驗可以依靠SPSS、SAS、MALTABLE等統計軟件直接給出,應用最為普遍。
通過上述檢驗,可以知道誤差項是否具有異方差性,而且異方差的存在并不影響普通最小二乘法(Ordinary Least Squares,簡稱OLS)估計量的無偏性,但是會造成估計量的方差變大,導致通常假設的檢驗值失效。所以,對已經驗證的異方差要采用辦法去消除,以保證得到的模型具有最優的無偏估計。通常采用加權最小二乘法(The Weighted Least squares,簡稱WLS)、改變變量形式或重新設定模型這三種方法,這里只介紹最簡單和最常用的方法——加權最小二乘法(WLS)。

應用加權最小二乘法消除異方差已被得到廣泛證實。采用加權最小二乘法最回歸估計在消除異方差的同時,能夠保證模型不含系統誤差,其權函數形式可由變量本身構造,方便適用[10]。模型的擬合結果與普通最小二乘法相比,各項指標均有明顯改善[11]。如果假定因變量yi的方差與自變量xi的某種形式成一定比例,權函數可以定義為wi=1/f(xi)消除異方差,但是要想得到準確具體的f(xi)形式就相對比較困難[12]。在實際應用WLS時,常以SPSS、Eviews等統計軟件為工具,繪制殘差圖或對消除異方差的權函數進行探討,理論上的最優權函數應該是與最大對數似然函數相應的取值[13]。
以77株落葉松樹干生物量建模數據為例,擬合的單木樹干生物量優勢方程形式為W樹干=a(D2H)b,用此經驗模型作為分析異方差的基礎模型,通過SPSS軟件繪制的殘差圖可以看出方程存在異方差性,如圖2(a)所示。

圖2 存在和消除異方差的樹干模型殘差圖
對模型異方差的消除分兩個部分,首先是對經驗模型進行對數轉換,消除基于OLS下假設誤差期望為0而造成的參數偏小和異方差性,如圖2(b)所示。其次,建立樹干相容性生物量模型,做到總量和各分量和相等,為了消除模型間的度量誤差和異方差,要對干材和樹皮生物量方程進行非線性聯合估計,復雜生物量模型異方差的消除采取構造權函數的方法,鑒于一元回歸方程與二元回歸權函數方程對消除異方差的效果差別不大,這里采用由胸徑D和樹干生物量預估殘差值方差1.06構造的一元回歸方程作為權函數方程,即權函數為G=1/D1.06,模型通過決定系數(R2)、估計值的標準差(SEE)、平均估計誤差(MPE)、平均相對偏差(ME)、平均相對偏差絕對值(MAE)以及預估精度(P)作為選擇最優模型的檢驗指標。消除異方差的樹干生物量模型擬合和檢驗結果,見表1。
通過表1可以看出,消除異方差后的對數模型和相容性生物量模型SEE值減小,說明采用模型轉換和加權函數的方法是可行有效的,而且對模型的預估效果起到了很好的作用。

表1 消除異方差的樹干生物量模型擬合結果和檢驗結果統計
生物量建模過程中,往往存在著異方差性,會導致采用普通最小二乘法進行回歸所得估計值有偏,參數值和有效區間失真。這就需要對誤差項可能存在的方差性進行檢驗,并采取有效的消除方法,文章通過實例證明檢驗和消除異方差的方法是行之有效的,而且能夠保證系統模型的建模要求。
【參 考 文 獻】
[1] 唐守正,張會儒,胥 輝.相容性生物量模型的建立及其估計方法研究[J].林業科學,2000,36(1):20-27.
[2] 胥 輝,劉偉平.相容性生物量模型研究[J].福建林學院學報,2001,21(1):18-23.
[3] 羅云建.森林生物量的估算方法及其研究進展[J].林業科學,2009,45(8):129-134.
[4] 翟 暢,胡潤田,范文義.森林水源縣生態效益的估算與評價研究[J].森林工程,2012,28(4):69-72.
[5] 曾偉生,唐守正.利用度量誤差模型方法建立相容性立木生物量方程系統[J].林業科學研究,2010,23(6):797-802.
[6] 白雪梅.異方差性的檢驗方法及評述[J].東北財經大學學報,2002(6):26-29.
[7] 徐唐先.關于等級相關中斯皮爾曼公式[J].統計與決策,1995,22-23.
[8] 申屠惠良.使用懷特檢驗判斷生物量模型的異方差性[J].浙江林業科技,2012,32(3):43-45.
[9] 龔秀芳.回歸模型中異方差數據的處理[D].上海:華東師范大學,2002.
[10] 唐守正,胥 輝.關于生物量模型中的異方差問題[J].林業資源管理,1999(1):46-49.
[11] 鄭春茂.加權回歸及權函數的變換在生物量建模中的應用[J].華東森林經理,2012,26(2):77-79.
[12]胥 輝.生物量模型方差非齊性研究[J].西南林學院學報,1999,19(2):73-77.
[13]宋廷山,李 杰.回歸模型的異方差性消除方法探討[J].統計教育,2007(4):6-7.