李林漢 韓祝華
摘 要:多元線性回歸模型是根據得到的若干有關變量的一組數據,尋找因變量與多個自變量之間的一個函數,使這個函數對那組數據擬合的最好。然后利用方差分析方法對模型誤差進行分析,對擬合的優劣給出評價,本文利用此種方法對荒漠區不同干擾下植物地上生物量的變化趨勢進行研究,對實際的生態環境提出一些合理建議。
關鍵詞:多元線性回歸;數據擬合;荒漠區植物;生物量
1 概述
生態研究與資源利用是分不開的,荒漠區是我國典型的溫帶荒漠和干旱脆弱生態系統,生態環境條件十分嚴酷,其中荒漠區的植物生物量在荒漠區域中扮演著重要的角色,荒漠區中的植物生物量不僅對于動物的生存有影響,對于荒漠區中的生態環境也有影響。荒漠植被類型和條件與植物量之間存在關系。植物的高度蓋度密度是影響植物量的因子,在不同的干擾下,這種相關性與關系程度也存在一定的差異。因此對于荒漠區植物生物量的研究具有重要的意義。
本文通過對[1]中數據進行擬合分析,發現不同植物的植物量與其高度蓋度密度的關系符合回歸模型[2],由此可以通過回歸分析建立相應的模型并引入相關系數[3]進行求解。在求出生物量對高蓋密的回歸模型后,必須考察一下是否真的能由所得的模型來較好的擬合生物量,用模型能否較好的反映或解釋生物量的取值變化?對這些,都必須予以正確的評估和分析。判定系數在這里就是一個很好地指標:一方面它可以從數據變異的角度指出可解釋的變異占總變異的百分比,從而說明回歸直線擬合的優良程度;另一方面,它還可以從相關性的角度,說明原因變量生物量y與擬合變量的相關程度,從這個角度看,擬合變量與原因變量的相關度越大,擬合直線的優良度就越高。判定系數是指可解釋的變異占總變異的百分比,用R表示,它的范圍在0到1之間;當R2=1時,原數據的總變異完全可以由擬合直線的變異來解釋,即擬合點與原數據完全擬合;當R2=0時,回歸方程完全不能解釋原數據的總變異,生物量的變異完全由與高蓋密無關的因素引起。
2 多元線性回歸模型的建立
[(1)]
式中β0,β1,β2,β3都是與x1,x2,x3無關的未知參數,其中β0,β1,β2,β3稱為回歸系數。
根據[1]中過牧區7月份草本植物的88個數,(y1,xi1,xi2,xi3)(i=1,2,...,22)
由(1)得