摘 要 在線性回歸分析中,如果有兩個或兩個以上的自變量,就稱為多元線性回歸,多元線性回歸比一元線性回歸的實用意義更大。本文主要介紹了多元線性回歸的基本模型,參數估計及顯著性檢驗等,并對其應用價值進行了展望。
關鍵詞 多元線性回歸 參數估計 顯著性檢驗
中圖分類號:O212 文獻標識碼:A
0引言
回歸分析是研究統計規律的方法之一。在回歸分析中我們把所關心的一些指標稱為因變量,影響因變量的變量稱為自變量。回歸分析研究的主要問題是:確定因變量與自變量之間的定量關系表達式,這種表達式稱為回歸方程,然后對求得的回歸方程的可信度進行檢驗,判斷自變量對因變量有無影響,利用所求的回歸方程進行預測和控制。
1多元線性回歸模型及其檢驗
1.1多元線性回歸的基本理論
多元線性回歸分析的基本任務包括:根據因變量與眾多自變量的實際觀察值建立因變量對多個自變量的多元線性回歸方程;檢驗、分析各個自變量對因變量的綜合線性影響的顯著性;檢驗、分析各個自變量對因變量的單純線性影響的顯著性,選擇僅對因變量有顯著影響的自變量,建立最優多元線性回歸方程;評定各個自變量對因變量影響的相對重要性以及測定最優多元線性回歸方程的偏離度等。由于多數的多元非線性回歸問題都可以化為多元線性回歸問題,所以這里僅討論多元線性回歸。許多非線性回歸和多項式回歸都可以化為多元線性回歸來解決,因而多元線性回歸有著廣泛的應用。
1.2多元線性回歸模型
設變量與變量間有線性關系
(1)
其中和是未知參數,,稱模型(1)為多元線性回歸模型。
求參數的估計值,就是求自小二乘函數
達到最小的的值
可以證明其最小二乘估計
從而可得回歸方程為
1.3回歸系數的估計
回歸理論模型確定后,利用收集、整理的樣本數據對模型的未知參數給出估計。未知參數的估計方法最常用的最小二乘法,它是經典的估計方法。對于不滿足模型基本假設的回歸問題,人們給出了一些新的方法,如嶺回歸、主成分回歸、偏最小二乘估計等。但是它們都是以最小二乘法為基礎。但參數變量較多時,計算量很大,一般采用計算軟件,如TSP、SPSS、SAS等。
1.4顯著性檢驗
當模型的未知參數估計出來后,初步建立了一個回歸模型,但是這個模型是否真正揭示了被解釋變量和解釋變量之間的關系,還必須對因變量與多個自變量間的線性關系的假設進行顯著性檢驗,也就是進行多元線性回歸關系的顯著性檢驗。檢驗有兩種,一種是回歸系數的顯著性檢驗,簡單地說就是檢驗某個變量的系數是否為0;另一種檢驗是回歸方程的顯著性檢驗。簡單說就是檢驗該組數據是否適用線性方程做回歸。
2總結
本文主要介紹了多元線性回歸的基本模型,參數估計及顯著性檢驗等。它是多元統計分析中的一個重要方法,具有較大的應用價值,被廣泛用于眾多自然科學領域的研究中,例如經濟,金融等領域。
作者簡介:鄭強(1992-),男(漢族),河南省商丘市人,碩士研究生,長安大學,主要研究領域為:機器學習。
參考文獻
[1] 王松桂,陳敏.統計建模與R軟件[M].北京:清華大學出版社,2007.
[2] 冷建飛,高旭,朱嘉平.多元線性回歸統計預測模型的應用[J].統計與決策,2016(07):82-85.
[3] 王惠文,葉明等.多元線性回歸模型的聚類分析方法研究[J].系統仿真學報,2009,21(22):7048-7050.
[4] 王學民.應用多元統計分析[M].上海:上海財經大學,2004.