肖鄭利
天津機電職業技術學院,天津 300350
?
運用Matlab和SPSS軟件求解回歸分析的比較研究
肖鄭利
天津機電職業技術學院,天津300350
在研究變量之間的相關關系時要用到回歸分析。本文以一個給定的線性回歸模型,分別介紹Matlab軟件和SPSS軟件求解過程,兩者的計算結果是一樣的。分析過程可知:Matlab的優勢是函數豐富、編程靈活;SPSS的優點在于界面友好、操作簡單。均為回歸分析提供了全面的解決方案
線性回歸;Matlab;SPSS;統計量
回歸分析是研究變量之間相關關系的數學方法,是將實際問題中體現的相關關系轉化為確定性關系來解決的過程。常見的實際問題有:生活中近似關系的表達,通過觀測數據對固定數值的預測和控制,根據測量數據對生產工藝進行優化等等。回歸分析按照自變量的數量可以分為一元回歸和多元回歸;按照方程形式可以分為線性回歸和非線性回歸。隨著計算機技術的應用發展,有多種軟件可以求解回歸方程并進行分析,常用的有數學軟件Mathematica、科學計算軟件Matlab、數據統計分析軟件SPSS和表格應用軟件excel等等。
本文以簡單的一元線性回歸為例,分別利用Matlab軟件和SPSS軟件求解分析,并進行比較研究。
首先給出一個實際案例。
考察溫度x對產量y的影響,測得下列10組數據

溫度(℃)20253035404550556065產量(kg)13.215.116.417.117.918.719.621.222.524.3
分析y關于x的線性回歸方程,檢驗回歸效果是否顯著。
(一)Matlab軟件介紹
Matlab軟件有總包和若干個工具箱,可以進行數值分析、統計、優化,可以完成信號處理、圖像處理等領域的計算和圖形顯示。它用函數形式將各類數學分支的算法分類,使用時可設計參數再選擇調用相應的函數,快速而準確的解決問題。
(二)Matlab軟件中回歸分析命令介紹
線性回歸的命令是regress,用以確定回歸系數的點估計值:b=regress(Y,X);求回歸系數的點估計和區間估計,并進行檢驗,直接用命令:[b,bint,r,rint,stats]=regress(Y,X,alpha),其中alpha是顯著性水平 ,缺省時默認為0.05,bint是區間估計,r是殘差,rint計算殘差的置信區間,stats記錄檢驗回歸模型的統計量,有四個數值分別是相關系數R 、F檢驗值、與F對應的概率P以及方差的估計值;還可以畫殘差計算其置信區間,命令為:rcoplot(r,rint)。這里面R 越接近1,則回歸方程越顯著;F值越大,也說明回歸方程越顯著;P小于 時,回歸模型成立。

(三)Matlab軟件求解上述案例
1.輸入數據:
x=20:5:65;
X=[ones(10,1) x'] ;
Y=[13.2 15.1 16.4 17.1 17.9 18.7 19.6 21.2 22.5 24.3]';
2.回歸分析及檢驗:
[b,bint,r,rint,stats]=regress(Y,X);
b,bint,stats
計算結果為:
b=
9.1212
0.2230
bint=
8.021110.2214
0.19850.2476
stats=
0.9821439.83110.00000.2333
即回歸模型為 成立。


3.殘差分析并作圖:
rcoplot(r,rint)
得到圖1。
z=b(1)+b(2)*x
plot(x,Y,'k+',x,z,'r')
得到圖2。
(一)SPSS軟件簡介
SPSS軟件是社會科學統計軟件,具有先進成熟、操作簡便的統計方法。它強大的統計分析過程,可以實現基本統計分析方法、多元統計方法和專業統計分析等功能。
(二)線性回歸的SPSS操作
線性回歸分析在SPSS Statistics數據編輯器窗口的具體操作有以下幾個步驟:首先是打開“線性回歸”對話框;然后在對話框中選擇變量;再進行相應的設置,逐一選取需要用到的統計量和圖形方式等內容;最后單擊“確定”,在SPSS Statistics查看器窗口得到線性回歸分析結果。
(三)SPSS軟件求解上述案例
第一步:從“文件”菜單中選擇“打開”、“數據”點擊,將事先保存在wps文件中的數據調用出來;
第二步:選擇“分析”菜單中的“回歸”、“線性”命令,打開“線性回歸”對話框,將“溫度”選入“自變量”,“產量”選入“因變量”;
第三步:單擊“統計量”按鈕,在“線性回歸:統計量”對話框中選中“估計”、“置信區間”,然后單擊“繼續”;
第四步:單擊“繪制”按鈕,在“線性回歸:圖”對話框中選中“直方圖”、“正態概率圖”,然后單擊“繼續”;
第五步:回到“線性回歸”對話框,單擊“確定”按鈕,完成操作。
于是在查看器窗口得到一系列輸出結果,選取其中案例需要的數據列出如表1-表2,同時得到圖3和圖4:

模型匯總b

表1

表2
從上述兩種軟件求解結果來看,我們發現不管是使用Matlab還是SPSS,計算的回歸系數、系數的區間估計、統計量中的相關系數、F值、與F對應的概率、方差的估計值等等都是一樣的。而求解過程兩者差別很大:Matlab是在視窗環境中編寫程序,進行數據分析、建模仿真,函數資源豐富,靈活性較強;SPSS是菜單操作,圖形交互式的友好界面操作簡單,強大的數據分析處理功能針對性較強。總之兩種軟件各有其優勢,均為回歸分析提供了全面的解決方案。
[1]趙靜,但琦.數學建模與數學實驗[M].高等教育出版社,2008.
[2]Cleve Moler.MATLAB數值計算[M].機械工業出版社,2006.
[3]陳勝可.SPSS統計分析從入門到精通[M].清華大學出版社,2013.
[4]張文彤,鐘云飛.IBM SPSS數據分析與挖掘實戰案例精粹[M].清華大學出版社,2013.
O212.1
A
1006-0049-(2016)18-0058-02