陶 冶
(杭電信工學院 浙江 杭州 310000)
一元線性回歸分析教學改進策略
陶 冶
(杭電信工學院 浙江 杭州 310000)

一元線性回歸分析是建立兩個有因果關系的變量之間的回歸模型的方法,是最基本、簡單、常用的回歸分析,在統計學、管理統計學、應用統計學等課程中占有舉足輕重的地位。傳統的一元線性回歸分析的教學存在兩個弊端:一是對于普通學生來說,計算非常復雜、繁瑣且容易出錯,尤其是樣本容量比較大時,學生更是厭煩、討厭這個內容;二是實例與學生實際相去甚遠,學生感受不到實例的實用性、有效性,難以引起學生的興趣,而能夠引起學生的興趣的實例往往樣本容量又比較大。
信息技術的普及為克服這兩個弊端提供了解決途徑,不要說專門的統計軟件,就是Excel,都有一元線性回歸分析功能,互聯網上可以找到大量的數據,只要確定因果關系,就能夠進行一元線性回歸分析。鑒于此,筆者改進了一元線性回歸分析教學。
課堂上,筆者先詳細、完整地講述了一元線性回歸分析的原理和怎樣使用Excel進行一元線性回歸分析,然后從國家統計局網站得到1978~2010年中國人均消費和人均國民收入的數據,運用Excel建立二者之間的一元線性回歸模型,檢驗合格以后,簡單應用,給學生展示了一次完整的一元線性回歸分析過程。最后給學生布置任務:自己選擇分析對象,收集數據,錄入Excel并且得到回歸模型,把整個過程做成一篇電子文檔。以下是很有代表性的一篇。
2.1 理論模型。一本書的頁數越多,表明紙張和印刷的成本就越高,為賺取一定的利潤,價格也就越高;反過來,頁數越少,生產成本就越低,價格就越低。所以書本頁數是原因,作為自變量,價格是結果,作為因變量,用YS表示書本頁數,用P表示價格,得到理論模型P=b0+b1YS+ε。
2.2 數據和散點圖。在學校圖書館網站查到17本書的頁數和價格,在Excel里得到散點圖,如圖1所示。

圖1 書本價格與頁數的關系散點圖
2.3 估計和檢驗模型
Excel輸出如下:

回歸統計M u l t i p l e R 0.4 8 9 9 2 5 R S q u a r e 0.2 4 0 0 2 7標準誤差 6.0 9 9 6 0 5觀測值 1 7
方差分析

D f S S M S S i g.F回歸分析 1 1 7 6.2 6 1 1 7 6.2 6 1 0.0 4 5 8殘差1 5 5 5 8.0 7 7 8 3 7.2 0 5 1 9總計1 6 7 3 4.3 3 8 8

C o e f f i c i e n t s 標準誤差 t S t a t P-v a l u e I n t e r c e p t 1 2.9 6 5 8 2 8.4 3 2 5 2 1.5 3 7 5 9 7 0.1 4 4 9 7 1 Y S 0.0 5 7 0 2 3 0.0 2 6 1 9 8 2.1 7 6 5 8 9 0.0 4 5 8 9 8
從而得到檢驗回歸模型如下:
P=12.97+0.06YS
R2=0.24 F=4.74
因為與t統計量對應的P值、F值的顯著性都小于0.1,所以兩個檢驗都通過,經驗回歸模型是可靠的。
2.4 應用模型。YS的系數含義:書本頁數每增加一頁,價格就會增加0.06元。
如果某本書的頁數是200頁,書本價格估計為24.97,解釋為“如果一本書頁數為200頁,合理的價格為24.97元”。