廖樞華
回歸直線方程是新課改新增的內容之一,在必修3中直接給出了求回歸方程的有關公式,讓學生學會利用公式.在選修數學2-3的第42頁中,利用配方法給出了回歸直線的推導.但是由于推導過程比較麻煩,而且不是在必修3中出現,很多教師都只是按照課程要求指導學生利用回歸方程的公式求回歸方程.由于不知道公式的來源,這樣做只會給學生一種應試教育的感覺.讓學生覺得學習只是為了考試,學數學很乏味.劉坦老師的文章《回歸直線方程的另一種推導》[1]中的方法簡潔明快,但超出了高中學生的學習要求,史雄老師的文章《關于回歸直線方程的另一種簡單推導方法》[2]中都是利用導數以及求二元一次方程的思想求出回歸方程的兩個參數.如果學生在必修3之前學習了導數,這是一個簡易的方法.然而導數是選修2-2中的內容,一般我們都是把必修學完,才學習選修的內容.基于此,本文先利用樣本中心確定回歸直線的位置,再利用“從整體上看,各點與此直線的距離最小”的思想獲得一元二次函數,依據一元二次函數的特征求得斜率.該方法可以讓學生輕而易舉地了解回歸方程的來源.
一、確定回歸直線的位置
平均數反映一組數據的集中趨勢.能夠利用所有數據的特征是它的優點之一.除此之外,平均數能使得誤差平方和達到最小.如果利用平均數代表數據,則可以使二次損失最小.對所給的樣本數據的橫坐標與縱坐標分別取平均值x-、,則坐標點(x-,)稱為樣本中心.依據平均數的意義,樣本中心(x-,)反映了樣本數據的集中趨勢,所以回歸直線一定通過樣本中心(x-,).
二、求回歸直線的參數
設回歸直線的方程為y=bx+a.由于點(x-,)在回歸直線上,所以有=bx-+a.如果確定了回歸直線的斜率b,便可以通過=bx-+a得參數a=-bx-.
如何確實斜率b呢?依據數學必修3“從整體上看,各點與此直線的距離最小”得Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2,使得Q最小.把a=-bx-代入Q中
Q=(y1-bx1-+bx-)2+(y2-bx2-+bx-)2+…+(yn-bxn-+bx-)2
=(y1--bx1+bx-)2+(y2--bx2+bx-)2+…+(yn--bxn+bx-)2
=[(y1-)-b(x1-x-)]2+[(y2-)-b(x2-x-)]2+…+[(yn-)-b(xn-x-)]2
=(y1-)2-2×b(x1-x-)×(y1-)+[b(x1-x-)]2+(y2-)2-2×b(x2-x-)×(y2-)+[b(x2-x-)]2+…+(yn-)2-2×b(xn-x-)×(yn-)+[b(xn-x-)]2
=∑n1i=1(yi-)2-2b×∑n1i=1(xi-x-)(yi-)+b2×∑n1i=1(xi-x-)2.
=∑n1i=1(xi-x-)2×b2-2∑n1i=1(xi-x-)(yi-)×b+∑n1i=1(yi-)2.
Q為關于b的二次函數,因為樣本數據各不相同,所以∑n1i=1(xi-x-)2恒大于0,即二次函數Q(b)開口向上,有最小值Q,當且僅當b為對稱軸.因此,
b=--2∑n1i=1(xi-x-)(yi-)12×∑n1i=1(xi-x-)2
=∑n1i=1(xi-x-)(yi-)1∑n1i=1(xi-x-)2.
本文利用回歸直線恒過樣本中心的特點以及二次函數求最值的方法而得到回歸直線的兩個參數公式.該方法思路清楚,推理簡單,并且還能加深學生對回歸直線的理解——回歸直線恒過樣本中心.本人認為教材應該使用本文方法介紹回歸直線方程.
參考文獻
[1]劉坦.回歸直線方程的另一推導[J].數學通訊,2003(23):10.
[2]史雄.關于回歸直線方程的另一種簡單推導方法[J].新課程學習(基礎教育),2010(2):104.
(責任編輯黃桂堅)endprint
回歸直線方程是新課改新增的內容之一,在必修3中直接給出了求回歸方程的有關公式,讓學生學會利用公式.在選修數學2-3的第42頁中,利用配方法給出了回歸直線的推導.但是由于推導過程比較麻煩,而且不是在必修3中出現,很多教師都只是按照課程要求指導學生利用回歸方程的公式求回歸方程.由于不知道公式的來源,這樣做只會給學生一種應試教育的感覺.讓學生覺得學習只是為了考試,學數學很乏味.劉坦老師的文章《回歸直線方程的另一種推導》[1]中的方法簡潔明快,但超出了高中學生的學習要求,史雄老師的文章《關于回歸直線方程的另一種簡單推導方法》[2]中都是利用導數以及求二元一次方程的思想求出回歸方程的兩個參數.如果學生在必修3之前學習了導數,這是一個簡易的方法.然而導數是選修2-2中的內容,一般我們都是把必修學完,才學習選修的內容.基于此,本文先利用樣本中心確定回歸直線的位置,再利用“從整體上看,各點與此直線的距離最小”的思想獲得一元二次函數,依據一元二次函數的特征求得斜率.該方法可以讓學生輕而易舉地了解回歸方程的來源.
一、確定回歸直線的位置
平均數反映一組數據的集中趨勢.能夠利用所有數據的特征是它的優點之一.除此之外,平均數能使得誤差平方和達到最小.如果利用平均數代表數據,則可以使二次損失最小.對所給的樣本數據的橫坐標與縱坐標分別取平均值x-、,則坐標點(x-,)稱為樣本中心.依據平均數的意義,樣本中心(x-,)反映了樣本數據的集中趨勢,所以回歸直線一定通過樣本中心(x-,).
二、求回歸直線的參數
設回歸直線的方程為y=bx+a.由于點(x-,)在回歸直線上,所以有=bx-+a.如果確定了回歸直線的斜率b,便可以通過=bx-+a得參數a=-bx-.
如何確實斜率b呢?依據數學必修3“從整體上看,各點與此直線的距離最小”得Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2,使得Q最小.把a=-bx-代入Q中
Q=(y1-bx1-+bx-)2+(y2-bx2-+bx-)2+…+(yn-bxn-+bx-)2
=(y1--bx1+bx-)2+(y2--bx2+bx-)2+…+(yn--bxn+bx-)2
=[(y1-)-b(x1-x-)]2+[(y2-)-b(x2-x-)]2+…+[(yn-)-b(xn-x-)]2
=(y1-)2-2×b(x1-x-)×(y1-)+[b(x1-x-)]2+(y2-)2-2×b(x2-x-)×(y2-)+[b(x2-x-)]2+…+(yn-)2-2×b(xn-x-)×(yn-)+[b(xn-x-)]2
=∑n1i=1(yi-)2-2b×∑n1i=1(xi-x-)(yi-)+b2×∑n1i=1(xi-x-)2.
=∑n1i=1(xi-x-)2×b2-2∑n1i=1(xi-x-)(yi-)×b+∑n1i=1(yi-)2.
Q為關于b的二次函數,因為樣本數據各不相同,所以∑n1i=1(xi-x-)2恒大于0,即二次函數Q(b)開口向上,有最小值Q,當且僅當b為對稱軸.因此,
b=--2∑n1i=1(xi-x-)(yi-)12×∑n1i=1(xi-x-)2
=∑n1i=1(xi-x-)(yi-)1∑n1i=1(xi-x-)2.
本文利用回歸直線恒過樣本中心的特點以及二次函數求最值的方法而得到回歸直線的兩個參數公式.該方法思路清楚,推理簡單,并且還能加深學生對回歸直線的理解——回歸直線恒過樣本中心.本人認為教材應該使用本文方法介紹回歸直線方程.
參考文獻
[1]劉坦.回歸直線方程的另一推導[J].數學通訊,2003(23):10.
[2]史雄.關于回歸直線方程的另一種簡單推導方法[J].新課程學習(基礎教育),2010(2):104.
(責任編輯黃桂堅)endprint
回歸直線方程是新課改新增的內容之一,在必修3中直接給出了求回歸方程的有關公式,讓學生學會利用公式.在選修數學2-3的第42頁中,利用配方法給出了回歸直線的推導.但是由于推導過程比較麻煩,而且不是在必修3中出現,很多教師都只是按照課程要求指導學生利用回歸方程的公式求回歸方程.由于不知道公式的來源,這樣做只會給學生一種應試教育的感覺.讓學生覺得學習只是為了考試,學數學很乏味.劉坦老師的文章《回歸直線方程的另一種推導》[1]中的方法簡潔明快,但超出了高中學生的學習要求,史雄老師的文章《關于回歸直線方程的另一種簡單推導方法》[2]中都是利用導數以及求二元一次方程的思想求出回歸方程的兩個參數.如果學生在必修3之前學習了導數,這是一個簡易的方法.然而導數是選修2-2中的內容,一般我們都是把必修學完,才學習選修的內容.基于此,本文先利用樣本中心確定回歸直線的位置,再利用“從整體上看,各點與此直線的距離最小”的思想獲得一元二次函數,依據一元二次函數的特征求得斜率.該方法可以讓學生輕而易舉地了解回歸方程的來源.
一、確定回歸直線的位置
平均數反映一組數據的集中趨勢.能夠利用所有數據的特征是它的優點之一.除此之外,平均數能使得誤差平方和達到最小.如果利用平均數代表數據,則可以使二次損失最小.對所給的樣本數據的橫坐標與縱坐標分別取平均值x-、,則坐標點(x-,)稱為樣本中心.依據平均數的意義,樣本中心(x-,)反映了樣本數據的集中趨勢,所以回歸直線一定通過樣本中心(x-,).
二、求回歸直線的參數
設回歸直線的方程為y=bx+a.由于點(x-,)在回歸直線上,所以有=bx-+a.如果確定了回歸直線的斜率b,便可以通過=bx-+a得參數a=-bx-.
如何確實斜率b呢?依據數學必修3“從整體上看,各點與此直線的距離最小”得Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2,使得Q最小.把a=-bx-代入Q中
Q=(y1-bx1-+bx-)2+(y2-bx2-+bx-)2+…+(yn-bxn-+bx-)2
=(y1--bx1+bx-)2+(y2--bx2+bx-)2+…+(yn--bxn+bx-)2
=[(y1-)-b(x1-x-)]2+[(y2-)-b(x2-x-)]2+…+[(yn-)-b(xn-x-)]2
=(y1-)2-2×b(x1-x-)×(y1-)+[b(x1-x-)]2+(y2-)2-2×b(x2-x-)×(y2-)+[b(x2-x-)]2+…+(yn-)2-2×b(xn-x-)×(yn-)+[b(xn-x-)]2
=∑n1i=1(yi-)2-2b×∑n1i=1(xi-x-)(yi-)+b2×∑n1i=1(xi-x-)2.
=∑n1i=1(xi-x-)2×b2-2∑n1i=1(xi-x-)(yi-)×b+∑n1i=1(yi-)2.
Q為關于b的二次函數,因為樣本數據各不相同,所以∑n1i=1(xi-x-)2恒大于0,即二次函數Q(b)開口向上,有最小值Q,當且僅當b為對稱軸.因此,
b=--2∑n1i=1(xi-x-)(yi-)12×∑n1i=1(xi-x-)2
=∑n1i=1(xi-x-)(yi-)1∑n1i=1(xi-x-)2.
本文利用回歸直線恒過樣本中心的特點以及二次函數求最值的方法而得到回歸直線的兩個參數公式.該方法思路清楚,推理簡單,并且還能加深學生對回歸直線的理解——回歸直線恒過樣本中心.本人認為教材應該使用本文方法介紹回歸直線方程.
參考文獻
[1]劉坦.回歸直線方程的另一推導[J].數學通訊,2003(23):10.
[2]史雄.關于回歸直線方程的另一種簡單推導方法[J].新課程學習(基礎教育),2010(2):104.
(責任編輯黃桂堅)endprint