■廖慶偉
1.散點圖:將各數據在平面直角坐標系中的對應點畫出來,得到表示兩個變量的一組數據的圖形,這樣的圖形叫作散點圖。利用散點圖,可以判斷兩個變量是否相關,是正相關還是負相關。
2.兩個變量的線性相關:(1)由散點圖可知,如果這些點從整體上看大致分布在通過散點圖中心的一條直線附近,則稱這兩個變量之間具有線性相關關系,這條直線叫回歸直線。(2)回歸方程為?y=b x+a,其中b=(3)通過求的最小值而得出回歸直線的方法,即求回歸直線,使得樣本數據的點到它的距離的平方和最小,這一方法叫作最小二乘法。(4)相關系數當r>0時,表明兩個變量正相關,當r<0時,表明兩個變量負相關,r的絕對值越接近于1,表明兩個變量的線性相關性越強,r的絕對值越接近于0,表明兩個變量之間幾乎不存在線性相關關系,通常|r|大于0.75時,認為兩個變量有很強的線性相關性。
例1給出下列變量關系:
①人的身高與體重之間的關系;
②人的年齡與血壓之間的關系;
③人的身高與數學成績之間的關系;
④農作物的施肥量與產量之間的關系;
⑤正方形的邊長與面積之間的關系。
其中是變量之間具有相關關系的有____(將所有符合條件的序號都填上)。
解:①人的身高與體重之間的關系是相關關系。②人的年齡與血壓之間的關系是相關關系。③人的身高與數學成績之間的關系既不是函數關系,也不是相關關系。④農作物的施肥量與產量之間的關系是相關關系。⑤正方形的邊長與面積之間的關系是確定關系,即為函數關系。答案為①②④。
評析:利用定義區分相關關系與函數關系的關鍵要看兩個變量間的關系具有“確定性”還是具有“伴隨性”。
例2 觀察下列各圖形(如圖1,圖2,圖3,圖4)。

其中兩個變量x,y具有很強相關關系的圖形是( )。

解:相關關系有兩種情況:若所有點看上去都在一條直線附近波動,則是線性相關;若所有點看上去都在某條曲線(不是一條直線)附近波動,則是非線性相關。圖1,圖4的相關性較弱,圖2中兩變量幾乎沒有什么關系,而圖3相關性很強。應選C。
評析:觀察散點圖,如果發現點的分布從整體上看大致在一條直線附近,那么這兩個變量是線性相關的。
例3表1是某地搜集到的新房屋的銷售價格y(萬元)和房屋的面積x(m2)的數據,試求線性回歸方程。

表1
解:由已知得
設所求回歸直線方程為?y=b x+a,則b—1.65。故所求回歸直線方程為1.65。
例4對于表2所示的五個散點,已知求得的線性回歸直線方程為?y=0.8x—155,則實數m的值為( )。解:依題意得

表2

例5假設關于某設備的使用年限x(年)和所支出的維修費用y(萬元),有如表3所示的統計資料。

表3
若由資料可知,y對x呈線性相關關系,試求:
(1)線性回歸直線方程。
(2)根據回歸直線方程,估計使用年限為12年時,維修費用是多少?
解:(1)列表,如表4所示。

表4
(2)當x=12時14.84(萬元),即估計使用年限為12年時,維修費用是14.84萬元。
評析:對于具有線性相關關系的兩個變量,才能求出線性回歸方程,才能利用線性回歸方程對變量進行估計和預測。若回歸直線方程為,則的估計值為(注意計算的值不一定是真實值)。