侯有岐(正高級教師 特級教師)
(陜西省漢中市四〇五學校)
成對數據的統計分析是高考概率與統計考查的重點內容之一.這部分知識要求學生從過去的單變量觀察階段轉變到多變量的數據理性分析推斷階段,往往聚焦數學核心素養,以解決生產生活中的實際問題為背景,考查學生的必備品格與關鍵能力,深受命題者的青睞.本文對成對數據的統計分析考查的常見題型及解題策略進行總結.
例1(1)(多選題)下列各圖中,兩個變量x,y具有相關關系的是( ).

(2)已知變量x和y滿足關系式y=-0.2x+3,變量y與z正相關,則下列結論中正確的是( ).
A.x與y正相 關,x與z負相關
B.x與y正相關,x與z正相關
C.x與y負相關,x與z負相關
D.x與y負相關,x與z正相關
(3)兩個變量y與x的回歸模型中,分別選擇了4個不同模型,它們的決定系數R2如下,其中擬合效果最好的模型是( ).
A.模型1的決定系數R2為0.98
B.模型2的決定系數R2為0.80
C.模型3的決定系數R2為0.50
D.模型4的決定系數R2為0.25
(2)因為y=-0.2x+3的斜率小于0,故x與y負相關.因為y與z正相關,可設z=by+a,b>0,則z=by+a=-0.2bx+3b+a,所以x與z負相關,故選C.
(3)在兩個變量y與x的回歸模型中,它們的決定系數R2越接近1,模型擬合效果越好,在四個選項中A 的決定系數最大,所以擬合效果最好的是模型1.故選A.
1)散點圖法:如果所有的樣本點都落在某一函數的圖像附近,那么變量之間有相關關系;如果所有的樣本點都落在某一直線附近,那么變量之間有線性相關關系.
2)相關系數法:利用相關系數判定,|r|越趨近于1,相關性越強.
3)決定系數法:利用決定系數判定,R2越接近1,模型的擬合效果越好,相關性越強.
例2某種機械設備隨著使用年限的增加,它的使用功能逐漸減退,使用價值逐年減少,通常把它使用價值逐年減少的“量”換算成費用,稱之為“失效費”.該種機械設備的使用年限x(單位:年)與失效費y(單位:萬元)的統計數據如表1所示.

表1
由表1數據可知,可用線性回歸模型擬合y與x的關系,請用相關系數加以說明(精確到0.01).
參考公式:相關系數
因為y與x的相關系數近似為0.99,所以y與x的線性相關程度相當大,因此可用線性回歸模型擬合y與x的關系.
2)確定R2:
例3某高中生參加社會實踐活動,對某公司1月份至6月份某種配件的銷售量及銷售單價進行了調查,銷售單價x(單位:元)和銷售量y(單位:千件)之間的一組數據如表2所示.

表2
(1)根據1月份至5月份的數據,求y關于x的回歸直線方程;
(2)若由回歸直線方程得到的預報值與實際數據的誤差不超過0.5,則認為此回歸直線方程是理想的,試問(1)中的回歸直線方程是否理想?
(2)由(1)知,當x=8 時,14.4,此時有14.4-14.2=0.2<0.5,故可認為(1)中所得到的回歸直線方程是理想的.
例4某公司為確定下一年度投入某種產品的宣傳費,需了解年宣傳費x(單位:千元)對年銷售量y(單位:t)和年利潤z(單位:千元)的影響.對近8年的年宣傳費xi和年銷售量yi(i=1,2,…,8)數據作了初步處理,得到下面的散點圖(如圖1)及一些統計量的值.

圖1
參考數據:
(2)根據(1)的判斷結果及參考數據,建立y關于x的回歸方程;
(3)已知這種產品的年利潤z與x,y的關系式為z=0.2y-x.根據(2)的結果回答下列問題:
(ⅰ)年宣傳費x=49時,年銷售量及年利潤的預測值是多少?
(ⅱ)年宣傳費x為何值時,年利潤的預測值最大?
附:對于一組數據(u1,v1),(u2,v2),…,(un,vn),其經驗回歸直線的斜率和截距的最小二乘估計分別為
(1)由散點圖可以判斷,適宜作為年銷售量y關于年宣傳費x的回歸方程類型.
所以y關于w的經驗回歸方程為因此y關于x的回歸方程為
(3)(ⅰ)由(2)知,當x=49時,年銷售量y的預測值,年利潤z的預測值
2)利用經驗回歸方程進行預測,把經驗回歸方程看作一次函數,求函數值.
3)經驗回歸方程的擬合效果可以利用相關系數判斷,當|r|越趨近于1時,兩變量的線性相關性越強.
例5(2022年全國甲卷文17)甲、乙兩城之間的長途客車均由A和B兩家公司運營.為了解這兩家公司長途客車的運行情況,隨機調查了甲、乙兩城之間的500個班次,得到列聯表如表3所示.

表3
(1)根據表3,分別估計這兩家公司甲、乙兩城之間的長途客車準點的概率;
(2)能否有90%的把握認為甲、乙兩城之間的長途客車是否準點與客車所屬公司有關?

表4
(2)列聯表如表5所示.根據臨界值表可知,有90%的把握認為甲、乙兩城之間的長途客車是否準點與客車所屬公司有關.

表5
1)2個明確:明確兩類主體;明確研究的兩個問題.
2)2 個關鍵:準確畫出2×2 列聯表;準確求解K2.
縱觀近幾年高考的概率與統計試題,成對數據的統計分析占有相當高的比重,而且命題形式也逐步趨于平穩,注重落實?中國高考評價體系?中四層四翼的考核要求.試題命制背景多與生產生活實際緊密聯系,文字量大,信息多,對學生的閱讀理解能力、信息獲取能力和批判性思維能力有較高的要求.因此,筆者希望學生在復習中注重提高用數學概念、原理解讀具體問題和提煉有用信息的能力,強化運算求解能力和統計推斷思維.
(完)