■呂澤晟
高考對統計的考查主要是圍繞三種抽樣方法、樣本的數字特征、用樣本估計總體以及線性相關性和回歸方程等展開的,凸顯數據收集處理以及運算推理素養的應用。
例1某單位有工程師6人,技術員12人,技工18人,要從這些人中抽取一個容量為n的樣本,如果采用系統抽樣和分層抽樣方法抽取,都不用剔除個體;如果樣本容量增加1個,則在采用系統抽樣時,需要在總體中先剔除1個個體,求樣本容量n的值。
解:明確系統抽樣的間隔和分層抽樣的抽樣比是解決問題的關鍵。總體容量為6+12+18=36。當樣本容量為n時,由題意知系統抽樣的間隔是分層抽樣的抽樣比是,所以抽取工程師人數為,技術員人數為,技工人數為,可知n應是6的倍數,36的約數,即6,12,18,24。當樣本容量為時,總體容量是35,系統抽樣的間隔為,因為必須是整數,所以n只能取6,即樣本容量n=6。
素養:三種抽樣在抽樣過程中,每個個體被抽到的可能性相等,三種抽樣之間又相互聯系,對抽取的樣本來說,可謂異曲同工。在抽樣時應結合三種抽樣方法的特點和實際情況,靈活選擇抽樣方法解決問題。
例2某企業有甲、乙兩個研發小組,為了比較他們的研發水平,現隨機抽取這兩個小組往年研發新產品的結果如下其中分別表示甲組研發成功和失敗分別表示乙組研發成功和失敗。
若某組成功研發一種新產品,則給該組記1分,否則記0分。試計算甲、乙兩組研發新產品的成績的平均數和方差,并比較甲、乙兩組的研發水平。
解:由研發成功與否,轉化為得分情況,求出其平均數與方差,再依據數字特征來比較兩組的研發水平。
甲組研發新產品的成績為1,1,1,0,0,1,1,1,0,1,0,1,1,0,1,其平均數為,易得方差
乙組研發新產品的成績為1,0,1,1,0,
素養:平均數與方差都是重要的數字特征,是對總體的一種簡明的描述,它們所反映的情況有著重要的實際意義。平均數、中位數、眾數描述其集中趨勢,方差和標準差描述其波動大小。
例3從某校隨機抽取100名學生,獲得了他們一周課外閱讀時間(單位:h)的數據,整理得到數據分組及頻數分布表(如表1)和頻率分布直方圖(如圖1)。

表1

圖1
(1)從該校隨機選取1名學生,試估計這名學生該周課外閱讀時間少于12h的概率。
(2)求頻率分布直方圖中a,b的值。
(3)假設同一組中的每個數據可用該組區間的中點值代替,試估計樣本中的100名學生該周課外閱讀時間的平均數在第幾組(只需寫出結論)。
解:(1)根據頻數分布表,可知100名學生中課外閱讀時間不少于12h的學生人數為6+2+2=10,所以樣本中的學生課外閱讀時間少于12h的頻率是,即從該校隨機選取1名學生,估計這名學生該周課外閱讀時間少于12h的概率為0.9。
(2)課外閱讀時間落在區間[4,6)上的有17人,頻率為0.17,所以
課外閱讀時間落在區間[8,10)上的有25人,頻率為0.25,所以
(3)估計樣本中的100名學生課外閱讀時間的平均數在第4組。
素養:樣本數據的頻率(數)分布表和頻率分布直方圖,反映整個樣本數據的頻率分布情況,并由此可估計總體的分布情況。
例4表2提供了某廠節能降耗技術改造后生產甲產品過程中記錄的產量x(t)與相應的生產能耗y(噸標準煤)的幾組對應數據。

表2
(1)請畫出表2中的數據的散點圖。
(2)根據表2提供的數據,用最小二乘法求出y關于x的線性回歸方程
(3)已知該廠技術改造前100 t甲產品能耗為90噸標準煤,試根據(2)求出的線性回歸方程,預測生產100 t甲產品的生產能耗比技術改造前降低多少噸標準煤。(參考數值:3×2.5+4×3+5×4+6×4.5=66.5)
解:(1)把產量x作為橫坐標,相應的生產能耗y作為縱坐標,在直角坐標系中描點(xi,作出散點圖如圖2所示。

圖2
(2)由圖可知,這些點大致分布在一條直線附近,故生產甲產品的產量x和相應的生產能耗y的線性相關關系顯著,所以求回歸直線方程是有意義的。
(3)當x=100 時,70.35,所以預測生產100t甲產品的生產能耗比技術改造前降低90—70.35=19.65(噸標準煤)。
素養:利用散點圖判斷兩個變量是否具有相關關系是比較簡便的方法。由部分數據得到的回歸直線,可以對兩個變量間的線性相關關系進行估計,這實際上是將非確定性的相關關系問題轉化成確定性的函數關系問題進行研究的。由于回歸直線將部分觀測值所反映的規律進行延伸,所以它在情報預測、資料補充等方面有著廣泛的應用。