




要點1:抽樣方法
簡單隨機抽樣包括抽簽法和隨機數表法;分層抽樣又叫按比例抽樣,抽樣比p =樣本容量n/總體容量N 。無論哪種抽樣,抽到每個個體是等可能的。
例1 某商場有四類食品,食品類別和種數如表1所示。
現從中抽取一個容量為20的樣本進行食品安全檢測,若采用分層抽樣方法抽取樣本,則抽取的植物油類與果蔬類食品種數之和為____。
解:總體個數為40+10+30+20=100。由分層抽樣的定義可知,抽取的植物油類食品種數為(10/100)×20=2,抽取的果蔬類食品種數為(20/100)×20=4,所以抽取的植物油類與果蔬類食品種數之和為2+4=6。
跟蹤訓練1:利用簡單隨機抽樣,從n 個個體中抽取一個容量為10的樣本。若第二次抽取時,余下的每個個體被抽到的概率為1/3,則在整個抽樣過程中,每個個體被抽到的概率為____。
提示:根據題意得9 /n-1=1/3,解得n=28。故在整個抽樣過程中每個個體被抽到的概率為10/28=5/14。
要點2:用樣本的頻率估計總體分布
頻率= 頻數/樣本容量,已知其中任意兩個量就可以求出第三個量。各小組的頻數和等于樣本容量,頻率和等于1。由樣本的頻率可估計總體的頻率,從而估計總體的頻數。
例2 有一個容量為100 的樣本,數據(均為整數)的分組及各組的頻數如下:[12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;[21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;[30.5,33.5],8。
(1)列出樣本的頻率分布表。
(2)估計小于30的數據約占的百分比。
解:(1)樣本的頻率分布表,如表2所示。
(2)因為所有組的頻率之和為1,大于30的數據占0.08,所以小于30的數據占(1-0.08)×100%=92%。
跟蹤訓練2:為了解某校高三學生的視力情況,隨機地抽查了該校100名高三學生的視力情況,得到頻率分布直方圖,如圖1。由于不慎將部分數據丟失,但知道后5組頻數和為62,視力在4.6到4.8之間的學生人數為a,最大頻率為0.32,則a 的值為____。
提示:由題意知[4.7,4.8)之間的頻率為0.32,[4.6,4.7)之間的頻率為1-0.62-0.05-0.11=1-0.78=0.22,所以a =(0.22+0.32)×100=54。
要點3:用樣本的特征數估計總體的特征數
樣本的特征數可分為兩大類:一類是反映樣本數據集中趨勢的,包括眾數、中位數和平均數;另一類是反映樣本數據波動大小的,包括方差及標準差。
例3 甲、乙兩機床同時加工直徑為100cm 的零件,為檢驗質量,各從中抽取6件測量,數據如下:
甲:99,100,98,100,100,103。
乙:99,100,102,99,100,100。
(1)分別計算兩組數據的平均數及方差。
(2)根據計算結果判斷哪臺機床加工零件的質量更穩定。
解:(1)x甲=1/6(99+100+98+100+100+103)=100,x乙=1/6(99+100+102+99+100+100)=100。s2甲=1/6[(99-100)2+(100-100)2+(98-100)2 +(100-100)2 +(100-100)2 +(103-100)2]=7/3,s2乙=1/6[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1。
(2)兩臺機床所加工零件的直徑的平均數相同,又s2甲gt;s2乙,所以乙機床加工零件的質量更穩定。
跟蹤訓練3:對甲、乙的學習成績進行抽樣分析,各抽5門功課,得到的觀測值如表3所示。
問:甲、乙誰的平均成績好? 誰的各門功課發展較平衡?
提示:易得甲的平均成績x甲=74,乙的平均成績x乙=73,所以甲的平均成績好。由方差計算公式得甲的方差s2甲=104,乙的方差s2乙=56。因為s2甲gt;s2乙,所以乙的各門功課發展較平衡。
要點4:樣本的百分位數
由頻率分布直方圖求百分位數時,一般采用方程的思想,設出第p 百分位數,根據其意義列出方程求解。
例4 數學興趣小組調查了12位大學畢業生的起始月薪,具體如表4所示。試確定第85百分位數。
解:將數據從小到大排列為3710,3755,3850,3880,3880,3890,3920,3940,3950,4050,4130,4325。因為12×85%=10.2,所以第85百分位數是第11個數據,即第85百分位數是4130。
跟蹤訓練4:新華中學高一年級共有1200人參加了學校組織的詩詞背誦比賽,已知所有學生成績的第70百分位數是75分,則成績大于或等于75分的學生至少有____人。
提示:將1200人的成績按照從小到大的順序排列,75分排在第70百分位數,就是比75分少的人數占了70%,所以成績大于或等于75 分的學生至少占了30%,其人數為1200×30% =360。故成績大于或等于75分的學生至少有360人。
說明:本文系廣西教育科學“十四五”規劃2022年度專項課題“基于大數據監測提升高中生數學核心素養的實踐研究———以南寧四中為例”的研究成果,編號:2022ZJY274。
作者單位:南寧市第四中學
(責任編輯 郭正華)