■劉大鳴(特級教師)
近幾年高考對統計的考查主要是圍繞“抽樣方法,莖葉圖,頻率分布直方圖,樣本的數字特征,回歸分析”等核心考點展開的,著重考查同學們應用統計知識解決實際問題的核心素養。下面以近幾年高考試題為載體進行全方位的考點聚焦,希望對同學們的學習有所幫助。
例1甲、乙兩套設備生產的同類型產品共4800件,采用分層抽樣的方法從中抽取一個容量為80的樣本進行質量檢測。若樣本中有50件產品由甲設備生產,則乙設備生產的產品總件數為____。
解:由題設可得抽樣比為設甲設備生產的產品為x件,則,可得x=3000。故乙設備生產的產品總件數為4800—3000=1800。
品味:當個體差異較大時,常采用分層抽樣法。分層抽樣就是按比例抽樣,根據總體中的個體數N和樣本容量n計算抽樣比k=確定第i層應抽取的個體數為k(Ni為第i層包含的個體數),當k不是整數時,要從總體中剔除多余的個體。
變式1:某工廠生產甲,乙,丙,丁四種不同型號的產品,產量(單位:件)分別為200,400,300,100。為檢驗產品的質量,現用分層抽樣的方法從以上所有的產品中抽取60件進行檢驗,則應從丙種型號的產品中抽取的件數為____。
提示:依據分層抽樣為按比例抽樣的特點確定抽樣比為,故抽取的件數為60×,即應從丙種型號的產品中抽取的件數為18。
例2已知某地區中小學學生的近視情況分布如圖1和圖2所示。為了解該地區中小學學生的近視形成原因,用分層抽樣的方法抽取2%的學生進行調查,則樣本容量和抽取的高中生近視人數分別為( )。


圖1

圖2
解:根據圖1可得總體個數,根據抽取比例可得樣本容量。計算分層抽樣的抽樣比,求得樣本中的高中生人數,利用圖2求得樣本中抽取的高中生近視人數。
由圖1可知,總體個數為3500+2000+4500=10000,由此可得樣本容量為10000×2%=200。
品味:把握統計圖表的意義,合理運用統計圖表的數據,借助計算進行推理判斷,凸顯對數據收集和應用的核心素養的考查。
變式2:某中學初中部共有110名教師,高中部共有150名教師,其性別比例如圖3所示,則該校女教師的人數為( )。

圖3

提示:由圖3可知該校女教師由初中的和高中的組成,其人數為77+60=137。應選B。
例3某工廠為提高生產效率,開展技術創新活動,提出了完成某項生產任務的兩種新的生產方式。為比較兩種生產方式的效率,選取40名工人,將他們隨機分成兩組,每組20人,第一組工人用第一種生產方式,第二組工人用第二種生產方式。根據工人完成生產任務的工作時間(單位:m i n)繪制了莖葉圖,如圖4所示。

圖4
根據莖葉圖判斷哪種生產方式的效率更高。請說明理由。
解:由莖葉圖中的數據可知,第二種生產方式的效率更高。理由如下:
(1)由莖葉圖可知:用第一種生產方式的工人中有75%的工人完成生產任務所需時間至少80m i n,用第二種生產方式的工人中有75%的工人完成生產任務所需時間至多79m i n。因此第二種生產方式的效率更高。
(2)由莖葉圖可知:用第一種生產方式的工人完成生產任務所需時間的中位數為85.5m i n,用第二種生產方式的工人完成生產任務所需時間的中位數為73.5m i n。因此第二種生產方式的效率更高。
(3)由莖葉圖可知:用第一種生產方式的工人完成生產任務平均所需時間高于80m i n,用第二種生產方式的工人完成生產任務平均所需時間低于80m i n。因此第二種生產方式的效率更高。
(4)由莖葉圖可知:用第一種生產方式的工人完成生產任務所需時間分布在“莖8”上的最多,關于“莖8”大致呈對稱分布,用第二種生產方式的工人完成生產任務所需時間分布在“莖7”上的最多,關于“莖7”大致呈對稱分布,且用兩種生產方式的工人完成生產任務所需時間分布的區間相同,故可以認為用第二種生產方式完成生產任務所需的時間比用第一種生產方式完成生產任務所需的時間更少。因此第二種生產方式的效率更高。
品味:在莖葉圖中,“莖”表示數的高位部分,“葉”表示數的低位部分。從莖葉圖中能看到原始數據,沒有任何信息損失,且莖葉圖便于記錄和表示。借助莖葉圖的數據可以求樣本的數字特征。
變式3:已知某班級部分同學一次測驗的成績統計如圖5所示,則中位數和眾數分別為( )。

圖5

提示:由莖葉圖可知,中位數為92,眾數為86。應選B。
例4隨著互聯網的發展,移動支付(又稱手機支付)越來越普遍,某學校興趣小組為了解移動支付在大眾中的熟知度,對15~65歲的人群隨機抽樣調查,調查的問題是:你會使用移動支付嗎?其中回答“會”的共有n人。
把這n人按照年齡分成5組,即第1組為[15,25),第2組為[25,35),第3組為[35,45),第4組為[45,55),第5組為[55,65],然后繪制成如圖6所示的頻率分布直方圖。其中第1組的頻數為20。
(1)求n和x的值。
(2)根據頻率分布直方圖估計這組數據的眾數、中位數、平均數、方差。
解:(1)由題意可知
由10×(0.02+0.036+x+0.01+0.004)=1,解得x=0.03。
(2)由頻率分布直方圖可估計這組數據的眾數為30。
設中位數為m,則各組頻率分別為0.2,0.36,0.3,0.1,0.04,且0.2+0.36>0.5,可知中位數在第2組中,所以0.2+0.036×(m—25)=0.5,解得m≈33.3,即中位數約為33.3。
方差s2=(20—34.2)2×0.2+(30—34.2)2×0.36+(40—34.2)2×0.3+(50—34.2)2×0.1+(60—34.2)2×0.04=108.36。
品味:在頻率分布直方圖中,每個小長方形的面積就是相應的頻率,所有小長方形的面積之和為1。用樣本的數字特征估計總體的數字特征時,眾數是樣本數據中出現次數最多的數據,反映在頻率分布直方圖中,對應小長方形的面積應最大,所以用最高小長方形底邊中點橫坐標估計眾數;中位數是頻率分布直方圖中的左右面積等分線對應的數值(橫坐標);用頻率分布直方圖中每個小長方形的面積pi乘以小長方形底邊中點的橫坐標xi之和估計樣本平均數,計算公式為,方差計算公式
變式4:某學校為了解小學生的體能情況,抽取了該校不同年級部分學生進行跳繩測試,將所得的數據整理后畫出頻率分布直方圖(如圖7)。已知圖中從左到右的前三個小組的頻率分別是0.1,0.3,0.4,第一小組的頻數是5。
(1)求第四小組的頻率和參加這次測試的學生人數。
(2)在這次測試中,學生跳繩次數的中位數落在第幾小組內?
(3)參加這次測試跳繩次數在100次以上為優秀,試估計學生跳繩成績的優秀率。
提示:(1)第四小組的頻率為1—(0.1+0.3+0.4)=0.2。因為第一小組的頻數為5,第一小組的頻率為0.1,所以參加這次測試的學生人數為5÷0.1=50。
(2)由頻率分布直方圖可知,0.1×50=5,0.3×50=15,0.4×50=20,0.2×50=10,則第一、第二、第三、第四小組的頻數分別為5,15,20,10。所以學生跳繩次數的中位數落在第三小組內。
(3)由第三、四小組的頻率,可知學生跳繩成績的優秀率為(0.4+0.2)×100%=60%。