


基于頻率分布直方圖,有圖表有數據,有效考查直觀想象、數學分析,以及數學運算等核心素養,成為高考命題中的基本知識點之一。下面利用頻率分布直方圖的場景創設,就其不同的應用視角進行實例剖析。
一、中位數與百分位數的確定
例1 (多選題)某學校為宣傳我國第三艘航空母艦“中國人民解放軍海軍福建艦”下水試航,增強學生的國防意識,組織了一次“逐夢深藍,山河榮耀”國防知識競賽,對100名學生的參賽成績進行統計,得到如圖1所示的頻率分布直方圖,其中分組的區間為[50,60),[60,70),[70,80),[80,90),[90,100],為進一步了解學生的答題情況,通過分層隨機抽樣,從成績在區間[70,90)內的學生中抽取6人,再從這6人中先后抽取2人的成績進行分析,下列結論正確的是( )。
A.頻率分布直方圖中的x=0.03
B.估計100名學生成績的中位數是85
C.估計100名學生成績的80% 分位數是95
D.從6人中先后抽取2人進行分析時,若先抽取的學生成績位于[70,80)內,則后抽取的學生成績在[80,90)內的概率是4/15
解:對于A,由學生的成績都在50分到100分之間的頻率和為1,可得10×(0.005+0.01+0.015+x+0.04)=1,解得x=0.03,A 正確。對于B,由(0.005+0.01+0.015)×10=0.3lt;0.5,(0.005+0.01+0.015+0.03)×10=0.6gt;0.5,可知中位數位于[80,90)之間,所以中位數為80+0.5-0.3/0.3 ×10≈86.7,B錯誤。對于C,80%分位數約為90+0.8-0.6/0.4 ×10=95,C 正確。對于D,在被抽取的學生中,成績在區間[70,80)和[80,90)內的學生人數之比為10×0.015/10×0.03 =1/2,所以在[70,80)中抽取了2人,在[80,90)中抽取了4 人。若先抽取的學生成績位于[70,80)內,則第二次抽取時,是在其余5個人中抽取,此時學生成績在[80,90)內的個數為4,所以概率為4/5,D不正確。應選AC。
總結提煉:注意中位數是百分位數的一個特例,中位數左邊和右邊的小矩形的面積和相等。
二、樣本平均數與方差的求解
例2 從某企業的某種產品中抽取500件,測量這些產品的一項質量指標值,由測量結果得到的頻率分布直方圖,如圖2所示。
(1)求這500件產品質量指標值的樣本平均數和樣本方差s2(同一組數據用該區間的中點值作代表)。
(2)產品質量指標值在185與215之間的每個盈利200元,在175與185或215與225之間的每個虧損50元,其余的每個虧損300元。該企業共生產這種產品10000個,估計這批產品可獲利或虧損多少元。
解:(1)由題意可得,樣本平均數x =(170×0.002+180×0.009+190×0.022+200×0.033+210×0.024+220×0.008+230×0.002)×10=200,樣本方差s2 =(170-200)2 ×0.002×10+(180-200)2 ×0.009×10+ (190-200)2 ×0.022×10+(200-200)2 ×0.033×10+(210-200)2 ×0.024×10+ (220-200)2 ×0.008×10+(230-200)2×0.002×10=150。
(2)由頻率分布直方圖可知,質量指標值在[185,215)的頻率為(0.022+0.033+0.024)×10=0.79,質量指標值在[175,185)和[215,225)的頻率為(0.009+0.008)×10=0.17,質量指標值在[165,175)和[225,235]的頻率為0.002×2×10=0.04,所以(200×0.79-50×0.17-300×0.04)×10000=1375000(元)。故10000件產品獲利1375000元。
總結提煉:在頻率分布直方圖中,平均數等于各組區間的中點值與對應頻率的乘積的和,方差s2 =(x1 -x)2 ×f1 +(x2 -x)2 ×f2+… + (xn -x)2 ×fn ,其中xi (i=1,2,…,n)表示小矩形的底邊中點的橫坐標,fi(i=1,2,…,n)表示各個小矩形的面積(即頻率),x 是樣本數據的平均數。
三、統計中的決策與判斷
例3 某公司新研發一種電子產品,準備從甲、乙兩個代加工廠中選擇一個進行生產,為此先讓甲、乙兩個代加工廠分別試生產20件產品,通過檢測,將甲工廠試生產產品的質量分數(單位:分)按照[88,90),[90,92),[92,94),[94,96),[96,98),[98,100]分組,得到頻率分布直方圖,如圖3所示,乙工廠試生產產品的質量分數分別為86,89,89,90,90,92,92,93,93,93,93,93,93,93,95,95,95,98,98,100。已知產品質量越好,質量分數越高。以頻率估計概率,以樣本估計總體。
(1)已知甲工廠試生產產品的質量分數的方差為7.29,乙工廠試生產產品的質量分數的平均數為93,判斷該公司應該選擇哪個工廠進行生產,并說明理由(同一組中的數據用該組區間的中點值為代表)。
(2)現將質量分數低于92分的產品定為二等品,質量分數不低于92分的產品定為一等品,已知每生產一件二等品的利潤為300元,每生產一件一等品的利潤為400元,請估計(1)中選擇的工廠生產一件產品的利潤。
解:(1)甲工廠試生產產品的質量分數的平均數為0.1×89+0.2×91+0.3×93+0.2×95+0.15×97+0.05×99=93.5,甲工廠試生產產品的質量分數的方差為7.29。
乙工廠試生產產品的質量分數的平均數為93+1/20×(-7-4-4-3-3-1-1+2+2+2+5+5+7)=93,乙工廠試生產產品的質量分數的方差為1/20× [(86-93)2 +2×(89-93)2+2×(90-93)2+2×(92-93)2+7×(93-93)2 +3×(95-93)2 +2×(98-93)2+(100-93)2]=10.6。
因為甲工廠試生產產品的質量分數的平均數大于乙工廠,且甲工廠試生產產品的質量分數的方差小于乙工廠,所以選擇甲工廠。
(2)甲工廠每生產一件產品是二等品的概率為2×(0.05+0.1)=0.3,所以一等品的概率為1-0.3=0.7,所以估計甲工廠生產一件產品的利潤為300×0.3+400×0.7=370(元)。
總結提煉:統計中的決策方案,一般是將統計中樣本的平均值或方差的大小關系進行比較,從而得以科學決策。
作者單位:江蘇省宜興市丁蜀高級中學
(責任編輯 郭正華)