姚踐紅




統計是高中數學的重要內容之一,也是新高考的必考知識點。高考主要考查隨機抽樣,考查用樣本估計總體等。下面舉例分析,供同學們學習與提高。
題型一:簡單隨機抽樣
用簡單隨機抽樣抽取樣本的依據:總體中的個體之間無明顯差異;總體中個體數N有限;抽取的樣本個體數n小于總體中的個體數N;逐個不放回地抽取;每個個體被抽到的可能性均為2。一個抽樣試驗能否用抽簽法,關鍵看兩點:一是制簽是否方便;二是個體之間差異不明顯。當總體容量較大、樣本容量不大時,用隨機數法抽取樣本較好
例1 下列5個抽樣中,簡單隨機抽樣的序號是。
①從無數個個體中抽取50個個體作為樣本;②倉庫中有1萬支奧運火炬,從中一次性抽取100支火炬進行質量檢查;③一彩民選號,從裝有36個大小、形狀都相同的號簽的盒子中無放回地抽出6個號簽;④箱子里共有100個零件,從中選出10個零件進行質量檢驗,在抽樣操作中,從中任意取出1個零件進行質量檢驗后,再把它放回箱子里。
解:根據簡單隨機抽樣的特點逐個判斷。①不是簡單隨機抽樣,因為簡單隨機抽樣要求被抽取的樣本總體的個數是有限的。②不是簡單隨機抽樣,雖然“一次性抽取”和“逐個抽取”不影響個體被抽到的可能性,但簡單隨機抽樣要求的是“逐個抽取”。③是簡單隨機抽樣,因為總體中的個體數是有限的,并且是從總體中逐個進行抽取的,是不放回、等可能的抽樣。④不是簡單隨機抽樣,因為它是有放回抽樣。答案為③。
題型二:分層隨機抽樣
使用分層隨機抽樣的原則:將相似的個體歸入一類,即為一層,要求每層的各個個體互不交叉,即遵循不重復、不遺漏的原則;為保證每個個體等可能入樣,需遵循在各層中進行簡單隨機抽樣,使每層樣本數量與每層個體數量的比等于抽樣比。
例2 某校500名學生中,O型血有200人,A型血有125人,B型血有125人,AB型血有50人,為了研究血型與色弱的關系,需從中抽取一個容量為20的樣本。按照比例分配的分層隨機抽樣方法抽取樣本,各種血型的人分別抽多少?
解:
故O型血抽8人,A型血抽5人,B型血抽5人,AB型血抽2人。
題型三:獲取數據的途徑
獲取數據的途徑一般有四種:調查,試驗,觀察和查詢。在應用以上四種方式獲取數據時,要清楚數據的類型,選擇適當的獲取方式。
例3 為了緩解城市的交通擁堵情況,某市準備出臺限制私家車的政策,為此要進行民意調查。某個調查小組調查了一些擁有私家車的市民,你認為這樣的調查結果能很好地反映該市市民的意愿嗎?
解:一個城市的交通狀況的好壞將直接影響著生活在這個城市里的每個人,關系到每個人的利益。為了調查這個問題,在抽樣時應當關注到各種人群,既要抽到擁有私家車的市民,也要抽到沒有私家車的市民。
如果只對擁有私家車的市民進行調查,結果一定是片面的,不能代表所有市民的意愿。因此,要對生活在該城市的所有市民進行隨機地抽樣調查,不要只關注到擁有私家車的市民。
題型四:頻率分布直方圖的應用
頻率分布指的是一個樣本數據在各個小范圍內所占比例的大小,一般用頻率分布直方圖反映樣本的頻率分布。頻率分布直方圖中的縱軸表示;頻率分布直方圖中各個組距小長方形的面積等于頻率,各個小長方形的面積之和為1;各個小長方形的高的比就是頻率之比。
例4 為了迎接某市作為全國文明城市的復查,愛衛會隨機抽取了60位路人進行問卷調查,調查項目是自己對該市各方面衛生情況的滿意度(假設被問卷的路人回答是客觀的),以分數表示問卷結果,并統計他們的問卷分數,把其中不低于50分的分成五段:[50,60),[60,70),···,[90,100]后畫出如圖1所示的部分頻率分布直方圖,觀察圖形信息,回答下列問題。
(1)求出問卷調查分數低于50分的被問卷人數。
(2)估計全市市民滿意度在60分及以上的百分比。
解:(1)因為各組的頻率之和等于1,所以低于50分的頻率為f=1—(0.015x2+0.03+0.025+0.005)x10=0.1,故低于50分的人數為60x0.1=6。
(2)依題意可知,60分及以上的頻率和為(0.015+0.03+0.025+0.005)x10=0.75,所以抽樣滿意度在60分及以上的百分比為75%。
于是可以估計全市市民滿意度在60分及以上的百分比為75%。
題型五:百分位數的計算
一般地,一組數據的第p百分位數是這樣一個值,它使得這組數據中至少有p%的數據小于或等于這個值,且至少有(100—p)%的數據大于或等于這個值。計算一組n個數據的第p百分位數的三個步驟:第1步,按從小到大排列原始數據;第2步,計算i=nxp%;第3步,若i不是整數,而大于i的比鄰整數為j,則第p百分位數為第j項數據;若i是整數,則第p百分位數為第i項與第(i+1)項數據的平均數。利用頻率分布直方圖求百分位數的方法:百分位數表示左側小矩形的面積之和,先確定在哪個區間,再從左到右計算所有小矩形的面積和,百分位數所在區間需按照對應邊比例計算面積。
例5 某中學舉行電腦知識競賽,現將高一參賽學生的成績進行整理后分成五組繪制成如圖2所示的頻率分布直方圖,已知圖中從左到右的第一、二、三、四、五小組的頻率分別是0.3,0.4,0.15,0.1,0.05。
求高一參賽學生成績的第60百分位數。
解:由圖知第1個小矩形的面積為0.3,第2個小矩形的面積為0.4,則第60百分位數一定位于[60,70)內。因為60+10x0.6-0.3=67.5,所以估計高一參賽學生成績0.7-0.3的第60百分位數約為67.5。
題型六:眾數、中位數、平均數的計算
眾數、中位數及平均數都是描述一組數據集中趨勢的量。平均數的大小與一組數據里每個數的大小均有關系,任何一個數據的變動都會引起平均數的變動。眾數考查各數出現的頻率,其大小與這組數據中部分數據有關,當一組數據中有不少數據重復出現時,其眾數往往更能反映問題。中位數僅與數據的排列位置有關,某些數據的變動對中位數沒有影響,中位數可能出現在所給數據中,也可能不在所給數據中,當一組數據中個別數據較大時,可用中位數描述這組數據的集中趨勢。
例6 某公司的33名職工的月工資(以元為單位)如表1所示。
(1)求該公司職工月工資的平均數、中位數、眾數。
(2)假設副董事長的工資從5000元提升到20000元,董事長的工資從5500元提升到30000元,那么新的平均數、中位數、眾數又是多少?(精確到元)
(3)你認為哪個統計量更能反映這個公司員工的工資水平?結合此問題談一談你的看法。
解:(1)平均數是x=1/3x(5500x1+5000x1+3500x2+3000x1+2500x5+ 2000x3+1500x20)≈2091(元),中位數是1500元,眾數是1500元。
(2)新的平均數是x=1/33)x(30 000x 1+20000x1+3500x2+3000x1+ 2500x5+2000x3+1500x20)≈3 288 (元),新的中位數是1500元,新的眾數是1500元。
(3)在這個問題中,中位數或眾數均能反映該公司員工的工資水平。因為公司中少數人的工資與大多數人的工資差別較大,這樣導致平均數與中位數偏差較大,所以平均數不能反映這個公司員工的工資水平。
題型七:
例7 從甲、乙兩種玉米苗中各抽10株,分別測得它們的株高(單位:cm)如下。
甲:25,41,40,37,22,14,19,39,21,42。乙:27,16,44,27,44,16,40,40,16,40。
(1)哪種玉米苗長得高?
(2)哪種玉米苗長得齊?
解:
題型八:利用頻率分布直方圖求眾數、中位數、平均數
頻率分布直方圖的數字特征:眾數一般用頻率分布表中頻率最高的一組的組中值來顯示,在樣本數據的頻率分布直方圖中,眾數是最高小矩形的底邊中點的橫坐標;在頻率分布直方圖中,中位數就是頻率分布直方圖面積的一半所對應的橫坐標,中位數左邊和右邊的直方圖的面積相等;平均數等于每個小矩形的高乘以底邊中點的橫坐標之和。
例8 從高三抽出50名學生參加數學競賽,由成績得到的頻率分布直方圖,如圖3。
由于一些數據丟失,試利用頻率分布直方圖求:
(1)這50名學生成績的眾數與中位數。(2)這50名學生的平均成績。
解:(1)由眾數的概念可知,眾數是出現次數最多的數。在頻率分布直方圖中,最高的小長方形的底邊中點的橫坐標即為眾數,所以眾數應為75。
由于中位數是所有數據中的中間值,故在頻率分布直方圖中體現的是中位數的左右兩邊頻數應相等,即頻率也相等,從而就是小矩形的面積和相等。因此在頻率分布直方圖中將所有小矩形的面積一分為二的垂直于橫軸的直線與橫軸交點的橫坐標所對應的成績即為所求。因為0.004x10+0.006x10+0.02x10=0.04+0.06+0.2=0.3,所以前三個小矩形面積的和為0.3。而第四個小矩形面積為0.03x10=0.3,0.3+0.3>0.5,所以中位數應位于第四個小矩形內。設其底邊為x,則高為0.03。令0.03x=0.2,可得x≈6.7。故中位數約為70+6.7=76.7。
(2)樣本平均值應是頻率分布直方圖的“重心”,即所有數據的平均值,也就是每個小矩形底邊中點的橫坐標乘以每個小矩形的面積之和。
所以平均成績為45x(0.004x10)+55x(0.006x10)+65x(0.02x10)+75x (0.03x10)+85x(0.024x10)+95x (0.016x10)=76.2。
題型九:動態樣本的平均數、方差問題
利用動態樣本求平均數、方差的策略:平均數、方差的基本公式不變,但要注意變化前后的關系;適當結合平均數、方差的意義進行估值。
例9
解:
應選A。
題型十:其他統計圖表中反映的集中趨勢與離散程度
若x1,x2,x3,·,x。的平均數為x,方差為s2,則ax1+b,ax2+b,ax3+b,··,axn+b 的平均數為x'=a元+b,方差為s2=a2s2。標準差刻畫了數據的離散程度或波動幅度,標準差越大,數據的離散程度越大;標準差越小,數據的離散程度越小。顯然,在刻畫數據的分散程度上,方差和標準差是一樣的,但在解決實際問題中,一般多采用標準差。
例10 如圖4,圖5,樣本A和B分別取自兩個不同的總體,它們的樣本平均數分別為xA和B,樣本標準差分別為SA和sB,則()。
解:觀察圖形可得,樣本A的數據均小于或等于10,樣本B的數據均大于或等于10,故xA
作者單位:河南省許昌實驗中學
(責任編輯郭正華)