■李傳翔
統計學研究的對象是客觀事物的數量特征和數量關系,它是關于數據的搜集、整理、歸納分析和解釋的科學,其基本思想是用樣本估計總體,用樣本的某種數字特征(平均數、方差)去估計總體的相應數字特征。下面借助于高考題,與大家一起探究高考中的樣本特征數問題。
例1演講比賽共有11位評委分別給出某選手的原始評分,評定該選手的成績時,從11個原始評分中去掉1個最高分、1個最低分,得到9個有效評分。9個有效評分與11個原始評分相比,不變的數字特征是( )。
A.中位數 B.平均數
C.標準差 D.極差
解:根據題意可知,從11個原始評分中去掉1個最高分、1個最低分,得到9個有效評分,9個有效評分與11個原始評分相比,最中間的一個數不變,即中位數不變。應選A。
本題考查數據的數字特征,解題的關鍵是掌握數據的平均數、中位數、方差、極差的定義以及計算方法。
例2某工廠為提高生產效率,開展技術創新活動,提出了完成某項生產任務的兩種新的生產方式。為比較兩種生產方式的效率,選取40名工人,將他們隨機分成兩組,每組20人,第一組工人用第一種生產方式,第二組工人用第二種生產方式。根據工人完成生產任務的工作時間(單位:min)繪制了如圖1所示的莖葉圖。

圖1
根據莖葉圖判斷哪種生產方式的效率更高,并說明理由。
解:第一種生產方式的平均數為=84,第二種生產方式的平均數為=74.7,可知,所以第一種生產方式完成任務的平均時間大于第二種生產方式完成任務的平均時間,即第二種生產方式的效率更高。
圖表是信息的良好載體,具有直觀通俗的特點,在現代社會中,人們必須具備從各種傳媒的圖表中及時收取信息,加工處理為我所用的能力,這是社會的要求,也是素質教育的要求。
例3甲、乙兩人在一次射擊比賽中各射靶5次,兩人成績的條形統計圖如圖2所示,則( )。

圖2
A.甲的成績的平均數小于乙的成績的平均數
B.甲的成績的中位數等于乙的成績的中位數
C.甲的成績的方差小于乙的成績的方差
D.甲的成績的極差小于乙的成績的極差
解:甲的平均數是中位數 是 6,極 差 是 4,方 差 是
所以甲的成績的方差小于乙的成績的方差,應選C。
高考對方差的考查仍是以熟練運用公式為前提,重點考查公式的具體運用。方差公式為s2=當一組數據較大時,將各個數據同時減去一個與它們的平均數接近的常數,則新數據的方差等于原數據的方差。
例4(2018年高考天津卷)已知某校甲,乙,丙三個年級的學生志愿者人數分別為240,160,160。現采用分層抽樣的方法從中抽取7名同學去某敬老院參加獻愛心活動。
(1)應從甲,乙,丙三個年級的學生志愿者中分別抽取多少人?
(2)設抽出的7名同學分別用A,B,C,D,E,F,G表示,現從中隨機抽取2名同學承擔敬老院的衛生工作。
①試用所給字母列舉出所有可能的抽取結果。
②設M為事件“抽取的2名同學來自同一年級”,求事件M發生的概率。
解:(1)由題意可知,甲,乙,丙三個年級的學生志愿者人數之比為3∶2∶2。由于采用分層抽樣的方法從中抽取7名同學,因此應從甲,乙,丙三個年級的學生志愿者中分別抽取的人數為7=2。
(2)①從抽出的7名同學中隨機抽取2名同學的所有可能結果為{A,B},{A,C},{A,D},{A,E},{A,F},{A,G},{B,C},{B,D},{B,E},{B,F},{B,G},{C,D},{C,E},{C,F},{C,G},{D,E},{D,F},{D,G},{E,F},{E,G},{F,G},共21種情況。
②不妨設抽出的7名同學中,來自甲年級的是A,B,C,來自乙年級的是D,E,來自丙年級的是F,G,則從抽出的7名同學中隨機抽取2名同學來自同一年級的所有可能結果為{A,B},{A,C},{B,C},{D,E},{F,G},共5種情況。所以事件M發生的概率為P(M)=
本題主要考查概率與樣本特征數的應用。解答本題的關鍵是正確理解分層抽樣的意義。
1.為評估一種農作物的種植效果,選了n塊地作為試驗田。這n塊地的畝產量(單位:kg)分別為x1,x2,…,xn,下面給出的指標中可以用來評估這種農作物畝產量穩定程度的是( )。
A.x1,x2,…,xn的平均數
B.x1,x2,…,xn的標準差
C.x1,x2,…,xn的最大值
D.x1,x2,…,xn的中位數
提示:評估這種農作物畝產量穩定程度的指標是標準差或方差。應選B。
2.已知一組數據6,7,8,9,10,則該組數據的方差是
提示:一組數據6,7,8,9,10的平均數為=8,所以該組數據的方差為8)2+(9-8)2+(10-8)2]=2。
3.在一次馬拉松比賽中,35名運動員的成績(單位:min)如圖3所示。

圖3
若將運動員按成績由好到差編為1~35號,再用系統抽樣方法從中抽取7人,則其中成績在區間[130,151]上的運動員人數為( )。
A.3 B.4 C.5 D.6
提示:根據莖葉圖中的數據,可知成績在區間[130,151]上的運動員人數為30。用系統抽樣方法從35人中抽取7人,成績在區間[130,151]上的運動員應抽取的人數為7×,應選D。