■胡 煥
高考命題中的統計問題,雖然難度不大,但解題也得講究方法,可謂方法得當,事半功倍。那么統計問題主要有哪些常用的解題方法呢?
統計學是一門獨立的學科,統計術語有著獨特的含義,求解統計問題應遵循相關的定義。
例1(1)在一次馬拉松比賽中,35名運動員的成績(單位:min)的莖葉圖如圖1所示。

圖1
若將運動員按成績由好到差編號為1~35號,再用系統抽樣方法從中抽取7人,則其中成績在區間[139,151]上的運動員人數是
(2)我國古代數學名著《數書九章》有“米谷粒分”題,其大意是:糧倉開倉收糧,有人送來米1534石,驗得米內夾谷,抽樣取米一把,數得254粒內夾谷28粒,則這批米內夾谷約為( )。
A.134石 B.169石
C.338石 D.1365石
解:(1)依題意可將編號為1~35號的35個數據分成7組,每組有5個數據。
在區間[139,151]上共有20個數據,分在4個小組內,每組抽取1人,共抽取4人。答案為4。
(2)254粒和1534石中夾谷的百分比含量是大致相同的,據此可估計這批米內夾谷的數量。設1534石米內夾谷x石。由題意可得解得x≈169(石),即這批米內夾谷約為169石。應選B。
本題涉及簡單隨機抽樣和系統抽樣的有關定義,只有掌握了相關定義才能順利解題。對于系統抽樣,不僅要理解它的適用范圍,更要掌握這種抽樣的方法和特征。
依據統計中有關概念的意義建立方程求解問題,也是統計問題常用的解題方法。
例2將容量為n的樣本中的數據分成6組,繪制頻率分布直方圖,若第1組至第6組數據的頻率之比為2∶3∶4∶6∶4∶1,且前三組數據的頻數之和等于27,則n的值為( )。
A.60 B.55
C.50 D.45
解:由題意可設第1組至第6組數據的頻率分別為2x,3x,4x,6x,4x,x,則2x+3x+4x+6x+4x+x=1,解得所以前三組數據的頻率分別是由題意可得前三組數據的頻數之和為,解得n=60。應選A。
本題通過兩次列方程并解方程,使問題得到解決,這充分說明方程思想在統計問題中的重要性。
統計問題離不開運算,而且有時運算相當煩瑣,這時根據統計中的有關公式的特點,采用整體代換的方法,可以大大減少計算量。
例3現有10個數,其平均數是4,且這10個數的平方和是200,那么這組數的標準差是( )。
A.1 B.2
C.3 D.4
(2)已知樣本數據x1,x2,…,xn的平均數為,樣本數據y1,y2,…,ym的平均數為),若樣本數據x1,x2,…,xn,y1,y2,…,ym的平均數為=a+(1-a),其中0<a<,則n,m的大小關系為( )。
A.n<m B.n>m
C.n=m D.不能確定
解:(1)設這10個數為a1,a2,…,a10,則++…+=200,且a1+a2+…+a10=40,所以其方差s2=×[(a1-4)2+(a2-4)2+…+(a10-4)2]=×[++…+-8(a1+a2+…+a10)+160]=4,可知標準差為4=2。應選B。
在有關方差的計算問題中,利用整體代換的方法可以優化解題過程。
統計中經常涉及一些圖表問題,解題時往往需要制作圖表,或從給出的圖表中讀取有關信息,因此解決統計問題必須要用好圖表,且要重視數形結合法的應用。
例4理論預測某城市2020年到2024年人口總數與年份的關系如表1所示。

表1
(1)請畫出表中數據的散點圖。
(2)指出x與y是否線性相關。
(3)若x與y線性相關,請根據表中提供的數據,用最小二乘法求出y關于x的回歸方程=bx+a。
(4)據此估計2025年該城市的人口總數。
(參數數據:0×5+1×7+2×8+3×11+4×19=132,02+12+22+32+42=30)
解:(1)畫出表中數據的散點圖,如圖2所示。

圖2
(2)由散點圖可知,樣本點大致分布在一條直線附近,故x與y呈線性相關關系。
對兩個變量進行研究,通常是先作出兩個變量間的散點圖,根據散點圖直觀判斷兩個變量是否具有線性相關關系,如果具有線性相關關系,就可以應用最小二乘法求出線性回歸方程。由于樣本可以反映總體,所以可以利用所求的線性回歸方程,對這兩個變量所確定的總體進行估計,即根據一個變量的取值,預測另一個變量的取值。