■張文偉
(1)抽簽法適用于總體中個體數較少的情況,隨機數法適用于總體中個體數較多的情況。(2)一個抽樣試驗能否用抽簽法,關鍵看兩點:一是抽簽是否方便,二是號簽是否易攪勻。一般地,當總體容量和樣本容量都較少時可用抽簽法。
例1某班級有男生20人,女生30人,從中抽取10人作為樣本,其中一次抽樣結果是抽到了4名男生、6名女生,則下列命題正確的是( )。
A.這次抽樣可能采用的是簡單隨機抽樣
B.這次抽樣一定沒有采用系統抽樣
C.這次抽樣中每個女生被抽到的概率大于每個男生被抽到的概率
D.這次抽樣中每個女生被抽到的概率小于每個男生被抽到的概率
解:這次抽樣可以采用的是簡單隨機抽樣,A正確。這次抽樣可以采用系統抽樣,男生編號為1~20,女生編號為21~50,間隔為5,依次抽取1號,6號,…,46號即可,B錯誤。這次抽樣中每個女生被抽到的概率等于每個男生被抽到的概率(等可能抽樣),C和D錯誤。應選A。
跟蹤練習1:總體由編號為01,02,…,19,20的20個個體組成。利用隨機數表(如表1)選取5個個體,選取的方法是從隨機數表第1行的第5列和第6列數字開始由左到右依次選取兩個數字,則選出來的第5個個體的編號為( )。

表1

提示:選出的5個個體的編號依次是08,02,14,07,01。應選D。
系統抽樣的步驟:①先將總體的N個個體編號。②確定分段間隔k(k∈N*),對編號進行分段,當(n是樣本容量)是整數時,取③在第1段用簡單隨機抽樣確定第1個個體編號l(l≤k)。④按照一定的規則抽取樣本,通常是將l加上間隔k得到第2個個體編號(l+k),再加上k得到第3個個體編號(l+2k),依次進行下去,直到獲取整個樣本。
例2為規范學校辦學,省教育廳督察組對某所高中進行了抽樣調查。抽到的班級一共有52名學生,現將該班學生隨機編號,用系統抽樣的方法抽取一個容量為4的樣本,已知7號,33號,46號同學在樣本中,那么樣本中還有一位同學的編號應是( )。
A.13 B.19 C.20 D.51
解:由系統抽樣的特點,可知抽樣的間隔為,故抽取的樣本的編號分別為7,7+13,7+13×2,7+13×3,即7,20,33,46。應選C。
跟蹤練習2:將參加夏令營的600名學生按001,002,…,600進行編號。采用系統抽樣的方法抽取一個容量為50的樣本,且隨機抽得的號碼為003。這600名學生分別住在3個營區,從001到300在第一營區,從301到495在第二營區,從496到600在第三營區,這3個營區被抽中的人數依次為( )。

提示:由題意及系統抽樣的定義可知,將這600名學生按編號依次分成50組,每組各有12名學生,第k(k∈N*)組抽中的號碼是3+12(k—1)。令3+12(k—1)≤300,得k≤,因此第一營區被抽中的人數是25。令300<3+12(k—1)≤495,得,因此第二營區被抽中的人數是42—25=17,由此可得第三營區被抽中的人數為50—25—17=8。應選B。
分層抽樣的常見求法:①依據各層總數與樣本數之比,求出抽樣比。②直方圖中縱軸表示由某層總體個數(或樣本數)求出該層的樣本數(或總體個數)。③利用抽樣比,求出各層的樣本數。
例3甲、乙兩套設備生產的同類型產品共4800件,采用分層抽樣的方法從中抽取一個容量為80的樣本進行質量檢測。若樣本中有50件產品由甲設備生產,則乙設備生產的產品總件數為____。
解:分層抽樣中各層的抽樣比相同。若樣本中甲設備生產的有50件,則乙設備生產的有30件。在4800件產品中,甲、乙設備生產的產品總數比為5:3,所以乙設備生產的產品的總件數為
跟蹤練習3:某大學為了解在校本科生對參加某項社會實踐活動的意向,擬采用分層抽樣的方法,從該校四個年級的本科生中抽取一個容量為300的樣本進行調查。已知該校一年級、二年級、三年級、四年級的本科生人數之比為4:5:5:6,則應從一年級本科生中抽取的學生人數為____。
提示:由分層抽樣的特點,可知從一年級本科生中應抽取的學生人數為300=60。
解決頻率分布直方圖問題要注意的幾點:①直方圖中各小長方形的面積之和為1。,每組樣本的頻率,即小長方形的面積。③直方圖中每組樣本的頻數=頻率×總體數。
例4在樣本的頻率分布直方圖中,共有9個小長方形,若中間一個小長方形的面積等于其他8個小長方形的面積和的,且樣本容量為140,則中間一組的頻數為( )。

解:設中間一個小長方形的面積為x,則其他8個小長方形的面積為x。由x+,解得,所以中間一組的頻數為應選B。
跟蹤練習4:某校為了解高一年級全體學生的體能情況,抽取了部分學生進行1m i n跳繩次數測試,將所得數據整理后,畫出頻率分布直方圖(如圖1所示),圖中從左到右各小長方形的面積之比為2:4:17:15:9:3,第二小組的頻數為12。

圖1
(1)第二小組的頻率是多少?樣本容量是多少?
(2)若次數在110以上(含110次)為達標,則該校高一年級全體學生的達標率是多少?
提示:(1)頻率分布直方圖是以面積的形式反映數據落在各小組內的頻率大小的,因此第二小組的頻率為0.08。又因為第二小組的頻率=所以樣本容量 =
(2)由頻率分布直方圖可估計該校高一年級全體學生的達標率為
由莖葉圖可以清晰地看到數據的分布情況,這與頻率分布直方圖類似。從莖葉圖中能看到原始數據,沒有任何信息損失,莖葉圖便于記錄和表示。當樣本容量較大時,作圖較煩瑣。
例5圖2所示的莖葉圖是某班學生在一次數學測試時的成績。

圖2
根據莖葉圖,得出該班男、女生數學成績的四個統計結論,其中錯誤的一項是( )。
A.15名女生成績的平均分為78
B.17名男生成績的平均分為77
C.女生成績和男生成績的中位數分別為82,80
D.男生中的高分段和低分段均比女生多,相比較男生兩極分化比較嚴重
解:由圖可知15名女生成績的平均分為78,A正確。17名男生成績的平均分為77,B正確。觀察莖葉圖,對男生、女生成績進行比較,可知男生兩極分化比較嚴重,D正確。根據女生和男生成績數據分析可得兩組數據的中位數均為80,C錯誤。應選C。
跟蹤練習5:在某雜志的一篇文章中,每個句子中所含的字數如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17。在某報紙的一篇文章中,每個句子中所含的字數如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22。
(1)將這兩組數據用莖葉圖表示。
(2)將這兩組數據進行比較分析,得到什么結論?
提示:(1)畫出莖葉圖,如圖3所示。

圖3
(2)雜志文章中每個句子的字數集中在10~30之間,中位數為22.5;而報紙文章中每個句子的字數集中在10~40之間,中位數為27.5。可以看出雜志文章中每個句子的平均字數比報紙文章中每個句子的平均字數要少,說明雜志作為讀物更通俗易懂、簡明扼要。
平均數和方差都是重要的數字特征,是對總體的一種簡明的闡述。平均數、中位數、眾數描述總體的集中趨勢,方差和標準差描述波動大小。平均數、方差公式的推廣:若數據的平均數為x,方差為s2,則數據的平均數為方差為
例6為了解某校九年級1600名學生的體能情況,隨機抽查了部分學生,測試1m i n仰臥起坐的成績(次數),將數據整理后繪制成如圖4所示的頻率分布直方圖,根據統計圖的數據,下列結論錯誤的是( )。

圖4
A.該校九年級學生1m i n仰臥起坐的次數的中位數為26.25
B.該校九年級學生1m i n仰臥起坐的次數的眾數為27.5
C.該校九年級學生1m i n仰臥起坐的次數超過30的人數約為320
D.該校九年級學生1m i n仰臥起坐的次數少于20的人數約為32
解:由頻率分布直方圖可知,中位數是頻率分布直方圖中的左右面積等分線對應的數值(橫坐標),容易判斷中位數位于第三組,可計算得到中位數為26.25。眾數是最高小矩形底邊中點的橫坐標,即眾數為27.5。1m i n仰臥起坐的次數超過30的頻率為0.04×5=0.2,所以估計1m i n仰臥起坐的次數超過30的人數為320。1m i n仰臥起坐的次數少于20的頻率為0.1,所以估計1m i n仰臥起坐的次數少于20的人數為160。應選D。
跟蹤練習6:甲、乙兩位選手參加射擊選拔賽,其中連續5輪比賽的成績(單位:環)如表2所示。

表2
則甲、乙兩位選手中成績最穩定的選手的方差是____。
求回歸直線方程前應通過散點圖或相關系數進行相關性檢驗,確定是否有必要根據公式求回歸直線方程,從而有依據地進行預測。求線性回歸方程的步驟:①計算②計算③計算系數b=;④寫出回歸方程
例7在一組樣本數據(x1,y1),(x2,的散點圖中,若所有樣本點都在曲線附近波動,經計算,則實數b的值為____。
解:令t=x2,則曲線方程變為線性回歸方程,即,此時,把的坐標代入可得,解得
跟蹤練習7:某單位為了制訂節能減排的計劃,隨機統計了某4天的用電量y(單位:度)與當天氣溫x(單位:℃),并制作了對照表(如表3)。由表中數據,得線性回歸方程,當某天的氣溫為—5℃時,預測當天的用電量約為____度。

表3
提示:氣溫的平均值10—1)=10,用電量的平均值34+38+64)=40。因為回歸直線必經過樣本中心點,所以40=—2×10+a,解得a=60,故回歸方程為
為研究語文成績和英語成績之間是否具有線性相關關系,統計某班學生的兩科成績得到如圖5所示的散點圖(x軸,y軸的單位長度相同),用回歸直線方程?y=b x+a近似地刻畫其相關關系,根據圖5,以下結論最有可能成立的是( )。

圖5
A.線性相關關系較強,b的值為1.25
B.線性相關關系較強,b的值為0.83
C.線性相關關系較強,b的值為—0.87
D.線性相關關系較弱,無研究價值
提示:由散點圖可以看出兩個變量所構成的點在一條直線附近,所以線性相關關系較強,且為正相關,所以回歸直線方程的斜率為正數。從散點圖觀察,回歸直線方程的斜率應該比直線y=x的斜率要小一些。應選B。