徐菊萍
?
數據的分析要點精講
徐菊萍
1.統計量
頻數:一般地,我們稱落在不同小組中的數據個數為該組的頻數,也稱次數,是在一組依大小順序排列的測量值中,按一定的組距將其分組時出現在各組內的測量值的數目,即落在各類別(分組)中的數據個數.
如有一組測量數據,數據的總個數N= 148,最小的測量值0.03,最大的測量值31.67,按組距為3.000將148個數據分為11組,其中分布在15.05~18.05范圍內的數據有26個,則稱該數據組的頻數為26.
頻率:頻數與數據總數的比為頻率.
相同條件下的n次試驗中,事件A發生的次數n(A)稱為事件A發生的頻數.比值n(A)/n稱為事件A發生的頻率.
例1為了讓學生了解環保知識,增強環保意識,某中學舉行了一次環保知識競賽,共有900名學生參賽.為了解此次競賽的成績,從中抽取了部分學生的成績(得分取整數,滿分為100分)進行統計.請你根據尚未完成的頻數分布表和頻數分布直方圖(如圖2),解答下列問題.
(1)補全頻數分布表;
(2)補全頻數分布直方圖;
(3)在全體參賽學生中,競賽成績落在哪組范圍內的人數最多?
(4)若成績在90分以上(不含90分)為優秀,則該校成績優秀的學生約有多少人?


圖2
【解析】頻數分布表和頻數分布直方圖是我們進行數據統計的基本圖表,頻數分布表考查的是頻數、頻率、樣本容量三者之間的關系:頻率=頻數÷樣本容量.頻數分布直方圖是根據頻數分布表中的數據繪制的.本題中,樣本的優秀率可以看成全校的優秀率,所以全校的優秀人數等于全校人數乘樣本的優秀率.
解:(1)如下表:

(2)如圖3;
(3)在全體參賽學生中,競賽成績在80.5~90.5分范圍內的人數最多.
(4)900×0.24=216(人),
∴該校成績優秀的學生約有216人.
【點評】填寫頻數分布表時,要注意各頻數之和為樣本容量,各頻率之和為1.繪制頻數分布直方圖時,可以簡單地將各小長方形的高取成頻數,當所選的樣本具有一定的代表性和廣泛性時,就可以利用樣本的結果估計總體的相關結果,如第(3)、(4)題,
2.用樣本估計總體的思想
抽樣調查的目的,就是根據數據反映的集中程度和離散程度對總體進行估計,作出合理的判斷和預測,如圖4.

圖4
例2某地區為籌備中學生運動會,要從某校八年級9個班中抽取48名女生組成花束隊,要求隊員的身高一致,現隨機抽取10名八年級某班女生體檢表 (各班女生人數均超過20人),身高如下(單位:厘米):
165162158157162162 154160167155
(1)求這10名學生的平均身高;
(2)該校能否按要求組成花束隊?并說明理由.
【解析】本題主要考查用樣本估計總體的思想.
(2)能.理由如下:由于樣本中的162厘米出現的次數最多,從而可估計一個班級至少有6名女生的身高為162厘米.從而可估計全校身高為162厘米的女生人數為6×9=54>48,所以該校能按要求組成花束隊.
3.識圖能力、數據觀念
涉及有關統計圖表的問題,需要從統計圖表中準確提取信息,分析數據的含義.
例72012年1月7日,第十屆廈門國際馬拉松賽在鷺島鳴槍開跑.圖5是本次全程馬拉松、半程馬拉松、10公里賽程、5公里賽程的各項參賽人數占全體參賽人數比例的扇形統計圖.

圖5
(1)求參加全程馬拉松賽的人數占全體參賽人數的百分比;
(2)已知參加10公里賽程的人數為7200人,求參加全程馬拉松賽的人數.
【解析】本題綜合考查從扇形統計圖中獲取信息的能力,可結合扇形統計圖提供的信息及題意解答此題.
解:(1)參加全程馬拉松賽的人數所占的百分比為l-34.4%-12.9%-35.5%= 17.2%.
(2)全體參賽人數為7 200÷34.4%≈20 930(人).
參加全程馬拉松賽的人數為20 930× 17.2%≈3 600(人).
【點評】掌握扇形統計圖的意義是解決本題的關鍵.

(作者單位:江蘇省南京師范大學附屬蘇州石湖中學)