
第3章 數據的集中趨勢和離散程度
領" 銜" 人:鄧昌濱(正高級教師)
組稿團隊:江蘇省鄧昌濱網絡名師工作室
“數據的集中趨勢和離散程度”屬于“統計與概率”領域中的“統計”部分。初中與“統計”有關的內容分別為八(下)“數據的收集、整理、描述”、九(上)“數據的集中趨勢和離散程度”和九(下)“概率與統計的簡單應用”。本章主要介紹了刻畫數據集中趨勢的統計量——平均數、中位數和眾數,以及刻畫數據離散程度的統計量——極差、方差和標準差,以此掌握數據分析(如圖1)的方法,從而能對數據進行簡單處理并作出評判。
分析數據,用數據說話
生活離不開數據。一般地,我們常用平均數、中位數和眾數表示數據的集中趨勢,用極差和方差表示數據的離散程度。這些數可以幫助我們從不同角度更加全面地認識生活中的數據,掌握處理數據的方法,從而能對研究對象做出合理的推斷和預測。
在小學階段,我們主要從動態的生活情境中,經歷、體驗簡單數據的統計過程,學會了收集數據、整理數據,并會用統計圖表直觀形象地描述數據。初中階段,我們會在已有數據的基礎上,分析其蘊含的規律,進而獲取需要的信息,為做出決策提供依據。到了高中階段,我們還會進一步學習數據收集和整理的方法、直觀圖表的表示方法、數據統計特征的刻畫方法等,感悟在實際生活中進行科學決策的必要性和可能性。
集中趨勢與離散程度
在統計學中,平均數反映一組數據的“平均水平”,其大小不僅受一組數據中各個數值大小的影響,而且受這組數據中各個數值出現的頻數的影響,即“權”的差異的影響。中位數是唯一的,如果數據的個數是奇數,則數據從大到小(或從小到大)排列后,中間的那個數據就是這組數據的中位數;如果數據是偶數個,則數據從大到小(或從小到大)排列后,中間兩個數據的算術平均數就是這組數據的中位數。中位數反映一組數據的“中等水平”,當一組數據的個別數據偏大或偏小時,用中位數來描述該組數據的集中趨勢就比較合適。眾數不一定唯一,它反映一組數據的“多數水平”,其大小只與部分數據有關。
方差是表示一組數據波動大小的統計量。方差越大,數據越不穩定。當一組數據的平均數相等或相近時,它們的波動大小可以通過畫圖觀察得到。如何引入方差呢?為什么用方差來刻畫數據的離散程度相對合理呢?這是本章的學習難點。
在學習方差的過程中,我們通過觀察折線統計圖,可以直觀地發現數據的波動(離散)程度。當數據的大小比較接近時,我們通過觀察很難直接判斷,這時就需要引入一個類似于平均數的統計量來分析數據。通過計算最大值和最小值的差,我們發現它們能夠刻畫數據的離散程度,于是試著引入極差,發現極差雖能刻畫數據的波動范圍,但不能刻畫每個數據的離散情況。我們又通過計算每個數據與平均數的差,發現它能體現這組數據相對平均水平的偏離情況,但偏差之和經過正負抵消后為“0”,直接“求和”并不能反映這組數據的離散程度。這時,我們找到解決這個問題的兩種方法。方法一:先求偏差的絕對值,再求和;方法二:先求偏差的平方,再求和。這樣,通過分別計算結果,發現這兩種方法都能刻畫這組數據的離散程度,但偏差平方的和相對更好一些。最后,通過計算波動相同而個數不同的兩組數據的偏差平方和,我們發現其結果還受數據個數的影響,從而探究出用偏差平方和除以數據個數的方法,進而引入方差的概念。
(作者單位:江蘇省興化市楚水初級中學)