謝 翰
(廣東省汕尾市陸豐市龍山中學 516500)
統計中最基本的是對一組數據的概括性度量,集中趨勢(算術平均數、中位數)與離散程度(平均差、標準差)作為描述數據分布特征的一體兩面 , 反映了一組數據的中心值和各數據遠離其中心值的程度.只考慮集中趨勢會使我們作出對總體的片面判斷,只有把集中趨勢和離散程度結合在一起分析,才能概括出總體的實際狀態.
離散程度指標主要有平均差和標準差兩種,平均差(mean deviation)是各數據到其算術平均數的平均距離,它綜合反映了各單位相對其算術平均數的平均波動程度.
平均差的含義明確,計算方法簡單明了,它能夠充分、客觀地反映離散程度.但也要看到,它是以離差的絕對值為計算基礎的,這就不利于進一步進行代數運算了.所以很多教科書都認為考察離散程度的大小最常用的統計量是標準差而非平均差.很多教科書指出,平均差不是變量的解析函數,也沒有函數的可導性,因而在代數推斷和應用方面都受到很大限制,并在實際使用上被標準差所取代.據此,本文從離差和平均數的性質重新出發,推導出了不含絕對值的平均差新公式.
因為各單位值與其算術平均數離差之和等于零,即



(1)
我們將公式(1)稱為新的平均差計量公式,它是由離差和平均數的性質推導出來的,運用公式(1)計算所得的平均差,不僅在數值上與傳統方法計算出來的平均差等價,而且擁有很多優良的特性.
從計算方式、數學關系和敏感性等幾個方面對平均差與標準差進行比較,可以得出以下結論:
第一,對于誰計算更簡便的問題,在數字計算時,平均差計算不存在平方和開平方計算,計算量遠低于標準差.在進行代數運算時,有了不含絕對值的平均差新公式,平均差計算更簡便的觀點在算術領域和在代數領域都能成立.平均差新公式在數學處理上比標準差更為合理和優越.
第二,對于同一組統計數據,平均差(Md)與標準差(σ)一定是如下關系:
σ≥Md≥0
第三,標準差的計算過程中,在離差的絕對值大于1時有高估離散程度問題,在離差的絕對值小于1時有低估離散程度問題.這種現象,在U形分布中比在鐘形分布中更為明顯.
第四,平均差新公式大大拓展了平均差具有的數學性質,并且與標準差相比,它兼具反映離散程度的準確性優勢.從測量離差的普遍思路出發,標準差只是平均差的代替;在不必使用絕對值的平均差新計算方法的情況下,更能代表平均偏離本真的平均差優于標準差,應當大力推廣使用和普及.
除此之外,簡化后的標準差公式更加簡潔而易記:先計算各數據平方的平均數,再減掉各數據平均數的平方,得出的就是方差.標準差公式的化簡過程如下:

(2)

(3)