劉忠廣 河南工程學院工商管理學院
標準差、標準誤差是統計學的重要概念。標準差是根據原始數據計算的,反映一組原始數據的離散程度。而標準誤差是根據樣本統計量計算的,反映統計量的離散程度。標準差與標準誤差的區別還在于求標準差僅需要一個樣本的數據,但是求標準誤差需要多個樣本的數據。而在實際應用中,往往是根據一個樣本的數據來計算標準誤差的,這時計算的標準誤差就是估計標準誤差。這幾個概念比較抽象,理解起來比較困難。同時,不同的教材對標準誤差也有多種叫法,如標準誤[1]、抽樣平均誤差[2][3]、抽樣標準差[4]等等。另外,在統計學教學內容的線性回歸部分,不同教材對殘差均方的平方根的叫法也有不同,如估計標準誤差[5][6]、預測標準誤差[7]、回歸估計的標準誤差[8]等,這些都給統計初學者帶來了困惑和不解。
標準差的英文單詞是standard deviation, standard是典型或平均的意思,deviation的含義是離差,指一個分布中的一個取值與該分布的平均取值之差。所以標準差是一個分布單個取值與均值之間的典型或平均離差[9]。具體計算時各變量值與其算術平均數(也稱均值)離差平方的平均數稱為方差,方差的平方根即為標準差。標準差反映了每個變量值與其均值相比平均相差的數值,能準確地反映出數據的離散程度,標準差是應用最廣泛的反映數據離散程度的測度值。標準差的計算為:
如果獲取的是總體的數據,反映總體數據離散程度的可用總體標準差,其計算公式為:
σ=,μ為總體均值,N為總體數據的個數
一般來說,我們獲取的數據大多是樣本數據,反映樣本數據離散程度的為樣本標準差,其計算公式為:
s=為樣本均值,n為樣本容量(下同)
標準誤差(Standard Error)是某一統計量(如樣本均值、樣本均值之差、樣本比例、相關系數等)抽樣分布的標準差。標準誤差用于衡量樣本統計量的離散程度,在參數估計和假設檢驗中,它是用于衡量樣本統計量與總體參數之間差距的重要尺度。在實際應用中,標準誤差往往是根據樣本數據計算來的,根據樣本數據計算的標準誤差實際上是估計標準誤差(在用統計軟件計算時給出的都是估計標準誤差)。常見的標準誤差有樣本均值的標準誤差、樣本比例的標準誤差、樣本相關系數的標準誤差、線性回歸方程斜率及截距的標準誤差、回歸估計的標準誤差等。
【例】從某一高校的女生中隨機抽取10名學生,測其身高和體重數據見表1.

表1:某高校10名女生身高和體重數據

表2:某高校10名女生身高和體重的描述統計
從表2可以看出這10名女生的平均身高為161.7cm,平均體重為61.1kg.表中標準差是身高和體重的樣本標準差.標準誤差分別是身高和體重的估計標準誤差,是根據估計標準誤差的公式計算出來的,即:
可以估計全校女生的平均身高和平均體重95%的置信區間分別為:

表3 :某高校女生身體和體重的回歸統計
從表3可以得到相關系數為0.87,可以計算相關系數的標準誤差

5.12 > 2.306 ,所以拒絕原假設,結論是該校女生身高和體重相關關系顯著.
表中的標準誤差為回歸估計的標準誤差,其意義為,根據身高來預測體重時,平均的預測誤差為3.91kg.

表4:某高校女生身高和體重的方差分析表
根據表4方差分析表,由于P=0.00 < 0.05,所以,身高與體重的線性關系顯著.

表5:某高校女生身高和體重的回歸分析表
標準差、標準誤差和估計標準誤差這三個概念字面相似,但代表的含義有不同,標準差是根據原始觀測數據計算出來的,計算標準差僅需要一個樣本數據。標準誤差是根據統計量抽樣分布計算出來的,從理論上講計算標準誤差需要所有可能樣本的數據,但在實際應用中,是根據一個樣本的數據來計算標準誤差的,這時的標準誤差即為估計標準誤差。