孫慶利
(濟南大學工程訓練中心,山東濟南250022)
簡介水泥實驗室常用樣本分布特征值的Excel計算
孫慶利
(濟南大學工程訓練中心,山東濟南250022)
以水泥實驗室常用樣本分布特征值為例,運用Excel進行數據分析的輔助計算,顯示了Excel運算迅速、準確的優點。
樣本分布特征值Excel函數計算
研究或統計分析的對象的全體元素組成的集合稱為總體或母體。在統計工作中,可以根據產品的質量管理規程或實際工作需要,選定總體的范圍,如每個月的出廠水泥,某一批進廠煤或原材料,都可視為一個總體。要了解總體的性質,理論上必須對全部個體的性質進行測定,這在實際中往往是不可能的。在實際工作中只能從總體中抽取一定數量的、有代表性的個體組成樣本,通過對樣本的測量,并借助數理統計手段,對總體的分布中心和標準偏差進行推斷,從而掌握總體的性質。
來自總體的部分個體的集合,稱為樣本或子樣。樣本中所含樣品的個數稱為樣本容量或樣本大小。若樣本容量適當大,并且抽樣的代表性強,則通過檢測得到的分布特征值,就能很好地代表總體的分布特征值。在實際運用中,為了對總體情況有一個概括了解,需要用幾個數字表達出總體情況。這少數幾個數字在數理統計中稱為特征值。因此,在進行統計推斷前確定樣本分布的特征值,具有重要的實用價值。
常用的樣本分布特征值分為兩類:一是位置特征值;二是離散特征值。
位置特征值一般是指平均值,它是分析計量數據的基本指標。它們表達了數據的集中位置。反映了數據共同趨向的平均水平。位置特征值一般包括算術平均值、幾何平均值、加權平均值、中位數、眾數等。
離散特征值用來表示一組測量數據波動程度或離散性質,是表示一組測定值中各測定值相對于某一確定的數而言的偏差程度。一般是把各測定值相對于平均值的差異作為出發點進行分析。常用的離散特征值有平均差、極差、方差、標準偏差、變異系數等。
下面就對使用Excel工具對水泥實驗室常用樣本分布特征值的計算進行簡要介紹。
將一組測定值相加和,除以該組樣本的容量(測定所得到的測定數據的個數),所得的商即為算術平均值。設有一組測定數據,以x1,x2,…,xn表示。這組數據共由n個數據組成,其算術平均值見式(1):

式中:x1,x2,…,xn——各測量值;
n——樣本的容量。
例1:對水泥中三氧化硫含量(%)的測定,得到10個數據:2.8、2.9、2.6、2.7、2.8、2.8、2.9、2.8、2.8、2.6。
Excel計算如下:輸入各測定值;選中“B4”單元格;選擇常用函數“=AVERAGE(B3:K3)”;然后點擊“確定”即可得到其算術平均值為2.77,見圖1。

圖1 算術平均值的計算
加權平均值是考慮了每個測量值的相應權的算術平均值。將各測量值乘以與其相應的權,將各乘積相加后,除以權數之和,即為加權平均值。其計算公式如下。

式中:x1,x2,…xn——各測量值;
w1,w2,…wn——各測量值相應的權;
Σwi——各相應權的總和;
Σwixi——各測量值與相應權乘積之和。
例2:某水泥企業有三臺回轉窯。1號窯年產20萬噸熟料,平均抗壓強度為58.5MPa;2號窯年產15萬噸熟料,平均抗壓強度為57.8MPa;3號窯年產12萬噸熟料,平均抗壓強度為59.2MPa。求全廠全年生產的熟料的綜合抗壓強度。
Excel計算如下:輸入各測定值和權;選中“B5”單元格;輸入公式“=B3*B4”點擊“確定”再用鼠標左鍵點擊“B5”單元格,B5就被黑框框住,而且在黑框的右下角有個小黑方塊,將鼠標移動到這個小黑方塊(填充句柄)上,鼠標變成“+”的形狀,此時按下鼠標向右拖至D5,再釋放鼠標,其它的分子值就計算出來了。這里將這種方法稱為填充句柄法。
選中“E5”單元格,選擇常用函數“SUM(B5: D5)”;然后點擊“確定”即可得到整個分子之和;
選中“E4”單元格,選擇常用函數“SUM(B4: D4)”;然后點擊“確定”即可得到整個權之和;
選中“B6”單元格,輸入公式“=E5/E4”,然后點擊“確定”即可得到加權平均值。見圖2。

圖2 加權平均值的計算
中位數也是表示頻率分布集中位置的一種特征值。其意義是將一批測量數據按大小順序排列,居于中間位置的測量值,稱為這批測量值的中位數。當測量值的個數n為奇數時,第(n+1)/2項為中位數;當測量值的個數n為偶數時,位居中央的兩項之平均數即為中位數。
例3:對出磨水泥每2小時測定一次三氧化硫含量,某日共得12個測量值:2.86、2.91、2.65、2.70、2.82、2.73、2.88、2.92、2.75、2.84、2.77、2.85。求這組測量值的中位數。
Excel計算如下:輸入各測定值;選中“B4”單元格;輸入統計函數“=MEDIAN(B3:M 3)”,然后點擊“確定”即可得到中位數。見圖3。

圖3 中位數的計算
眾數是指在一組測量數據中出現次數最多的測量值。
例4:某水泥企業控制出磨水泥的細度(篩余)范圍為7.0%±1.0%。每小時測定一次,某日早班的測量數據(%)如下:7.4、7.1、7.8、7.4、7.5、7.4、7.6、7.5。
Excel計算如下:輸入各測定值;選中“B4”單元格;輸入統計函數“=MODE(B3:I3)”,然后點擊“確定”即可得到眾數為7.4,見圖4。

圖4 眾數的計算
均方根平均值是各測量值平方之和除以測量值個數所得商值的平方根。計算式如下:

式中:x1,x2,…,xn——各測量值;
n——測量值的個數;
Σxi2——各測量值的平方之和。
例5:某班對出磨水泥細度的測量值(篩余%)為:7.2、7.3、7.4、8.8、7.9、7.6、7.4、7.5。求該班出磨水泥的平均細度。
Excel計算如下:輸入各測定值;選中“B4”單元格;輸入公式“=POWER(B3,2)”點擊“確定”再用鼠標左鍵點擊“B4”單元格,B4就被黑框框住,運用填充句柄法,按下鼠標向右拖至I4,再釋放鼠標,其它的測量值的平方就計算出來了。
選中“J4”單元格,選擇常用函數“SUM(B4: I4)”;然后點擊“確定”即可得到整個測量值的平方之和。

圖5 均方根平均值的計算
選中“B5”單元格,輸入公式“=SQRT(J4/8)”,然后點擊“確定”即可得到均方根平均值。見圖5。另外一個方法:輸入各測定值;選中“B4”單元格;輸入函數“=SQRT(SUMSQ(B3:I3)/8)”,然后點擊“確定”也可得到均方根平均值。
極差是最簡單、最易了解的表示測量值離散性質的一個特征值。極差又稱全距,或范圍誤差,即在一組測量數據中最大值與最小值之差,見下式:

例6:測得三塊試體的抗壓強度為58.7、57.8、59.2、59.8、58.4、58.8(MPa),求此組試體的抗壓強度的極差。
Excel計算如下:輸入各測定值;選中“B4”單元格;輸入函數“=MAX(B3:G3)-M IN(B3:G3)”,然后點擊“確定”即可得到極差為2,見圖6。

圖6 極差的計算
一組測量數據中各測量值與該組數據平均值之偏差的絕對值的平均數,稱為平均絕對偏差,見下式。

式中:d——平均絕對偏差;
di——某一測量值xi與平均值x之差。
例7:以氟硅酸鉀容量法測定某水泥熟料樣品中二氧化硅的含量(%),所得結果為:21.50、21.53、21.48、21.57、21.52。計算該組測量結果的平均絕對偏差。
Excel計算如下:輸入各測定值;選中“B4”單元格;輸入函數“=ABS[B3-AVERAGE($B$3:$F $3)]”,然后點擊“確定”即可得到x1與平均值之差。再用鼠標左鍵點擊“B4”單元格,B4就被黑框框住,運用填充句柄法,此時按下鼠標向右拖至F4,再釋放鼠標,其它的測量值與平均值之差就計算出來了。然后點擊B5輸入公式“=SUM(B4:F4)/5”,再點擊“確定”則得到平均絕對偏差為0.024,見圖7。

圖7 平均絕對偏差的計算
另外一個方法:輸入各測定值;選中“B4”單元格;輸入統計函數“=AVEDEV(B3:F3)”,然后點擊“確定”也可得到平均絕對偏差。
方差是指各測量值與平均值的偏差平方和除以測量值個數而得的結果。采用平方可以消除正負號對差值的影響。
總體方差以δ2來表示,但在實際工作中,往往用樣本的方差s2來估計總體的方差。s2的計算式如下:

式中:xi——樣本中每個測量值(變量);
x——樣本平均值;
n——樣本容量。
例8:某廠有一臺水泥磨,在同一班里測定了出磨水泥的細度(篩余%):7.4、7.5、7.6、8.0、7.9、7.6、7.6、7.5。計算其方差。
Excel計算如下:輸入各測定值;選中“C4”單元格;輸入公式“=C3-AVERAGE($C$3:$J$3)”,然后點擊“確定”即可得到x1與平均值之差。再用鼠標左鍵點擊“C4”單元格,C4就被黑框框住,運用填充句柄法,此時按下鼠標向右拖至J4,再釋放鼠標,其它的測量值與平均值之差就計算出來了(注,參考文獻[1]的4號數據計算有誤)。然后點擊C5輸入公式“=C4^2”,點擊“確定”即可。然后點擊C5,它就被黑框框住,運用填充句柄法,此時按下鼠標向右拖至J5,再釋放鼠標,其它的測量值與平均值之差的平方值就計算出來了。然后點擊C6,輸入公式“=SUM(C5:J5)/(8-1)”便得到結果為0.042679,見圖8。

圖8 方差的計算
另外一種方法:輸入各測定值;選中“B4”單元格;輸入統計函數“=VAR(B3:I3)”,然后點擊“確定”也可得到方差。
標準偏差又稱標準差或均方差、均方根差。在描述測量值離散程度的各特征值中,標準偏差是一項最重要的特征值,一般將平均值和標準偏差兩者結合起來即能全面地表明一組測量值的分布情況。
總體標準偏差以δ來表示,但在實際工作中,以樣本標準偏差s來估計總體標準偏差,這時,s的計算式如下:

式中:s——總體標準偏差估計值,簡稱樣本標準偏差,或實驗標準偏差;
x——樣本平均值;
n-1——樣本自由度(記為f),n為樣本容量。
例9:水泥熟料中二氧化硅測定結果(%)為:21.50、21.53、21.48、21.57、21.52、21.56、21.52、21.53、21.46、21.48。計算該組數據的標準偏差。
Excel計算如下:輸入各測定值;選中“B4”單元格;輸入統計函數“=STDEV(B3:K3)”,然后點擊“確定”即可得到標準偏差為0.035355,見圖9。

圖9 標準偏差的計算
關于變異系數的計算讀者可以按照上面的計算分別計算出它的分子部分和分母部分,然后自行求出數據的變異系數,這里從略。
[1]中國建筑材料檢驗認證中心、國家水泥質量監督檢驗中心編著.水泥實驗室工作手冊[M].第一版,北京:中國建材工業出版社,2009年.
[2]蘇華等編著.Excel2003函數在辦公中的應用[M].第一版,北京:人民郵電出版社,2007年.
(編輯:張煢鶯)
TQ172.16 文獻標識碼:B 文章編號:1007-6344(2010)03-0045-04
2009-10-20】