李虎成
(佳木斯佳宇建材有限公司,黑龍江 佳木斯 154002)
數理統計是一門具有廣泛應用的數學分支,它根據試驗或觀測得到的數據來研究隨機現象,并對研究對象做出估計、判斷。在混凝土的生產過程、質量控制、原材料檢測、配合比試驗中,會產生大量的試驗數據。應用數理統計知識可以幫助分析和處理這些數據,從而得出結論以便優化生產,保證質量穩定性,預測試驗結果等。數理統計方法在混凝土相關數據處理中具有廣泛應用,包括誤差分析、參數估計、假設檢驗、方差分析、抽樣檢驗、控制圖、回歸分析、試驗設計等。下面主要從假設檢驗、控制圖及回歸分析等幾個方面結合實例介紹數理統計在混凝土數據處理中的應用。數據計算處理則借助 Excel 軟件這一簡便實用的工具。
把試驗的全部可能觀測值稱為總體。其中的每一個觀測值稱為個體。從總體中隨機抽取一部分的個體稱為樣本。所有觀測值的平均值就是總體的均值μ。但試驗是有限次數的樣本。常采用樣本平均值來檢驗總體平均值和估計總體平均值,樣本平均值(Excel 函數命令 AVERAGE)按下式計算:

式中:Xi為樣本值。
采用總體方差 σ2來反映數據波動的大小,樣本方差S2作為 σ2的無偏估計量用來估算總體方差。樣本方差 (Excel 函數命令 STDEV)按下式計算:

σ 和S分別稱為總體標準差和樣本標準差,(Excel 函數命令 VAR)。
正態分布又稱高斯分布,是數理統計中非常重要的一種概率分布,混凝土強度波動,試驗誤差等許多隨機變量都服從正態分布。若隨機變量X服從平均值μ、方差 σ2的正態分布,記為X~N(μ,σ2)。其概率密度函數用下式表示:

當μ=0,σ2=1 時,稱X服從標準正態分布(Excel函數命令 NORMSDIST),記為X~N(0,1)。標準正態分布密度函數為:

正態分布曲線是單峰對稱曲線,最大值在 x=μ處。曲線拐點在 x =μ±σ 處。離平均值μ越近,概率越大,在 ±3σ 以外的概率僅約為 0.3%,幾乎不可能發生,也就是所說的“3σ”法則,見圖 1 。

圖1 標準正態分布
假設檢驗是在不知道總體的分布函數或者雖然知道分布函數形式,但不知其參數的情況下,為了推斷總體的有些未知特性,提出某些對總體的假設。根據樣本對所做出假設是接受還是拒絕的決策過程。假設檢驗在混凝土數據處理中具有非常廣泛的應用。
例 1 某預拌混凝土企業生產 C25 混凝土,粗骨料采用 5~31.5mm 碎石,平均強度μ0=29.2MPa。因原材料短缺,粗骨料采用 5~31.5mm 卵石,在其他原材料相同的情況下,按同樣的配合比成型 7 組混凝土,取得強度數據如下:27.8MPa,28.2MPa,31.2MPa,25.8MPa,29.6MPa,26.7MPa,28.3MPa。判斷更換卵石后,總體平均強度是否有顯著變化?(顯著性水平為5%)
首先稱“更換卵石后,總體平均強度也不變”這種假設為原假設,記作H0,與原假設對立的假設“更換卵石后,總體平均強度發生變化”稱為備擇假設,記作H1。對原假設進行檢驗叫做假設檢驗。本例中混凝土抗壓強度X符合正態分布,即X~N(μ,σ2),這里均值μ和方差 σ2均未知,問題是根據樣本值判斷μ=29.2 還是μ≠29.2,屬于正態總體均值的假設檢驗。
設H0:μ = μ0,H1:μ ≠ μ0
當方差 σ2未知時采用 檢驗法,計算檢驗統計量:

算得=28.2MPa,S=1.8MPa。
應用t檢驗
查t分布表得t0.025(6)=2.45>t=1.44,所以接受假設H0,即更換卵石后,總體平均強度沒有顯著變化。以上檢驗法稱為t檢驗法,其中t分布統計值t0.025(6) 也可以在 Excel 輸入函數命令 [=TINV(0.05,6)] 得到。t檢驗法適用于總體方差 σ02未知的情況。
2.2.1 單個總體的情況
對于符合正態分布的總體X~N(μ,σ2),μ, σ2均未知,要求檢驗假設(顯著性水平為α)

作為統計檢驗量,拒絕域為

以上檢驗法稱為2χ檢驗法,分布函數2χ稱為卡方分布。
例 2 某預拌混凝土公司質量穩定,C30 混凝土 28d抗壓強度長期服從方差 σ2=2.7MPa 的正態分布,該公司五月份生產取用了新開采的江砂,含水率波動較大。現從五月份該批 C30 混凝土隨機取樣 26 組試樣,測得其樣本方差S2=3.5MPa。判斷根據這一數據能否推斷該批混凝土的抗壓強度波動性較以往有顯著的變化(取顯著性水平α=0.05)。
設H0: σ2=2.7,H1: σ2≠2.7
n= 26,其中2χ統計值可以查表求得,也可以在 Excel 輸入函數命令[=CHIINV(0.025,25)] 求得。同樣方法得到代入式 (7)得到拒絕域為

由S2=3.5 得所以拒絕H0,結論為該批混凝土抗壓強度波動性較以往具有顯著性變化。
2.2.2 兩個總體的情況

由數理統計知識,我們取

作為統計檢驗量,拒絕域為

以上檢驗法稱為F檢驗法。
例 3 某混凝土攪拌站在校準稱量系統前取得 21 組抗壓強度數據,樣本標準差S1=3.6MPa,校準后取得相同配合比的強度數據 16 組,樣本標準差S2=1.9MPa。判斷校準前后混凝土均勻性是否具有顯著差異(顯著性水平α取 0.05).
n1=21,n2=16,Fα/2(n1-1,n2-1) =F0.025(20,15) = 2.756,其中F統計值可以查表求得,也可以在 Excel 輸入函數命令[=FINV(025,21,15)] 求得。同樣方法得到F0.975(20,15) = 0.259。代入式 (9) 可得拒絕域為
F≥2.756 和F≤0.259 的并集。
結論為校準前后混凝土均勻性具有顯著差異。
控制圖也稱休哈特控制圖。是由沃特.休哈特(Walter A.Shewhart)博士于 1924 年首先提出的一種實用管理方法。它將顯著性統計原理應用于生產過程,通過作圖方法來了解生產過程的穩定性。控制圖方法在歐美、日本等發達國家得到廣泛應用,美國混凝土學會(ACI)及日本建設省也早已將其納入混凝土相關規范。
由正態分布可知,樣本值落在μ±3σ 之外的概率僅約為 0.3%,幾乎不可能發生。如果發生了,則說明生產過程有系統因素存在。管理圖的作用在于判斷在生產過程的受控狀態,區分系統因素和偶然因素,當樣本點出現在控制限以外,則說明生產出現異常,需要及時查找原因并通過組織、管理、經濟、技術等措施消除異常,保持生產過程的穩定性。控制圖的判斷準則就是μ±3σ。圖 2 中平均值μ稱為中心線 CL;μ+σ 稱為上控制限 UCL;μ-σ 稱為下控制限 LCL。控制圖分為計量管理圖和計數管理圖,在混凝土數據處理中,一般采用計量管理圖,即管理混凝土強度、含氣量、坍落度、容重等統計量。計量管理圖中,以混凝土抗壓強度為例常用均值圖與極圖R圖或標準差S圖。

圖2 管理圖判斷準則
由于在實際生產中μ與 σ 通常未知,并不能簡單通過μ±3σ 來作出控制圖,可以通過總均值來估計μ作出中心控制線 CL;根據樣本的極差或者標準差來估計 σ 作出 UCL 線和 LCL 線。表 1 是 GB/T 4091—2001《常規控制圖》(以下簡稱《控制圖》)給出的相應控制限公式。其中A2、A3、D4、B4等為常數,可以通過《控制圖》內的表 2 查得。

表1 控制圖控制限公式
例 4 表 2 為某預拌混凝土企業 2017 年七月份連續生產的同一配合比混凝土 28d 抗壓強度樣本數據共計25 組,作出該月混凝土的平均值圖。

表2 混凝土 28d 抗壓強度數據 MPa
其中子組數k為 25,
中心線CL==36.1MPa;上控制限UCL=X+A3= 36.1+1.954×1.66=39.4MPa;下控制限LCL=-= 36.1-1.945×1.66=32.9MPa。這里由子組內樣本數n=3,在《控制圖》標準表 2 中查得A3為 1.945。
在 Excel 中選擇“插入”—“圖表”—“折線圖”可以方便的畫出平均值圖,見圖 3。

圖3 混凝土 28d 抗壓強度平均值圖
畫出之后,可以根據《控制圖》中第 7 款的八個模式檢驗示意圖來判斷生產過程的穩定性。
回歸分析是確定當自變量x變化時,因變量 Y 大體按照某種規律變化的一種數理統計方法。其在混凝土數據處理中具有廣泛應用,在試驗數據處理、求得經驗公式、產品質量控制等許多方面,回歸分析是一種有力的方法。如果在回歸分析中,只包括一個自變量和一個因變量,且二者的關系可用一條直線近似表示,則這種回歸稱為一元線性回歸分析。一元線性回歸模型為:

其中ε為隨機變量,b稱為回歸系數。
通常使用最小二乘法求出一條直線,使試驗點離這條直線縱坐標距離的平方和最小,稱這條直線方程為回歸方程:


對于一些非線性關系,也可以通過變量代換轉化成線性關系而求得回歸方程。
例 5 某次混凝土凝結時間試驗測得表 3 中試驗數據,求該批混凝土的初、終凝時間。
試驗證明,混凝土貫入阻力與凝結時間的關系符合冪函數關系,即:

式中:t——時間,min;
fPR——貫入阻力,MPa;
c、k ——經驗系數。
其屬于非線性回歸關系,對公式 (14) 兩邊取自然對數,并移項,按照 GB/T 50080—2016《普通混凝土拌和物性能試驗方法標準》的要求以 lnfPR為自變量、lnt
為因變量得到:


式中α、b——最小二乘估計值。
當貫入阻力為 3.5MPa 時的t為初凝時間ts,貫入阻力為 28MPa 時t為終凝時間te:

采用 Excel 中的散點圖及趨勢線可以較方便的求解出回歸方程為 y = 0.1298 x + 6.3843,見圖 4。

表3 混凝土凝結時間實測數據

圖4 混凝土凝結時間曲線圖
回歸系數α=6.3843,b=0.1298。將貫入阻力取 3.5MPa 帶入初凝時間公式 [Excel 函數命令為=EXP(B11+B13*LN(3.5)),B11 為回歸系數α所在單元格,B13 為回歸系數b所在單元格],得初凝時間ts為697min,同樣方法求得終凝時間te為 913min。
將非線性回歸轉化為線性回歸處理時,不能用變換成直線后的線性相關系數 r 來判斷曲線擬合的效果,應該直接根據實測值yi與回歸曲線上相應估計點來計算剩余平方和,此時有:

R2稱為相關指數,以區別于相關系數r,R2越接近1,表示曲線擬合得越好。本例中用 Excel 可以直接求出R2=0.9926,顯示擬合的效果比較好。
符合正態分布的隨機變量在混凝土數據中隨處可見,一般來說對非正態分布的隨機變量當樣本數n的數量足夠大時,根據大數定律與中心極限定理也可以當做正態分布來處理,這也是正態分布應用廣泛的原因。假設檢驗中的t分布,2χ分布及F分布統稱為三大分布,是符合正態分布隨機變量抽出的樣本的分布,在數理統計中占有重要地位。
控制圖的作用在于區分偶然因素與系統因素,并以±3σ 作為上下控制限。如果只有偶然因素,在 1000 次試驗中只會出現 3 次,是幾乎不可能超出控制限的,如果發生超過控制限的點,可以判定不是偶然因素引起的,這在數理統計中稱為小概率事件原理。
回歸分析主要研究變量之間是否具有一定的關系。如果存在關系,則選擇適當的函數表達式來描述變量之間關系的密切程度。一元線性回歸是指一個因變量與一個自變量的關系,它們之間的關系通過散點圖判定有線性趨勢,可以建立回歸直線。對于非線性關系,通常將觀測點分布形狀與函數圖像相比較,選擇某些函數類型,再對變量做適當變換,可以轉化成線性回歸問題。
[1] 盛驟,謝式千,潘承毅.概率論與數理統計[M].北京:高等教育出版社,2008.
[2] 蒲括,邵鵬.精通 Excel 數據與分析[M].北京:人民郵電出版社,2014.
[3] GB/T 4091—2001.常規控制圖[S].
[4] (澳)肯·戴.混凝土配合比設計、質量控制與規范[M].曾力譯.北京:中國建材工業出版社,2011.
[5] GB/T 50080—2016.普通混凝土拌合物性能試驗方法標準[S].