胡 潔
(北京國建聯信認證中心有限公司,北京 100831)
水泥生產離不開大量的質量檢驗活動。質量檢驗的結果是否反映所檢對象的真實質量狀況,對于控制水泥質量、穩定生產過程、降低質量成本都具有十分重要的意義。要使質量檢驗的結果能夠反映所檢對象的真實質量狀況,除了要求檢驗本身準確無誤之外,所檢樣品的代表性也顯得非常重要。如果樣品的代表性不好,即使檢驗結果非常準確也不能反映所檢對象的真實質量狀況,這樣就會誤導質量控制,起到適得其反的作用,甚至產生非常嚴重的后果。從另一方面來看,水泥生產的過程是對大宗物料加工的過程,就一個批次的產品或原料而言,少則幾百噸,多則數千噸甚至上萬噸。而進行質量檢驗所需的樣品多則只要幾千克,少則僅需0.5g。由此可見樣品的代表性問題的確不可忽視。怎樣對大宗物料進行科學取樣,保證樣品有足夠的代表性,本文就此進行一些分析和研究。
為了分析問題的方便,我們有必要弄清楚相關的幾組名詞術語的含義。
在統計分析中,將研究對象中的每一個最基本的單元稱為個體。而將構成研究對象的所有個體的集合即全部個體的總和稱為總體(或母體)。總體可以無限大,也可以是有限的,可根據不同的需要進行選擇和確定。例如,我們將某個編號的水泥作為研究對象,則這個編號的全部水泥就是總體,而其中的每一包水泥就可以看成是個體。
按照規定的方法和要求在總體中隨機地抽取的一部分個體就稱為樣品(或樣本)。而樣品的代表性是指樣品能夠代表和反映所取樣的對象真實質量狀況的程度。樣品的代表性越好,則它所能代表和反映所取樣的對象整體真實質量狀況的程度越高。故樣品的代表性又可稱為樣品的可靠性。
在某一空間位置點上和某一時間刻度點上所取得的樣統稱為子樣。前者針對靜止堆放的物料取樣而言,故又稱為點位樣;后者則是針對輸送或流動中的物料取樣而言,故又稱為瞬時樣。將若干個子樣即不同空間位置的點位樣或不同時間刻度的瞬時樣合并在一起就是綜合樣(又稱混合樣)。由此可見,子樣所代表和反映的是具體“點”(也可以看成是個體)的狀況,而綜合樣則是代表和反映總體的狀況。
數據離散性是指一組若干個表示相同意義的數據之間彼此遠離(或接近)的程度。在符合正態分布規律的條件下,數據離散性可以用標準偏差值來定量表示。一組離散性數據的標準偏差就是這組數據中的每一個數據與這組數據的平均值之差平方的平均值的算術平方根(參見本文三、1部分)。標準偏差值越大(小),表明數據之間彼此遠離的程度越大(小),反之亦然。
從相關質量理論和水泥生產實踐我們知道,無論是原料、半成品還是成品,內在質量的波動性總是存在的,只是偏差波動的程度不同而已。對于待取樣檢測的物料而言,整體質量狀況是未知的,內在質量的偏差波動程度也是未知的。但是,盡管如此,對于一批確定的物料,無論數量多少,我們都可以視它為若干個檢測單元所組成。檢測單元就是指進行某項質量指標檢測時所需要的最少物料量,它隨檢測項目的不同而不同。例如,檢測熟料f-CaO需要0.5g是試樣,則這時的檢測單元就是0.5g。那么就可以將某批量的熟料視為由若干個0.5g所組成。從理論上講我們可以對每一個檢測單元分別進行檢測,每一個檢測單元都可以得到一個檢測結果(不考慮檢測結果本身存在的偏差,將每個檢測結果都視為準確的)。這樣就得到若干個檢測結果xi(i=1,2,3,……n)。由于物料本身內在質量是不均勻的,所以這若干個檢測結果有高有低,也有彼此相等的。任何一個檢測單元的檢測結果可能是高的或較高的,也可能是低的或較低的,還可能是中等或接近中等的。也就是說它們是在一定范圍內隨機取值的。若干檢測結果的高中低隨機性可以用圖1直觀表示。

圖1 所有檢測單元檢測結果示意圖(縱軸表示檢測結果,橫軸表示所有檢測單元)
從圖1看,這若干個檢測結果雖然看上去雜亂無章,但它們作為一個整體是符合正態分布規律的。即所有檢測結果以平均值x-為中心在其兩邊對稱分布。離平均值x-越近的檢測結果出現的頻率越大,離平均值x-越遠的檢測結果出現的頻率越小,而所有檢測結果出現的頻率之和為1。最大值與最小值的極差取決于所有檢測結果之間的離散程度即標準偏差值的大小(見圖2)。正態分布就是物料內在質量偏差波動性的本質特征。

圖2 所有檢測結果出現的頻率曲線圖
如果物料本身是絕對均勻的,我們只要在這樣的物料中的任意位置取足夠的樣品就可以了。但是由于物料內在質量的偏差波動性總是存在的,所以,為了保證所取樣品有足夠的代表性,無疑必須采取多點、隨機、等量的取樣方法進行取樣。這是科學取樣的基本原則。具體分別論述如下。
通過前面的分析我們得知物料內在質量的偏差波動性符合正態分布規律。而數理統計學知識告訴我們:雖然總體的平均值和標準偏差是無法獲知的,但當隨機抽取的子樣個數足夠多時,樣品的標準偏差與總體的標準偏差就非常接近,它們之間在數值上差異可以忽略不計,這時就可以以樣品的平均值來代表總體的平均值。
我們知道,從總體中抽取有限的n個子樣的標準偏差S定義見公式(1)。

而抽取了有限的n個子樣后的總體的標準偏差σ可用公式(2)估算(算式的推導本文從略)。

式中:n—所抽取的子樣個數;
xi—每一個子樣值(i=1,2,3……n);
x-n個子樣平均值。
以(1)式除以(2)式得

從(3)式可看出樣品標準偏差S與總體標準偏差σ的比值隨著抽取子樣個數n的增加而接近于1。換句話說也就是隨著n的增加樣品標準偏差S越來越接近于總體標準偏差σ。筆者選擇了一些n的不同取值,分別計算S/σ的值,并列成表1。
從表1可以看出,當n在10~20之間時,樣品標準偏差S相對于總體標準偏差σ的誤差比較大,大約為2.5%~5.1%,說明抽取子樣的個數偏少。而當n>50時,樣品標準偏差S相對于總體標準偏差σ的誤差很小,只有1%以下。但隨著n的再增加,S相對于σ的誤差縮小得很緩慢。因此,當n值達到50時再增加子樣個數對提高樣品的代表性已經沒有明顯的意義了。顯而易見,適宜的、也是足夠的子樣個數應該在25~50之間。因為在這段區間中樣品標準偏差S相對于總體標準偏差σ的誤差比較小,只有1%~2%,兩者相當接近,完全可以以樣品的平均值代表總體的平均值。一般情況下子樣個數在25~30個就可以了。對于非常重要的檢驗取樣,比如仲裁檢驗或者是批量很大的產品或原料可適當增加一些取樣點的個數,但最多也沒有必要超過50個。
子樣點的空間位置和時間間隔的要求必須均等地分布在整個取樣對象中。
由于物料內在質量是不均勻的,所以,我們在一堆物料中的任一空間位置上所取得的一個點位樣的值可能高于總體的平均值;也可能低于總體的平均值;還可能等于總體的平均值。而在物料內部這種高、中、低之間的排列和分布是隨機的。也就是說,無論是高值的“樣”,中值的“樣”,還是低值的“樣”都可能分布在這堆物料內部的任何區域,任何空間位置上。這就是物料內在質量差異分布的特性。因此,必須將子樣點的位置均等地分布到物料所占據的全部空間。只有這樣才能保證取到整個物料中所有不同值的“樣”。
同樣的道理,對于正在輸送過程中的物料,我們也必須以均等的時間間隔在所要取樣物料的全部輸送過程中抽取瞬時樣。不難理解,物料輸送的過程可以看成是被輸送的物料以若干個“微小部分”分別通過輸送設備的過程。在整個輸送過程中的任何時刻,通過輸送設備的“微小部分”的值出現高、中、低的情形也是隨機的。這也是由物料內在質量差異分布的特性所決定的。所以,瞬時樣的取樣時間間隔也必須均等地分布在所取樣物料的整個輸送過程中。
實際上,點位樣與瞬時樣在本質上是一樣的,它們都屬于子樣的范疇,只是在不同情形下的稱謂不同而已。點位樣是相對于靜止堆放的物料取樣而言,它突出的是“空間位置點”的概念,取樣的時間段則相對固定。而瞬時樣是相對于輸送或流動中的物料取樣而言,它強調的是“時間刻度點”概念,取樣的位置則相對固定。點位樣與瞬時樣之間是可以相互轉化的,當我們把對一批靜止堆放的物料的取樣改為在將這批物料輸送入庫的過程中取樣時,點位樣就轉化為瞬時樣了。反之亦然。
由于物料自身內在質量是不均勻的,所以對于一批確定的有限量的物料,我們可以將它看成是由多個不同值的物料以不同的數量所組成。對各個不同值及其所對應的數量進行加權平均計算的結果就是這批物料的平均值。比如,一批數量1 000t熟料,它是由f-CaO含量為5%的熟料100t,f-CaO含量為4%的熟料200t,f-CaO含量為3%的熟料400t,f-CaO含量為2%的熟料200t和f-CaO含量為1%的熟料100t所組成。對各個f-CaO含量及其所對應的數量進行加權平均計算是結果為:(5%×100+4%×200+3%×400+2%×200+1%×100)÷1 000=3%。這就是這批熟料的f-CaO平均值。然而物料中各個不同的值及其所對應的數量是由物料自身決定的,我們事先無法獲知。但是,如果整個物料中某個值的數量比較多,那么它被隨機抽取到的機會也比較多,反之亦然。所以,我們只要通過抽取足夠的子樣個數和隨機均等的子樣位置的方法,就可以抽取到整個物料中所有值的物料,并使代表不同值物料的子樣個數所占子樣總個數的比例符合整個物料中不同值物料的比例。但是這里需要特別指出的是,在遵循前面兩個取樣要求的基礎上還必須同時注意使取得的每一個子樣的數量保持相等。這是因為,如果某些子樣的數量與其它子樣不相等,就相當于人為地擴大或縮小了不等量子樣的值所代表的相應部分物料的“權數”,從而使綜合樣品的平均值與取樣對象的實際情況產生偏差,降低樣品的代表性。所以,每個子樣的數量必須相等。

表1 n不同取值分別計算S/σ值
根據表1得知,樣品標準偏差S隨著抽取子樣個數n的增加而接近于總體的標準偏差σ。樣品標準偏差S與總體的標準偏差σ越接近,越能夠代表總體。所以可以用S與σ比值的百分數來定量表示樣品的代表性(可靠性)。例如,當抽取的子樣個數為15個時,樣品的代表性為96.61%。而當抽取的子樣個數為30個時,樣品的代表性為98.32%。顯而易見,樣品的代表性隨著抽取的子樣個數的增加而提高。但是這里需要特別指出的是,我們在定量表示樣品代表性的時候,是以所取得的每個子樣的位置和數量都符合要求為前提條件的,否則的話,即使所抽取的子樣個數再多其樣品也不具有代表性。
1.物料自身內在質量差異分布是隨機的,但作為一個整體而言其內在質量的偏差波動性符合正態分布規律。
2.雖然總體的平均值和標準偏差是無法獲知的,但當隨機抽取的子樣個數足夠多時,樣品的標準偏差與總體的標準偏差非常接近,就可以用樣品的平均值來代表總體的平均值。
3.為保證所取樣品有足夠的代表性,必須做到以下幾點:
(1)子樣的個數達到足夠的數量,一般應達到25個~30個。
(2)所有子樣的空間位置點和時間刻度點均等地分布在整個取樣對象中。
(3)所取得的每個子樣數量相等。
中國建筑材料聯合會綠色低碳建材分會
聯系人:張晉
電話:13910418604/010-57811107
郵箱:zhangj@cqbm.com.cn
發揮紐帶作用 引領建材行業綠色低碳發展
※ 提出促進綠色低碳建材發展的產業技術經濟政策,引領行業綠色低碳發展。
※ 制定指標先進的協會團體標準,助力綠色制造體系建設。
※ 把握碳核查、碳交易政策動向,開展建材行業碳交易能力建設。
※ 參與建材低碳產品標準制定及認證工作,推廣綠色低碳技術。
※ 參與綠色建材產品評價技術導則制定,促進綠色建材應用。