摘 要:假設檢驗中的方差分析法是目前檢驗標準樣品均勻性所用到最廣泛的統計分析方法。在實際工作中發現,部分研究者是用測試數據直接套用方差分析步驟進行F值的計算,并未考慮方差分析的適用條件限制。為進一步增強標準研制工作的嚴謹性和準確性,本文主要從統計學角度簡述方差分析模型構造過程,從模型角度細致分析方差分析適用條件,并給出不滿足條件時的處理辦法,以供參考。
關鍵詞:標準樣品,均勻性檢驗,方差分析,適用條件
DOI編碼:10.3969/j.issn.1002-5944.2023.04.028
On the Applicable Conditions of the Standard Sample Homogeneity Test Method
YU Zhong-xiao
(Dezhou Fiber Inspection Institute)
Abstract: The analysis of variance in hypothesis testing is the most widely used statistical analysis method to test the homogeneity of standard sample. In actual work, it is found that some researchers directly apply the steps of ANOVA to calculate F value with test data, without considering the applicable conditions of ANOVA. In order to further enhance the preciseness and accuracy of the standard development work, this paper mainly describes the construction process of the ANOVA model from the perspective of statistics, carefully analyzes the applicable conditions of the ANOVA from the perspective of the model, and gives the treatment methods for reference when the conditions are not met.
Keywords: standard sample, uniformity test, analysis of variance, applicable conditions
標準物質的均勻性是標準物質的基本屬性,用于描述標準物質特性的空間分布特征。測量取自不同包裝單元(如瓶、包等)或取自同一包裝單元不同位置的規定大小的樣品,測量結果落在規定不確定度范圍內,則可認為該標準物質對指定的特性量是均勻的。凡成批制備并分裝成最小包裝單元的標準物質,必須進行均勻性檢驗[1]。因此均勻性檢驗的重要性可見一斑。
近年來,研究者提出了許多均勻性檢驗的數理統計方法,有方差分析法、平均值的一致性檢驗和極差法等。其中,方差分析法對原始數據提供的信息利用較充分,是一種用于均勻性檢驗的行之有效的方法[2],也是目前檢驗標準樣品均勻性所用到最多的統計方法。但在進行方差分析之前,我們需要驗證一些假設,如果任何一條假設不能得到滿足,那得出的檢驗結果可能就是無效的。
然而,多數標準樣品制作規范或者科研論文僅僅論述了方差分析的實驗步驟,并未闡述方差分析對樣本數據的假定,即方差分析的適用條件。這就導致大多數工作者在進行標準樣品的均勻性檢驗過程中,數據處理過后直接套用計算步驟進行方差分析,而忽略了方差分析適用條件的驗證,導致得到無效的統計結論。因此本文主要從統計學角度談一談均勻性檢驗方法方差分析的模型構建、適用條件以及不滿足適用條件時的處理辦法,以供大家參考。
1 數據結構與模型
方差分析(Analysis of Variance,簡稱ANOVA),又稱“變異數分析”,是R.A.Fisher發明的,通過判斷檢驗方差相等的多個正態總體均值是否相等,進而判斷一種或多種因素的變化對試驗結果的觀測值是否有顯著影響。
如果試驗只有一個因素在變化,其他因素都不變,這種情況稱為單因素方差分析。以單因素方差分析為例,給出其樣本數據結構。假設試驗只有一個因素A在變化,因素A有個水平,分別為A1,2 A…,r A,在水平A下進行次獨立觀測,得到試驗數據結構如表1所示。
其中表示在因素A的第個水平下的第次試驗的實驗結果。

2 適用條件與檢驗方法
使用方差分析進行標準樣品的均勻性檢驗,樣本數據須滿足以下三點假設。
(1)獨立性
方差分析模型要求各樣本數據之間相互獨立。從樣本數據的來源很容易就可以判定是否符合獨立性。一般而言,獨立觀測得到的試驗結果,獨立性條件都能得到滿足。
(2)正態性
模型要求每個指標的分組數據應服從正態分布。其實不僅僅是方差分析,像很多其他常用的統計分析方法,如t檢驗、相關分析以及線性回歸等,都要求數據服從正態分布或者近似正態分布。這是比較常見的一種假設,同時也很容易被忽略。常用比較直觀的圖形判斷方法有直方圖、P-P圖、Q-Q圖等,常用的非參數檢驗方法有Shapiro-Wilk檢驗、Kolmogorov-Smirnov檢驗等。
(3)方差齊性
模型要求每個指標內各分組數據間的方差是一致的。方差齊性是兩樣本t檢驗和方差分析的前提假設。常用的檢驗方法有方差比、Hartley檢驗、Levene檢驗、BF法、Bartlett檢驗,其中Levene檢驗和Bartlett檢驗是統計軟件中常見的檢驗方法。
3 不滿足適用條件時的處理辦法
在實際分析過程中,如果樣本數據不滿足正態性或方差齊性假設,首先要想到是不是有異常值的影響,故在檢驗工作之前,對數據異常值的檢驗和處理也是非常重要的。如果排除了異常值的影響,數據仍然不能滿足條件,我們還可以對數據進行以下幾種處理。
(1)對數據進行數學轉化,對轉化后滿足條件的數據進行方差分析。常用的轉化方式有:取對數、取根號、取倒數等,對于呈現不同分布趨勢的數據采取不同的轉化方法,但是對于轉換后數據的結果解釋稍微復雜。
(2)使用非參數檢驗方法,比如KruskalWallis 秩和檢驗。如果轉化后的數據仍然無法滿足正態性或者方差齊的要求,可以放棄方差分析,使用Kruskal-Wallis 檢驗等非參數檢驗方法進行標準物質的均勻性檢驗。使用非參方法的優點在于此類方法對數據的總體分布沒有要求,缺點是會損失部分樣本信息,在準確度上不如參數檢驗。
(3)忽略數據的非正態性,直接進行方差分析。有些學者認為,在各組樣本量相等或者近似相等的情況下,方差分析對非正態分布的數據比較穩健,此時仍然可以使用方差分析進行均勻性檢驗,并且檢驗結果會好于非參數檢驗方法。此時需要注明數據對正態分布的偏離程度。
(4)對于不滿足方差齊性要求的數據,還可以采用校正的方差分析方法,常用的是Welch方差分析。Welch檢驗通過調整自由度來進行近似的方差分析,對數據的方差齊性沒有要求,所以當組間數據不滿足方差齊性的要求時,采用Welch檢驗比方差分析更穩妥。
4 討論與總結
本文主要從模型構建的角度來討論方差分析的適用條件和前提假設,在使用方差分析方法進行均勻性檢驗之前,必須首先驗證數據是否滿足其適用條件,即:獨立性、正態性和方差齊性。如果樣本數據不能滿足其適用條件,那么一方面首先考慮數據本身可能存在的問題,比如異常值的影響,然后利用一些數學方法進行數據的轉換,對轉換后的數據進行測試,看是否符合要求。另一方面,如果處理后的數據仍然不滿足要求,也可以使用Kruskal-Wallis 秩和檢驗等非參數檢驗方法來做均勻性測試。這樣得出的統計結論才更加嚴謹,更有說服力。
參考文獻
[1]闞瑩,張正東.標準物質均勻性檢驗統計量F的判斷[J].中國計量,2010(4):78-79.
[2]崔長征,熊英,倪天陽,等.方差分析在標準物質均勻性初檢中的應用[J].中國計量,2016(5):3.
[3]薛毅.統計建模與R軟件[M].北京:清華大學出版社,2007.
作者簡介
于忠蕭,碩士研究生,工程師,研究方向為棉花標準樣品研制。
(責任編輯:袁文靜)