文/林俊
計量測試是一項專業性較強的工作,此項工作最為基本的要求是確保數據的精確性,為了實現這一目標,操作人員應當具有豐富的經驗,并且采用的儀器設備必須具有較高的精密性。然而,受到一些因素的影響,使得計量測試中常常會出現異常數據,從而導致計量結果的準確性降低,造成異常數據的原因有以下幾個方面:
(1)操作人員缺乏工作經驗,在測試的過程中會出現各種失誤,這樣會造成檢測結果的準確性不足,異常數據也會隨之出現;
(2)測試儀器受到外界因素的干擾,如機械振動等,或是選用的儀器本身存在缺陷,由此會增大異常數據出現的可能性;
(3)計量測試的過程中,儀器受到電磁干擾,或是由于供電電壓不穩定,使儀器發生故障,進而引起數據異常;
(4)儀器在長時間使用后,未進行及時校驗,部分元器件損壞、零部件松脫,致使測試過程受到影響,導致檢測結果不準確;
(5)在計量測試的過程中,通常會針對可能出現的異常數據選擇相應的剔除方法,若是方法選擇的不恰當,則無法對異常數據進行有效剔除。
在計量測試過程中,對異常數據進行判斷時,應當選擇正確的方法。目前,較為常用的判斷方法有以下幾種:
2.1.1 拉依達判斷法
這種方法基于的是拉依達準則,具體的判定原理如下:假定某一組測試數據當中只包含隨機誤差,通過計算處理可以獲得標準偏差,根據特定的概率可確定出一個區間范圍,如果誤差超出這個區間范圍,則可將之判定為粗大誤差,含有粗大誤差的數據則為異常數據,需要進行剔除。該方法可對正態或是接近正態分布的數據進行有效處理,應用時,需要確保測試次數充分,若是測試次數不足,則會造成粗大誤差的可靠性降低。所以當測試次數較少時,不宜采用該方法對異常數據進行判斷。該方法具體的判斷過程如下:
對被測試量進行等精度測量,由此可獲得x1, x2, …xn,隨后求取算術平均值x和剩余誤差vi,其中vi可用下式表示:

上式中i=(1, 2, …n),在根據貝賽爾公式可以計算出標準偏差σ。如果某個測量值xb的剩余誤差vb(1≤b≤n),并滿足下式:

則可認為xb是含有粗大誤差值的壞值,應當予以剔除。
2.1.2 格拉布斯判斷法
這種方法是以測試量的正態分布作為判斷前提,從理論的角度上講,該方法較為嚴謹,操作過程也比較簡便。該方法的判定原理如下:當某個測量值的殘余誤差的絕對值|vi|>Gg時,則可判定該值當中存在相對較大的誤差,應當對誤差進行剔除。該方法對異常數據的判斷過程如下:
按照測量結果偏離真值的程度(誤差理論),想要對偶然誤差進行有效剔除,至少需要進行10次以上的測量,為了確保測量精度和響應速度,可將15次確定為一個單位,當獲得15次測量數據后,其中可能會含有較大的誤差,可以通過分檢的方法,將可疑值剔除掉。當測量值xi對應的殘差vi滿足下式時應當該數據舍去:

在上式當中,x表示n次采集到的平均值(∑xi)/n;σ(x)表示測量數據組的標準差,可由貝賽爾公式求取;中的n表示測量次數,表示顯著性水平(可取0.01或0.05)。當測量次數n=15,顯著性水平時,則隨后可將15次的采集值存入到同一個數組當中,求取平均值,對殘差進行計算,進而求出σ(x),并將殘差的絕對值與2.41倍的σ(x)進行比較,剔除可疑值后再次求取平均值,然后重復上述步驟驗證是否仍有可疑值。在實際應用中發現,基本不需要重復,通常第一遍即可達到要求。
2.1.3 t-檢驗法
這是一種假設檢驗的方法,可在測量次數n<30的條件下使用,通過對隨機變量的數學期望進行檢驗,看是否與某個已知的值相等。該方法的檢驗過程如下:
假設(x1, x2, …xn)為正態隨機變量x的樣本,期望Mx與已知值m0相等。按照統計理論,如果上述假設成立,則統計量服從自由度n-1的t-分布。當正態隨機變量小于樣本時,可用該方法對數學期望進行檢驗,看是否存在較為顯著的差異,若是有則可將之剔除。
在計量測試中,對異常數據進行處理時,異常值的判斷是關鍵環節,下面根據上述的判斷方法,結合實例,分析異常數據的處理。例如,通過計量測試獲得如下一組數據:10.002、10.204、10.218、10.228、10.230、10.312、10.320、10.342、10.346。按照上文中的判斷方法,對該組數據中的異常值進行剔除,將置信概念的取值設定為95%,則顯著性水平在該組數據中,懷疑最大的10.346為異常值,將整組數據相加之后,求出平均值為10.2317,與之相對應的x1的平均值為10.2331,δ=0.0912,s=0.0888。通過綜合計算之后,得出10.346為異常值,應當從該組數據中予以剔除。應用上文中的三種判斷方法對該組數據進行判定,10.346均為異常值。格拉布斯判斷法中的與10.002-10.2317非常接近,由此說明該方法在三種方法中的效果最佳。計量測試異常數據的處理思路如下:先做一個統計量,當這個統計量處于規定范圍內時,可認為其服從正態分布,否則可判定相關數據不服從正態分布,即其中包含異常數據,需要進行剔除。
綜上所述,計量測試是一項較為復雜且系統的工作,在具體的測試過程中,為提高結果的準確性,需要對異常數據進行剔除。本文提出三種異常值的判斷方法,并通過實例分析,驗證了三種方法的效果,結果表明,格拉布斯判斷法的效果最佳。