林洪樺
(北京理工大學機械與車輛工程學院)
《測量不確定度指南》ISO 1993(E)[1](簡稱GUM)頒布至今幾近廿載,對于我國使用和評定測量不確定度起到了促進和規范化的作用。尤其在計量基準和標準的建立、量儀檢定、各種計量技術法規的制定等方面更有利于國際比對及與之接軌。盡管在此期間與其相關的標準和技術規范都曾作過修訂和補充,然而均未做出本質性更改,而只是完善和增補了些術語和定義、更明確了適用范圍、添加了應用技術等。GUM(ISO/IEC Guide98-3-2008)以及我國報審的JJF1059.1 《測量不確定度評定與表示》均基于誤差理論,且是在國內外有關專家繼承、發展測量誤差及數據處理基礎上,經“求同存異”而商討的結果,因而在GUM實施中不免會有不同的見解和異議,也包含誤差理論發展上要求擴展應用GUM的問題。
作者自1962年從事測量誤差與數據處理的教學與科研以來,就一直在探討誤差的量化表示方法。在GUM 頒布之前的一些征求意見的討論中,就已認為測量不確定度實質上是測量誤差的一種規范性量化形式,有利于量值準確度的國際比對。GUM 頒布之時又恰在誤差分類不一、誤差估算與合成方法眾說紛紜的發展階段,GUM 的頒布及時地取得了統一一致的規范化效果。然而,GUM ISO 1993(E)版本仍然不免存在某些矯枉過正之弊,如免用真值、不涉及誤差、不主張誤差,按其性質分類:系統誤差和隨機誤差等等,引起當時科技界專家和學者對GUM理解的差異,甚至是錯誤見解,如將不確定度與誤差對立起來。盡管經過GUM不斷貫徹實施以及修訂和補充,已漸統一認識,但仍不免有些異議。
可見,捋清測量不確定度評定與誤差理論關系,仍是當前值得論述的問題。下面在作者編著的“測量誤差與不確定度評估”[2]中有關論述的基礎上,再作如下的歸納。
無論以往還是現今,對于測量不確定度的定義都是指表征賦予被測量值分散性的非負參數。顯然,這里可以不涉及真值,也避免了測量誤差定義為測量結果減去被測量真值而引起的不可確定性,卻并無法表明不確定度與真值、誤差的關系。
首先,測量不確定度的來源:被測量定義及其體現;計量基準或標準件;測量設備;測量方法;測量環境條件;測量人員等方面,幾乎與傳統上分析測量誤差來源完全一致。也可以說,這是繼承了測量誤差來源分析經驗的結果。
其次,測量不確定度評定是在已修正顯著系統影響且不計及異常值的條件下進行。這樣的前提條件,實質上都不免應針對被測量真值而言。顯然,被測量值的分散性可以圍繞著或接近于真值而分散,也可能遠離其真值而分散。在實現定量化分析中真值多以約定真值來替代,也都需要繼承、吸取傳統系統誤差和粗大誤差的分析、估計和識別經驗。
問題在于對誤差定義的理解上有些絕對化。在測量中,測量誤差Δx定義為被測量的測量結果減去被測量的真值x0,即Δx=-x0。而x0卻是待定的未知真實值,因而誤差似乎就是難以確知的。其實誤差歷來都是針對無誤差的目標值定義的,只不過應予合理地規范化定量表示而已。傳統的誤差理論上對測量結果的表示為:其中為測量數據的均值;Δ0為系統誤差修正值(針對真值/約定真值做出的估計);Δlim為極限誤差。通常Δlim= k s+∑iei,前項為測量數據的k倍標準差;后項為剩余系統誤差、先驗隨機誤差等等的總和。這與GUM中所論述的不確定度評定方法并不存在本質性矛盾。
因此,不確定度評定不僅不應與誤差理論割裂,反而應繼承且依據傳統的誤差理論及其發展現狀。同時,也不可能完全避開真值和測量誤差,應視為測量誤差在已修正顯著系統誤差,且經識別并剔除異常值后,關于被測量值分散性的一種規范化定量表示形式。以下的幾點繼續論述將更有力地支持這種統一一致的論點。
不確定度評定強調可操作性,且在GUM中提出了兩類評定方法:對測量列用統計分析的A類評定與其它不同于A類的B類評定(列舉出了一系列B類評定的提示性方法),且均以標準差來定量表示不確定度u,又表明無需予以嚴格區分。同時指出,這兩類評定方法并不對應著隨機誤差、系統誤差兩種分類,這無疑有利于對被測量值分散性做出規范化定量表示。盡管這種分散性中含有隨機性影響因素,也含有已修正顯著系統影響后剩余系統性影響因素,卻無需糾纏其起因。
然而,誤差來源不同對測量結果影響就各異。在誤差理論中,傳統上對誤差按其性質不同劃分為兩類:系統誤差和隨機誤差。前者指的是對同一量多次測量過程中,保持恒定或以可預知方式變化的測量誤差分量,并定義為在重復性條件下對同一被測量進行無限多(或足夠多)次測量結果的平均值減去被測量的真值;后者則是以不可預知方式變化的測量誤差分量,并定義為測量結果減去在重復性條件下對同一被測量進行無限多(或足夠多)次測量結果的平均值。這種分類既是客觀存在也是應予認知的。以往存在定量化與估計形式不一致問題,尤其系統誤差定量化分析、估計主要依賴于專業技能,“個性”強而共性弱,難有普適性方法可循。這也就是造成誤差量化指標(如隨機性系統誤差、半系統誤差、不定常差等[2]),不易統一 一致的主要原因,即便是共性強的隨機誤差其量化指標也不一致(如標準差、平均誤差、四分位差、中位絕對差等[2])。
因此,應強調統一規范化定量評定指標與估計方法,而非免用誤差分類。如前已述,GUM 中只規范化了不確定度的評定方法,至于顯著性的系統誤差仍有待進一步規范化其評定指標和估計及修正方法,這仍然需要依據傳統誤差理論及其在系統誤差評定上成熟經驗。
GUM中強調指出,對不確定度的A類評定和B類評定分別按基于頻率、基于信任度的概率分布所估計標準差來定量表示。這點與誤差理論完全吻合,只不過其適用范圍還未能滿足當前誤差理論發展要求,如對于測量模型輸入分量的概率分布未能適用于不對稱分布,其合成后輸出量的概率分布還僅適用于近似正態分布或t分布等,以及測量模型的非線性度較嚴重等情況。盡管當前已補充了《用蒙特卡洛法評定測量不確定度》標準,卻仍感不足,尤其在常見小樣本數據處理中很難確定不確定度應基于那一個典型概率分布來定量表示。建議應用概率分布統示法[2~4],即統一采用一種模式分布密度函數p(x,θi),通過改變其參數i值來表示各種不同形態的具體分布pi(x),并要求表示出范圍較廣的各種常用對稱分布和非對稱分布,這樣更加合乎實際情況。
因此,GUM 有待于進一步擴展應用于非正態分布和非對稱分布,以及非線性測量模型等當前科技與誤差理論發展現況的需要。
在GUM中按隨機變量的方差傳遞規律導出不確定度傳遞律進行不確定度分量合成。這點也與誤差理論中的誤差合成理論基本符合。當測量模型y=f (x1, x2,…,xm)可線性化,即按Taylor級數展開可略去其二階以上高階項條件下,依據方差/協方差分量之和的合成方法,所得即為合成方差,也即可得合成標準不確定度:

式中,uy為 y的標準不確定度;為函數y=f (x 1 , x2,…,xm)在與測量結果y對應的輸入量值{}點處對xi的偏導數,即輸入量xi單獨對輸出量y影響的線性化誤差傳遞系數,也稱為不確定度傳遞的靈敏系數;ui為輸入量xi的標準不確定度;rij為xi與xj相關系數估計。這樣的誤差合成規律在傳統誤差理論中早已公認,只不過GUM再予以規范化而已。于是,在合成不確定度評定中,關鍵問題之一即確定靈敏系數Ci,估計相關系數rij及對相關項的處理方法等,均需借鑒以往誤差合成方面的經驗。
不僅如此,在擴展不確定度評定即U = kuc及確定包含因子k方面,就更離不開誤差合成與極限誤差估計方面的經驗以及當今誤差理論發展。實際上表述測量結果y的擴展不確定度 U目的,就是以很大的概率表示出被測量的真實值所在范圍±U,顯然將涉及誤差合成概率分布這個難題。
在GUM中對擴展不確定度評定近作了簡要的規定,如包含因子k一般取2或3,或者依據合成標準不確定度uc的有效自由度νeff而按t分布取kp= tp(νeff),p = 0.90~0.99。顯然僅當合成概率分布接近于正態分布或t分布時可應用。實踐以及用蒙特卡洛法仿真合成概率分布的結果[2,5]均已表明現有 GUM 的適用范圍偏小了些,因此又補充了《用蒙特卡洛法評定測量不確定度》的標準。看來至少還應補充在非對稱分布方面的應用。
由此可見,在測量不確定度評定上應用到誤差理論的成果方面還遠遠不夠。
誤差理論隨著科技的飛躍發展而不斷地發展,顯然測量不確定度評定技術也應隨之有所進展,這點在GUM 中已有所注明。諸如:表明了只是評定和表示不確定度的通用規則,而不是詳細技術規范和說明;未涉及專門測量領域的特殊問題,或不確定度定量表示的各種用途;只提供了評定不確定度的框架,并不能替代周密的思考、誠實的理智和專業的技巧;對不確定度的A類評定并未談完,還有許多復雜的情況需用統計方法處理;對不確定度的B類評定也只是提示性的討論等等。同時,在某些相應的條文中也提及應用最大熵方法、Bayes方法等一些非傳統方法[1]。
顯然,對于GUM也存在應適應于當前科技發展需要,及對測量可靠性和準確度有更高的要求形式,用于擴展應用問題。作者據當今誤差理論發展的現況,提出以下若干應予擴展應用方面的意見供參考[2]。
——從傳統正態分布誤差擴展至非正態分布誤差,尤其是非對稱分布誤差的分析與統計處理。實踐表明非正態誤差是客觀存在的,因而近年來廣泛開展對非正態誤差各種概率分布形式描述、評定指標、估算及合成等各方面探討,尤其對利用高階矩或累積量(cumulant)分析方法與概率分布的級數展開法、統示法的研究。
——在傳統最小二乘法基礎上擴展至各種最小距離準則的處理方法。為適應各種不同專業領域技術要求、不同數據統計特性條件等,需要擴展至其它最小范數或最小距離準則下處理方法,如殘差絕對值和為最小的最小一乘法、殘差最大值為最小的最小∝乘法、以及其他的最小距離法等。還為了適應各種不同應用場合,而發展其處理方法,如采用正交變換、特征值或奇異值分解等算法、各種形式加權處理等,以及非線性模型處理方法等。
——從傳統的最佳統計處理擴展至穩健統計(robust statistic)處理。因為實際數據常難滿足獨立性、正態性、無異常外部干擾或稱“污染”等最佳性假定條件,而偏離這些條件,所采用的最佳估計或擬合方法將失去其最佳性,甚至會失效。而穩健估計和擬合方法可在數據稍有偏離原假定的概率分布模式,及受少量粗大誤差或一些異常小誤差污染下,僅使其估計或擬合結果作較小改變,其他仍基本上保持原有最佳性而不致失效,故穩健統計已成為現代數據處理中頗具活力的分支[2,6]。
——從傳統統計處理方法擴展至Bayes統計處理方法。不僅只依靠現有數據作統計處理,而是再充分利用已有知識、經驗、資料等先驗信息,一起進行Bayes統計處理,以得出更為準確、可靠的結果,不確定度B類評定方法就考慮到應用這一統計原理[2]。
——從概率統計分析方法擴展到熵分析及熵優化分析方法。依據熵可作為信息不確定的唯一性度量,熵最大就意味著最大不確定性,以及每種隨機變量概率分布都對應著一個熵值(逆轉對應并不成立)等原理,即可用誤差熵值反映其離散度,形成熵分析方法。又為避免求解具有多種可能解的各種不適定問題,只依據所得的數據含有的全部信息,而不再作任何主觀假定,即在最不確定性即最大熵準則下求出不適定問題的解,簡稱最大熵方法。進而,在依據數據及所要求的約束條件上,又有已知的知識、經驗、資料等可靠先驗信息可用時,為使兩種信息最大限度地相符合,即相互間的不確定性應最小,而按最小互熵準則來解題,簡稱最小互熵方法。于是可統歸為熵分析與熵優化方法,這種方法的特點在于可不涉及概率分布的主觀假定[2,7]。
——從靜態測量數據處理擴展到動態測量數據處理。基于隨機變量統計方法靜態測量數據處理在變量動態測量廣泛應用下已不盡適用,需擴展至基于隨機過程的統計方法。尤其是長過程測量,包括變量測量過程和常量重復測量過程(如在線測量或質量控制中的長期監測等),為適應其未知復雜變化規律,及跟蹤分析、處理和顯示其時變統計特性(即特性量、技術參數或評定指標等),出現了各種自適應統計處理方法,包括各種遞推式算法(recursive algorithm),以及近年來興起的著重于精確描述上的移動式算法(moving algorithm)[2,8]。
還需特別指出,在計算機及其各種算法軟件廣泛應用與普及后,為了分析和解決誤差分析及數據處理中的各種難題及開發新技術,又擴展應用了非統計方法。如計算機數值模擬或仿真分析方法;具有多分辨和變尺度的小波分析方法;模擬生物生存、進化、遺傳等仿生分析方法;智能化分析方法等等。
總之,上述種種擴展應用均為GUM所未予涵蓋,又是當前誤差理論及數據處理中一直不斷開發應用的技術。
可見,GUM實施實質上是對測量誤差的一種(被測量值的分散性)定量表示起到規范化作用,今后對GUM 進行修訂、補充、及拓展等顯然仍應基于誤差理論。
[1] 劉智敏,劉增明譯.測量不確定度表示指南[J].BIPM-IECIFCC-ISO-IUPAC-IUPAP-OIML,《標準化文摘》增刊,1995,43.
[2] 林洪樺.測量誤差與不確定度評估[M].北京:機械工業出版社,2010.
[3] 林洪樺.再薦誤差的分布統示法[J].中國計量學院學報,2004,2:96-101.
[4] 林洪樺,潘鋒.重復測量數據 β分布的自助法估計[J].北京理工大學學報,2004,11:947-951.
[5] 林洪樺,馬升.誤差分布及其合成分布判別的數值仿真分析[C],全國計量測試學術大會論文集,計量學報期刊社,1998.
[6] 林洪樺,席秀英.常量測試數據穩健性自動處理[J].全國現代誤差理論及應用學術交流研討會論文集,宇航計測技術,1997,增刊,48-54.
[7] 林洪樺,測量不確定度評定的熵方法[J].全國現代誤差理論及應用學術交流研討會論文集,宇航計測技術,1997,增刊,20-27.
[8] 林洪樺,動態測試數據處理[M].北京理工大學出版社.1995.