鐘 堃,何法霖,王 薇,張 妍,王治國
(北京醫院,衛生部臨床檢驗中心,北京100730)
今天我們所知的“參考區間”概念是Graetsbeck和Saris在上世紀六十年代末建立的,并于1969年在斯堪的納維亞學會大會上提出[1]。20年后,國際臨床化學聯合會(IFCC)專家組發表了第一篇關于參考值理論的正式IFCC文件[2]。30多年前Galen和Gambino就發表了標志性書籍《超越正態性》,為何在現在這個循證醫學的時代還討論參考區間并使用決定界限來描述特征[3]。三個新生事實驅動了以上論題的討論:國際標準化組織(ISO)發布的標準15189:2007[4]對臨床實驗室質量和能力的要求、體外診斷(IVD)醫療器械歐洲指令98/97[5]的執行以及與指令間接相關的檢驗醫學溯源性聯合委員會(JCTLM)的建立。
本文中,除強調了重要方面的理論升級之外,還描述了參考區間領域新的視角和發展。
參考值與實驗室檢驗共同發展,而且它們只在特定的情況下才有意義,通常是在生理或病理情況下。在70年代之前,通常使用的術語是“正常值”,但它會有多個易混淆的不同含義:墨菲(Murphy)列出了其中的7種(統計學的——高斯分布——最能代表一個等級、一個等級中最常規的代表、最適合生存的、沒有危害——在醫學中——常規的、理想的)[6]。因此它可能是主觀并且模糊的,而且暗示所有在范圍以外的個體都是“不正常的”。由于上述原因IFCC文件介紹了術語“參考值”。這些數值常與健康相關,除此之外它們也能反映一些特殊的生理狀況如懷孕、或者涉及到某些特殊人群如專業運動員等。它的基本概念是這個數值代表了一個特定的人群,因此它們依賴于所選擇的受試對象。首先,需要明確定義參考個體的遴選準則;參考個體代表了參考人群,參考樣本組從參考個體中選擇,在其上測量參考值。所得數值將會假設為一個特定分布(也就是參考分布),并且通過適當的統計方法進行分析并計算參考界限。按照慣例,這些界限設定為包括了95%的測量值。用參考界限定義包括它們的參考區間需注意以下情況:(1)一個特定被測項目的參考區間依賴于參考對象樣本組中的個體內和個體間的生物學變異;因此,所選擇對象的數量和他們的亞組組成可能具有相關的重要性;(2)需要嚴格地控制分析前方面以保證從總體人群中收集樣本操作的可重復性;(3)分析方面是十分重要的。測量的標準化允許在不同對象組獲得的數據具有可比性,并且最終與它們獲得方式不同的,以及不同地點和時間的人群應用也具有可比性;(4)計算參考界限的方法可能顯著地改變所獲得的結果,例如,如果應用不適當的統計模型或錯誤地執行離群值的排除。
通常我們會選擇“健康”的個體,但健康如何準確定義和識別已在多篇評論[7-9]中進行了解釋。世界衛生組織(WHO)的定義:“身體上、精神上和社會適應上的完好狀態,而不是僅僅是沒有疾病和不虛弱”[10]并不能作為現實的出發點。1975年的斯堪的納維亞參考值委員會嘗試排除一系列病理情況來定義個體的“健康”[11]。但后來發現這并不實際[12],尤其是涉及到年長者。當Horn和Pesce[13]查看美國第三次國家健康和營養檢測調查(NHANESⅢ)時,他們發現只有不超過10%的70-80歲調查對象落在“最健康”類別以內。
在選擇個體時,有必要考慮所有可能影響檢驗項目結果的因素:性別、年齡、環境、生活方式和種族等。參考區間的寬度受到三種變異性來源的影響:選擇的參考個體的個體內和個體間的變異,以及測量系統的分析性變異。個體內和個體間變異性的影響要緊密結合在一起。這兩個來源的變異性的相對大小能實質上影響參考區間作為解釋個體結果工具的效用。在大多數情況下參考區間在評價個體結果上的效用和發現異常數據上的敏感性是較低的。
使用數據挖掘方法發表的第一篇論文是在上世紀60年代并且假設大多數實驗室結果是“正常的”。考慮到結果的分布頻數,應該使用一些統計學軟件來排除極端值,排除較小頻率的數據,也就是典型的“不健康”個體。但它不滿足參考值理論的基本原理,其是參考人群特點的精確定義。雖然信息技術提供我們強有力的計算方法,也不能認為數據挖掘方法是定義參考區間的最好方法。
參考區間研究的樣本必須代表臨床實踐中樣本的采集。但在臨床實踐中分析前因素通常很難標準化。所以在進行參考區間研究時,有必要確切的規定和描述分析前因素,使得其他研究者能夠重復同樣的步驟(例如采血設備和個人的體位)。表1給出了評價血液分析項目時要考慮的最為重要的分析前因素。對于體液來說可能需要包括不同的因素,而對于特定的分析物,則需要更多的信息(例如對于某些激素的情緒化應力水平)。

表1 在建立參考值時應該考慮的主要分析前因素
IFCC文件對這一主題給出了一系列建議,如文件記錄操作程序。然而,當規定的參考區間僅應用于特定實驗室時,這些建議有效,因為它能理解某些分析方面的修改是否會改變參考區間。反之,在提供給其它實驗室“可轉換”的參考區間定義程序時無效。
包括三個主要問題:(1)統計學提供最為有效的方法從樣本人群所得的結果推斷整體;(2)不同組間(年齡、性別等)的結果進行分組;(3)排除離群值。
Wootton等人在1951年首次將參數統計學應用于參考區間的計算。但他們不久就意識到這種統計學模型只能應用于少數的情況,并在兩年后他們建議數據進行對數轉換以達到更接近高斯分布。在數據分布的形狀沒有進行任何初步驗證的情況下就將參考區間定義為均值±2倍標準差是不正確的做法,但卻已沿用至今。
1987年IFCC發表了關于使用分位數定義參考區間的里程碑似的文章。首先,選擇使用中間95%分布作為參考區間計算。其次,IFCC文件建議參考界限要代表著它們的90%置信區間。再次,文章建議使用非參數統計方法來計算參考界限。使用參數方法可以降低對象的數量,但是要求數據具有高斯分布。基于原始數據的Box和Cox轉換,Horn等人建議使用“穩健的方法”進行替代,即使在數據不太理想的情況下依然能夠提供正確結果。計算界限的90%置信區間,可以使用所謂的“bootstrap”方法學。
較直觀的方法是基于計算兩個亞組均值之間差異的統計顯著性來完成的。Sinton等人,建議只要兩個均數之間的差異大于從混合分布95%計算區間的1/4時,就應該分為兩組。目前最常用的分組方法是Harris和Boyd建議的,后由美國臨床和實驗室標準化研究院(CLSI)文件C28-A2認可。他們建議檢驗要包括兩步:第一,評估均值間的差異,第二,比較它們的標準差。
離群值的正確檢出和排除十分重要。直觀檢查法是簡單而有效的檢出離群值的方法。如果檢出一個離群值卻沒有明顯的原因來排除它(比如對象的情況、分析性問題、計算或記錄錯誤),有必要應用統計方法來證明。
目前較為常用的統計方法是由Dixon建議的。它基于D/R的比值,D是離群值與下一個或前面數值的差值的絕對值,R代表觀察值的總體范圍(最大值-最小值),包括離群值。Horn等人建議了一個更加復雜的兩步算法,首先使用Box和Cox方法進行數據轉換,得到高斯分布,然后使用Tukey穩健方法識別離群值。
實驗室經常使用不同的參考區間卻沒有實際的原因。這種常見的情況對臨床醫生和患者的危險性產生了誤導(同樣的分析結果根據所用的參考區間,在一家實驗室認為是“正常的”而另一家實驗室是“異常的”)。另外,它阻礙了常規數據庫的建立,如不同實驗室數據的合并。克服這種情況的替換方法是建立和執行“共同的”參考區間[14,15]。
如果分析方法是相同的或經過正確的標準化后結果具有可比性,并且人群具有相同的特征或,可以知道特定項目沒有受到種族或環境的影響,就可以使用共同的參考區間。在采用之前需要檢查表2中匯總的一些先決條件是否已達到。

表2 共同的參考區間建立和使用必須的先決條件
最好的方法是執行多中心研究,目前已在西班牙實行,并且在北歐國家得到了進一步的發展。它要求:(1)根據年齡、性別、種族、生活方式等分組所要求對象的數量來確定參加研究的單位和所要召集個體的數量。(2)分析前階段的清楚定義。理想情況下,在臨床實驗室為了再現樣本處理,應對新鮮樣本進行分析。(3)使用可溯源到參考測量系統以及實驗室間高度可比的方法。(4)合理的數據分析計算參考界限。在計算參考界限之前,必須檢出和排除可能的離群值。
為了能夠應用共同的參考區間,臨床實驗室必須驗證在區間產生過程中采用的那些分析前條件、所用分析系統的性能和服務人群的特征相似。
分析前條件:如果應用相同的分析前條件(比如標本類型、禁食等),或者證明任何引入的修改沒有顯著的影響。
分析中的方面:(1)對特定的分析物,所用方法必須產生可溯源至參考測量系統的結果。(2)所用方法的分析質量應控制在總誤差的規定界線內。
如果已知種族或者生活方式不會影響到參考區間,那么就只用驗證分析前和分析中的方面。如果已知種族或生活方式可能會影響到參考區間,那么建議臨床實驗室采用來自其服務人群的小樣本組進行參考區間的確認。
參考測量系統的發展和制造商對溯源性的依從是一個緩慢的過程。建立穩健的參考區間是費時和費力的過程。由于修正參考區間是一項很費力的工作,而且要求對臨床醫生和患者進行督導,所以臨床實驗室通常不愿獨立完成。對于一些分析項目,正確地定義共同的參考區間需要較大范圍的多中心研究。為了在這個領域取得真正的進步,需要在完善的理論和并不完備的實際之間建立起橋梁。
如果滿足了所有之前規定的組織上、分析前的和分析中的要求,不僅多中心實驗研究所得的參考區間可以作為共同的參考區間,甚至可由單個實驗室規定。IFCC參考區間和決定限委員會(C-RIDL)最近發表的一篇文章中顯示,當采用單個實驗室建立的已確認的參考區間時,當地人群區間的初步驗證會有重要的意義。
表3中給出了這兩個概念的相關信息。參考區間描述明確定義了(通常是明顯健康的)人群的生物特征,決定限依賴于診斷性和特殊臨床研究,為的是規定存在某種疾病或對不同結果的概率。選擇的決定限通常是基于兩個人群(疾病/非疾病)重疊的水平以及期望的臨床靈敏度和特異度的程度。

表3 參考區間和決定界限間的差別
Harris在30多年前就對個體的參考區間給出了理論基礎和統計學方法,但是在未來的執行仍具有挑戰性。信息技術的發展允許我們存儲大量資料并對進行快速的檢索和處理。而且溯源性和檢測標準化的改進也將會增加不同地點和時間結果的穩定性和可比性。實驗模型非常簡單,要求在穩定的健康狀態時期從同一個體采集多份樣本。對于給定分析物,這些樣本的測量結果將會產生一個時間系列,組成一個基線來判斷未來的結果。
修改已存在的參考區間通常是一項復雜的任務,應告知臨床醫生和他們的患者。共同參考區間的確定將顯著地降低同一項目不同參考區間的數量,提供更恰當和更有效的信息。實驗室人員需要在這些領域克服實際困難,盡快將理論改進應用于臨床實踐,以使醫療機構和患者獲得預期的效益。
[1]Graetsbeck R,Saris NE.Establishment and use of normal values[J].Scand J Clin Lab Invest,1969,26(Suppl 110):62.
[2]Solberg HEInternational Federation of Clinical Chemistry (IFCC).Scientific Committee,Clinical Section.Expert Panel on Theory of Reference Values International Committee for Standardization in Haematology (ICSH),Standing Committee on Reference Values.Approved recommendation(1986)on the theory of reference values.Part 1.The concept of reference values[J].J Clin Chem Clin Biochem,1987,25:3370.
[3]Galen RS,Gambino SR.Beyond Normality:The Predictive Value and Efficiency of Medical Diagnoses[M].New York,USA:John Wiley and Sons,1975.
[4]International Organization for Standardization.Medical Laboratories-Particular Requirements for Quality and Competence ISO 15189[J].Geneva:ISO,2007.
[5]Directive 98/79/EC of the European Parliament and of the Coun-cil of 27October 1998on in vitro diagnostic medical devices[S].Offic J Eur Commun 7December 1998,L331/1-L331/37.
[6]Murphy EA.The normal,and the perils of the sylleptic argument[J].Perspect Biol Med,1972,15:566.
[7]Gr?sbeck R.The evolution of the reference value concept[J].Clin Chem Lab Med,2004,42:692.
[8]Petitclerc C.Normality:the unreachable star[J].Clin Chem Lab Med,2004,42:698.
[9]Ritchie RF,Palomaki G.Selecting clinically relevant populations for reference intervals[J].Clin Chem Lab Med,2004,42:702.
[10]World Health Organization.Constitution in Basic Documents[S].Geneva:WHO,1948.
[11]Alstrucm T,Gretsbeck R,Hjelm M,et al.Committee on Reference Values,Scandinavian Society for Clinical Chemistry and Clinical Physiology.Recommendations concerning the collection of reference values in clinical chemistry and activity report[J].Scand J Clin Lab Invest,1975,35(Suppl.144):1.
[12]Berg B,Nilsson JE,Solberg HE,et al.Practical experience in the selection and preparation of reference individuals:empirical testing of the provisional Scandinavian recommendations[M].In:Gretsbeck R,Alstrucm T’eds.Reference Values in Laboratory Medicine.John Wiley & Sons,1981:55-64.
[13]Horn PS,Pesce AJ.Reference intervals:an update[J].Clin Chim Acta,2003,334:5.
[14]鐘 堃,王治國,王 薇,等.利用多中心使用相同檢測系統建立人體參考區間的要求[J].中華檢驗醫學雜志,2010,33(8):790.
[15]王治國.臨床檢驗質量控制技術(第2版)[M].北京:人民衛生出版社,2008.