四川大學華西公共衛生學院/華西第四醫院流行病與衛生統計學系(610041)胡逸凡 肖 雄 唐 丹 楊 帆 趙 星
測量誤差是指測量值與真實值之間的差異。營養流行病學是受測量誤差影響最嚴重、對測量誤差關注度最高的流行病學研究領域[1]。其可能的原因在于,第一,膳食攝入很難直接測量,因而主要依靠“自報”式調查,如食物頻率表、24小時膳食回顧調查等[2]。調查對象準確回憶膳食攝入量的難度較大,這種“自報”的調查方式通常會帶來較大的測量誤差[3]。第二,慢性病的發生被認為與長期膳食攝入而非短期食物攝入有關,因此通常需要關注長期膳食攝入量。然而,個體的膳食攝入情況本身存在波動,因此用某個時點收集的膳食數據來估計長期膳食攝入也會受隨機誤差的影響。
膳食研究可以分為膳食描述性研究和膳食與疾病間關聯性研究。對于描述性研究,測量誤差可能會使得觀測到的膳食分布變異性更大,還可能使得膳食分布均值有偏[4]。對于關聯性研究,測量誤差不但會降低統計檢驗效能,使得研究所需樣本量大大增加;通常還會導致單誤差變量關聯性分析的關聯系數被低估(稀釋偏倚),從而使膳食與疾病之間的真實關聯無法被檢出;多誤差變量關聯性分析的關聯系數可偏向任何方向,從而使得關聯性分析結果不可信[5-7]。
鑒于測量誤差在膳食數據中普遍存在,且對膳食研究造成嚴重影響,自20世紀70年代起,膳食領域涌現出許多關于測量誤差校正的研究[3]。本文將對測量誤差對膳食研究的影響和校正方法進行綜述。
測量誤差可以分為隨機誤差(random error)和系統偏倚(systematic error)兩大類[8]。隨機誤差在膳食領域通常指一個個體在不同時間點多次測量的膳食攝入與其長期膳食攝入之間的差異。僅含有隨機誤差的測量值是無偏的,因此可以通過重復測量的方式來減少誤差。系統偏倚是指測量值始終朝一個方向偏離真實值。系統偏倚將造成測量值有偏,因此無法通過重復測量減少誤差,只能用金標準測量值來校正誤差。
1.經典測量誤差模型
經典誤差模型是最基本的測量誤差模型,它假設測量值W為真實值加上均值為0,方差為Var(ε)的隨機誤差ε,且誤差與真實值X獨立,見公式(1)[9]。經典誤差模型僅考慮了隨機誤差,沒有考慮系統偏倚,即假設測量值相對于真實值是無偏的。然而“自報”式膳食調查工具獲得的攝入量通常都是有偏的[3],因此經典誤差模型在膳食調查中通常無法滿足。
W=X+ε
(1)
2.線性測量誤差模型
線性誤差模型(linear measurement error model)無需假設測量值無偏,因而被廣泛用于描述膳食調查數據的測量誤差,其模型假設見公式(2)[1]。其中位置偏倚(location bias)α0是與真實值X無關的偏倚;比例偏倚(scale bias)α是與真實值X成比例變化的偏倚。通常位置偏倚的取值大于0,比例偏倚的取值小于1,代表一種“坡度變緩現象”(flattened slope phenomenon)[10],即真實攝入量較高者傾向于低報其攝入量,真實攝入量較低者傾向于高報其攝入量;隨機誤差ε均值為0,方差為Var(ε),且與真實值X獨立。當α0為0,α為1時,即為經典測量誤差模型。
W=α0+αX+ε
(2)
3.異方差模型
在經典誤差模型和線性誤差模型中,都假設誤差項ε的方差恒定,當該假設不能滿足時,如散點圖發現測量值的變異隨著真實值增大而增大,可假設異方差模型(heteroscedastic error model)。假設公式(1)、(2)中ε的方差取決于真實值X的大小,且通常隨著X增大而增大,表述為公式(3)[11]。在異方差模型的情況下,可嘗試變量變換,如對數轉換或一般的Box-Cox轉換,使得方差齊,再使用上述同方差模型的誤差校正方法[11]。
(3)
此外,根據誤差是否與疾病結局相關,還可以將測量誤差分為差分誤差(differential error)和非差分誤差(non-differential error)。非差分誤差是指在給定真實值X和測量準確的協變量Z時,測量值W與疾病結局Y獨立,可用公式表述為P(Y|W,X,Z)=P(Y|X,Z)[1]。通常認為在隊列研究中,基線測量值的誤差滿足非差分誤差模型,而在病例對照研究時,受回憶偏倚的影響,測量值的誤差為差分誤差[5]。上述經典測量誤差、線性誤差、異方差模型都屬于非差分誤差。差分誤差對膳食研究的影響以及校正方法更加復雜。
膳食研究可以分為膳食描述性研究和膳食與疾病關聯性研究兩大類。膳食描述性研究是指通過膳食調查了解人群膳食攝入分布情況,中國居民營養與健康狀況調查[12]及美國國家健康與營養調查(National Health and Nutrition Examination Survey,NHANES)[13]都屬于這類研究。膳食與疾病關聯性研究則更加常見,且探討測量誤差對其影響的研究也更多,本文探討的重點在關聯性研究。
1.膳食描述性研究
(1)經典誤差模型
當調查的膳食變量存在經典測量誤差時,由公式(1)可知E(W)=E(X),Var(W)=Var(X)+Var(ε),即調查的膳食分布均值無偏,但其膳食調查值的變異較真實的膳食攝入值變異更大。
(2)線性誤差模型
當調查的膳食變量存在線性測量誤差時,由公式(2)可知E(W)=αE(X),Var(W)=α2Var(X)+Var(ε),即調查的膳食分布均值有偏,由于α取值通常為0~1,故膳食調查值的變異較真實變異大小無法判斷。
2.膳食與疾病關聯性研究
測量誤差對膳食與疾病關聯性研究的影響取決于假定的測量誤差模型以及疾病模型。本文僅探討誤差存在于連續性暴露變量的情況,對于錯分類(misclassification)和結局變量存在測量誤差的問題不作討論。疾病模型中僅有一個含測量誤差的變量稱為單誤差變量疾病模型,疾病模型中有多個含測量誤差的變量稱為多誤差變量疾病模型。
(1)單誤差變量疾病模型
①經典誤差模型

E(Y|X,Z)=β0+βXX+βZZ
(4)
(5)
(6)
(7)
②線性誤差模型

(8)
(2)多誤差變量疾病模型

(9)
(10)
β=(ΛT)-1β*
(11)
(3)非線性疾病模型
以上結論都是從線性疾病模型推導而來,對于常見的非線性模型,如logistic回歸模型,Cox比例風險模型,仍可近似得到以上結論。對于logistic回歸,只要測量誤差較小,或者真實的關聯系數βX為低、中等大小,近似效果都較好[9]。對于Cox比例風險模型,若結局事件發生率極低,且失訪對象為隨機缺失,即保證隨訪過程中處于風險集中的個體協變量分布保持穩定,則測量誤差的影響近似于線性疾病模型中的結論[14]。在不同情形下測量誤差對膳食研究的影響總結于表1[1]。

表1 測量誤差對膳食研究的影響
一項關于膳食領域測量誤差校正的綜述顯示,由于使用簡單、適用性廣等優點,目前90%以上的研究使用了回歸校正法進行測量誤差校正[15]。因此本文將回歸校正法作為主要的誤差校正方法進行闡述。對于一些營養素,如能量、蛋白質、鈉、鉀,可以使用恢復生物標志物(recovery biomarker)來準確測量其真實攝入量。雖然這種測量方式成本較高,但可以測量小樣本的真實值來校正全人群含誤差的測量值。然而目前可用的生物標志物非常有限[16],對于許多食物和營養素無法測得真實值。我們從真實值已知和真實值未知兩個方面來歸納回歸校正法的使用。
1.真實值已知
(1)單誤差變量疾病模型系數的校正

E(X|W,Z)=λ0+λW+λZZ
(12)
(13)
(2)多誤差變量疾病模型系數的校正
多誤差變量疾病模型系數的校正也可以用兩種方法。第一種是按多誤差變量疾病模型計算稀釋沾染矩陣Λ,再按照公式(11)校正有誤差的關聯系數。第二種方式是先按公式(14)獲得真實值的預測值E(X|W,Z),其中Xi代表第i個含測量誤差變量的真實值,共有n個變量含有測量誤差。將預測值再帶入疾病模型(9)中擬合的關聯系數βX即為校正關聯系數[11]。此時用Delta法計算多變量校正關聯系數的方差較為復雜[18],用bootstrap法計算校正方差更簡便。
i=1…n
(14)
2.真實值未知
(1)測量值僅存在隨機誤差:經典測量誤差模型

E(W2|W1,Z)=λ0+λW1+λZZ
(15)
(16)
(17)
(2)測量值存在系統偏倚:線性測量誤差模型

(18)
(19)
1.模擬外推法
模擬外推法最早由Cook和Stefanski提出[21],經Carroll發展完善[9]。模擬外推法的基本思想是在有測量誤差的觀測值上逐級增加測量誤差,觀察對關聯系數的影響,然后外推到誤差為0時的關聯系數,即為真實的關聯系數。與回歸校正法相比,模擬外推法對于復雜的疾病模型更具有普適性,且無需知道部分樣本的真值,但它只適用于經典測量誤差模型。然而膳食數據通常無法滿足經典測量誤差假設,這可能是其目前在膳食領域應用有限的原因。
2.矩法重建法(moment reconstruction)
矩法重建法由Freedman[22]提出,它與回歸校正法的相似之處在于都是尋找一個校正值來替代觀測值。在回歸校正法中是用給定測量值時真實值的期望作為校正值,而在矩法重建法中是用給定結局變量時與真實值的第一階矩和二階矩相等的值XMR作為校正值,即:E(XMR|Y)=E(X|Y),Var(XMR|Y)=Var(X|Y)。矩法重建法在線性疾病模型中校正值與回歸校正法校正值一致,而在logistic回歸模型中,模擬研究顯示其校正系數比回歸校正法得出的校正系數更接近真實系數[22]。相對于回歸校正法,矩法重建法考慮了結局變量信息,因此可以用于差分誤差模型,而回歸校正法只能用于非差分誤差模型。
3.多重填補法(multiple imputation)
多重填補法本是由Rubin[23]提出用于缺失值填補的方法,Cola[24]提出將含有誤差的連續性變量視作缺失數據,用多重填補法進行填補。多重填補通常會插補出多個數據集,將多個數據集數據分別與疾病進行關聯后的關聯系數用Rubin法則[23]進行合并。由于多重填補用到了結局變量的信息,因此與回歸校正法相比,多重填補也可以用于差分誤差模型的情況。
4.似然法(likelihood method)與貝葉斯法(Bayesian method)
Carroll[9]按是否對真實值假設分布,將測量誤差校正方法分為兩類:函數模型(functional models)和結構模型(structural model),前者將膳食攝入量的真實值視為固定值,前述的所有方法都屬于這一類;后者將膳食攝入量的真實值視為隨機變量,服從一定的分布,這類方法包括似然法、貝葉斯法。結構模型依賴模型分布假設,而函數模型則不依賴模型分布假設。但在模型假設穩健性較好的情況下,結構模型在高度非線性等復雜的研究情境下結果更可靠。似然法的基本步驟如下:首先假設真實值X已經被觀測到,從疾病模型出發,建立給定真實值X時疾病Y的分布;確定誤差模型;基于前兩步構建似然函數并最大化似然。貝葉斯法也需要構建似然函數,故與似然法有一些關聯,但貝葉斯法將參數視為隨機變量,最終得到待估計參數的后驗分布。相對于似然法,貝葉斯法更受歡迎,這可能與WinBuGs等自動軟件的使用大大降低了計算難度有關。
近年來,營養流行病學研究的可靠性倍受爭議,膳食數據測量誤差嚴重是原因之一[3,25]。本文綜述了目前測量誤差對膳食研究的影響和校正方法,希望能提高營養流行病學研究者對測量誤差的重視程度,并方便研究者們選擇合適的誤差校正方法使膳食研究結果的可信度更高。
測量誤差會使得膳食因素與疾病之間的關聯估計不準確。由于膳食數據通常含有系統偏倚,因此需要“金標準”校正。然而,大部分膳食數據沒有“金標準”測量方法。24小時膳食調查(24HDR)數據以隨機誤差為主,系統偏倚較小[26],因此目前多次24HDR數據通常被作為膳食研究校正的參考測量方法[16]。為了達到金標準校正效果,參考測量方法至少需要滿足兩個假設,即參考測量方法的誤差與主調查工具的誤差不相關,且與真實值不相關,然而這兩個假設24HDR均不滿足[27]。有研究對蛋白質、鉀、碘等有“金標準”測量的營養素,用24HDR這種“偽金標準”校正的后果進行了探究,結果顯示24HDR會高估稀釋因子的大小,從而低估這些膳食因素與疾病之間的關聯[16,27-28]。因此,研究者們也在不斷開發衡量膳食攝入的客觀指標,如濃度生物標志物(concentration biomarkers)[29]、基于代謝組學的膳食標志物(metabolomics-based dietary biomarkers)[30]等。
測量誤差通常會降低統計檢驗效能,且此問題無法通過誤差校正解決,其最直接的影響是使研究所需樣本量大大增加。因此,膳食研究通常需要很大的樣本量[5]。如美國癌癥中心開展的NIH-AARP隊列納入了188 736名絕經后女性,探究從脂肪中攝入能量占總能量比例與乳腺癌發病的關聯,結果顯示風險比的95%置信區間僅為1.00~1.24[31]。若非大樣本研究,則很可能無法發現一些膳食因素與疾病之間的關聯,目前仍可能有許多膳食因素與疾病的關聯被測量誤差掩蓋。
由于使用簡單和適用性廣,回歸校正法是目前最受歡迎的測量誤差校正方法。該方法通過建立真實值與測量值及協變量的線性回歸來估計校正值,然而該線性假設不一定能滿足。在非線性等復雜疾病模型情況下回歸校正法的校正效果可能較差[9]。今后在使用回歸校正法時應該充分考慮回歸校正法的適用條件,如當參考測量方式并非金標準時開展敏感性分析。此外,應該多嘗試回歸校正法之外的其他誤差校正方法,并進一步發展新的測量誤差校正方法。