999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

定量流行病學和醫學科學研究中的因果聯系

2022-08-23 02:47:00陳心廣
廣西醫科大學學報 2022年7期
關鍵詞:因素分析模型

陳心廣

(西安交通大學全球健康研究院,西安 710020)

對事物間因果關系的興趣和好奇,是人類的天性。幾乎所有的學科領域,都關注因果關系方面的研究。與其他學科一樣,因果關系研究在醫學領域占有非常重要的地位,包括基礎醫學、藥理學、臨床醫學和預防醫學。醫學領域所關注的是影響健康和疾病的因素,包括健康危險因素、健康保護因素和健康促進因素。例如:為什么生活在環境污染嚴重的大城市居民的期望壽命,比生活在農村的人還長?在相同的條件下,為什么一些人感染新冠病毒,而另外一些人卻不感染?為什么不是每個超重或肥胖的人都患有高血壓、糖尿病和心臟病?為什么同一種病用相同的治療方法,有些病人效果好而有些卻不好?

筆者將從一個的新的角度,闡述因果聯系研究的本質、研究設計和分析方法。

1 二元分析因果探索

1.1 因果關系研究的本質

大多數醫療衛生工作人員的研究工作都是基于疾病和健康的因果關系研究。然而,很少有人發問:因果關系究竟指的是什么?比如,當研究體重與糖尿病之間的關系時,我們研究的究竟是什么?為什么得到的結論不像新冠肺炎與新冠病毒感染之間的關系那樣具有確定性?

根據發表的文獻和個人的實際經驗,最近出版的《Quantitative Epidemiology》[1]一書的作者提出,我們進行任何一項關于因果關系的研究,事實上都是從復雜的、相互依存的關系網絡里提取出來的,是我們認為可能存在的一種關系。如圖1 所示,宇宙間萬事萬物相互依存、互相關聯,形成錯綜復雜的關系網絡體系。而醫學研究人員則是根據實際需要、客觀條件、個人背景、興趣和能力等,從網絡體系中挑選出與健康或者疾病相關的一小部分進行研究。

圖1 對未知事物間因果聯系的探究,常常集中在廣袤宇宙多元多層次的網狀結構里某個小小的,我們比較熟悉的部分

例如,在真實情況下,疾病d 與3 個因素a、b、c之間存在如圖1所示的關系。某研究人員根據文獻資料和個人經驗,認為d 與a 有關。為證明這一假設,他設計一個科研項目來證明兩者之間的關系。然而,這個研究忽略了未知因素b 和c。由于因素c處在a 和d 之間,a 與d 之間的關系要通過c 才能實現。我們稱c 為中介因素,即位于刺激與反應變量之間還存在著沒有或者就不能觀察到的變量[2]。在不知道a-c 和c-d 關系的條件下,不能確定a-d 的關系。因素c 有可能阻斷a-d 關系,也有可能促進a-d關系。如果c是阻斷作用,所得到的結果可能是d與a無關;如果c是促進作用,其結果可能會放大d與a之間的關系。由此可見,僅僅忽略一個中介因素,對研究結果的干擾就如此嚴重。不難想象,當有多個因素介于我們研究的因素X和疾病Y之間,問題會有多嚴重。

第二,除了中介因素,還有影響因素b,也可稱為協變量或者混雜因素,即與因變量有相關關系,并且在探討自變量與因變量關系時需要加以控制的變量[2]。除了對d的影響,b還可以改變d與c和c與a 的關系。協變量的作用可能要比中介變量小,但是忽略了重要的協變量,也會嚴重影響因果推斷的結果,導致偏差,增加因果關系結論的不確定性。

最后,有些情況下很難事先確定d與a之間作用的方向,即無法事先知道是a 影響d 還是d 影響a。比如在研究慢性病與體力活動之間的關系時,往往無法事先確定是因為缺乏體力活動導致慢性病?還是因為患有慢性病而妨礙個人參加體力活動?由于一項研究一般只分析兩個變量的某個方向的關系,通常人為地指定X(自變量)和Y(應變量)。如果指定對了,即能夠得到預期的結果;反之,則不能。

理解在因果關系研究中上述的本質特點,有利于我們思考、設計、實施和評價科學研究項目,有助于準確地解釋自己觀察到的研究結果,和正確理解他人的研究結果。

1.2 慢性病和傳染病因果關系模式的差異

醫學科學研究另外一個重大問題是慢性病與傳染病的病因學模式。現代醫學科學的建立,在很大程度上是基于對傳染病病因的生物學研究,而基于病因學建立的有效預防和治療方法則是通過傳染病的研究和實踐,自然而然地形成了疾病的因果聯系模式,最典型的是科赫法則[3]。

以細菌性肺炎為例(圖2 的上面部分),要診斷病人患有細菌性肺炎,首先尋找的證據是肺炎雙球菌。如果通過細菌培養找到了,按照病因學推理模式,肺炎雙球菌很可能就是病因了。除了細菌培養之外,尋找病因的辦法還有抗生素治療,如果通過抗生素治愈,從病因學的角度可以進一步判斷肺炎雙球菌就是病因。

圖2 慢性病(以前列腺癌為例)不能套用傳染病(以細菌性肺炎為例)的病因學推理模式

推斷傳染病因果聯系的模式深入人心,使得廣大的醫務工作者和絕大多數科研人員在醫學科學研究和實踐中,很自然地以此模式作為指導。圖2的下半部分是關于前列腺癌因果關系推斷的例子。這一個例子證明,用傳染病模式來研究慢性病的病因會得到錯誤的結論。

目前,治療前列腺癌的第一線方法就是抗雄激素睪丸酮治療,不僅療效好,而且穩定。這種療法是基于上世紀70 年代獲得諾貝爾獎的動物實驗研究結果發展而來[4]。公認的病因學研究和幾十年成功的臨床實踐,這讓我們自然地形成了高雄激素是前列腺癌病因這一因果推斷。與前面介紹的推斷細菌性肺炎的因果聯系模式如出一轍,抗菌素治好了由細菌引起肺炎,因此推理可知,細菌就是肺炎的病因;抗雄激素治好了前列腺癌,同理,雄激素就是前列腺癌的病因。

可是,雄激素的水平在青年時期最高,而前列腺癌的發病高峰是在老年期即65~70 歲之間,在這個年齡階段,體內雄激素處在低水平已經很長時間了。因此,根據抗雄激素治療前列腺癌的結果,來判斷雄激素過高是前列腺癌病因是經不起事實檢驗的[5]。這個問題也許可以用另外一個理論來分析:前列腺癌的發病和進展是兩個不同的過程。前列腺癌發生的原因不是雄激素太高,而是性激素隨年齡下降太快。因此,不能僅僅依據抗雄激素治療效果明顯,來確定慢性病發病的原因就是雄激素過高,這個新理論已經得到不同研究的證實[6-8]。

1.3 研究特征與變量之間的關系

除了因果關系研究的本質特征和傳染病——慢性病因果聯系的模式的差異,病因學或者說因果關系研究還有一個被忽略的問題,就是研究特征與分析時所用的變量之間的關系。在《Quantitative Epidemiology》一書中,作者認為在提出一個關于病因學研究的課題時,我們關注的往往是某個特征,比如,研究疾病時我們考慮的是“病”,如高血壓、心臟病、糖尿病、肺癌、腸癌等等。研究影響因素時,我們考慮的是“因素”,如個人衛生、飲食習慣、體育鍛煉、吸煙、飲酒等等。

但是在開展具體研究時,我們測量的是“變量”。所謂變量,指的是相對單一的、可以客觀測量的指標。因此,一個特征可以用多種變量來測量(如圖3 左邊部分所示)。比如,在研究吸煙與肺癌的關系時,“吸煙”是我們關注的特征。可是在具體研究時,有很多變量可以用來反映(度量)吸煙這一特征。典型的例子如血清里或者唾液里尼古丁的代謝產物、體內呼出的氣體中二氧化碳的濃度等。除了實驗室指標,還有大量的調查指標,如開始吸煙的年齡、累計吸煙的年數、每個月吸煙的天數,每天吸煙的支數、累計吸煙的支數等等。選擇不同是指標,得到的研究結果一定是不同的。

圖3 研究考察的特征與因果聯系分析時用的變量之間的關系

除了影響因素,研究疾病也不例外。比如,研究糖尿病時,可以用是否死于糖尿病(死亡登記)、是否患有糖尿病(臨床診斷)、血糖水平、尿糖水平、AIC比例等等。這些變量從不同的側面反映了糖尿病這個“特征”。然而,采用不同的變量來分析因果關系,得到的結果可能會各不相同。以糖尿病死亡作為指標最可靠,因為死亡能夠準確地測量,但是影響死亡的因素卻是最不敏感的指標。而且影響死亡的因素,不一定是影響發病的因素。相對而言,以是否患有糖尿病作為變量比死亡敏感多了。但是,臨床診斷會出現誤差,進行病因學研究時也要考慮。實驗室指標在病因學研究中最常用,可是實驗室檢測的誤差有時候比簡單測量和調查數據的誤差還要大。

與一個特征對應多個變量關系相反的情況是,一個變量往往可以反映多個特征(如圖3 右邊所示)。例如,在上個世紀90 年代有一個非常有名的因果聯系研究,該研究發現擁有電腦與個人收入密切相關,而且控制了很多混雜因素后關系依然存在[9]。通過分析發現,擁有電腦這個變量可以反映很多特征,包括教育水平、職業和工作特點。遵循這一思路,后來有人研究證明,是否喜歡坐著、喜歡玩鉛筆、喜歡打電話也與個人收入密切相關。這是因為經常坐著、常常打電話、和喜歡玩鉛筆的人常常也用電腦,而且大都屬于高薪人群[10]。

1.4 認真選擇結果變量

在進行因果關系研究時,一定要認真選擇指標來測量結果變量Y。這一點對研究健康或者疾病問題尤其重要。因為對同一個疾病選擇不同的變量來進行測量,就會得到不同的研究結果。圖4 用反映身體、心理和行為問題的4 種疾病來演示結果變量的選擇。如果選擇發病作為結果變量,研究會聚焦在發病的原因。雖然發病原因非常重要,可是在實際工作中,確定發病是最難的,尤其是慢性病。

圖4 因果關系研究,包括身體心理疾病和行為問題,可以根據不同發展階段來選擇不同的結果變

其次,就是診斷,包括臨床和實驗室診斷,或者二者的結合。以診斷結果作為結果變量,也能夠很好地反映發病的原因。與發病相比,干擾診斷的僅僅只有那些延誤診斷的因素。相對于發病與診斷,疾病的進展和預后反映的內容包括兩個方面,而且傳染病和慢性病有所不同。如果是傳染病,影響疾病的進展和預后的除了醫療保健的差異,還有導致發病的原因,即致病菌。如果是慢性病,情況就更復雜,因為慢性病的發病、進展和轉歸,可以是由完全不同的因素導致的。這方面需要更多的研究。

2 二元分析交互與中介建模

2.1 因果關系的探索性分析

開展因果關系研究和推論非常具有挑戰性。除了借用扎實的理論基礎之外,還需要有支持證據。我們必須通過大量的探索性統計學分析,來判斷所選擇的X和Y是否符合事實。簡單線性回歸模型可以進行探索性分析:

模型(1)中,Yi表示因變量,Y有i 個指標,分別從1到i=I;Xj表示自變量,X有j個指標,分別從1到j=J;βij表示X的第j個指標與Y的第i個指標之間的關系;e表示模型的殘差。

根據模型(1)可知,完成一輪探索性分析一共要用I乘以J個回歸模型。假設X有20個指標,那么J=20;Y有10個指標,那么I=10;那么,完成一輪探索性分析一共要運行10×20=200個回歸模型。

用模型(1)完成探索性分析之后,記錄下估計的βij和相應的統計學檢驗得到的P值。如果所有的自變量X都是標準化的,就可以選擇P值最小的一個或幾個度量X的指標作進一步分析。這是因為,在同等的條件下P值最小的那些測量X的指標,是最有可能與相應的測量Y的指標有內在關系的。

2.2 多元回歸確認X-Y關系

完成探索性分析之后,就要通過多元回歸模型來確認結果。具體做法是,從探索性模型分析的多對測量X和Y的指標中選擇一兩對或者兩三對關系比較肯定的指標。然后,逐一地進行多元回歸模型分析。用多元回歸的目的,是控制一些在研究設計時無法控制的因素,比如人口學變量,以及與X和Y相關的協變量。這一步通常用下面的回歸模型來完成:

模型(2)中,X和Y是通過探索性分析選出來的變量;β是反映X與Y的關系的回歸系數;Deml表示一個人口學變量;Covk表示k個其他方面的協變量。

如果通過模型(2)的分析發現,在控制了人口學變量和協變量之后估計的回歸系數β仍然具有統計學顯著性(P<0.05),表明從統計學的角度X與Y之間有彼此有聯系,可以用來推斷二者之間是否有依存關系。如果控制人口學和其他協變量之后估計的回歸系數β不顯著,就有理由相信X與Y之間沒有真正的聯系,不能證實探索性分析得到的結果。

2.3 中介效應分析

從前面介紹的所有內容來看,分析因果聯系時每一次最好只納入一個自變量X。因為加入更多的自變量,問題就會變得很復雜。不但要考慮每個X的影響,還有考慮這些X之間的相互作用后對因變量Y的影響。按照圖1所示的因果聯系網的理論框架,即便選擇合適的變量,也很難確保根據所選變量建立的模式符合客觀事實。

目前通過大量的理論分析和科學研究嘗試,建立了一些同時分析兩個自變量X的方法。最引人注目的兩種方法就是中介變量分析(mediator analysis)和交互作用分析[11-12]。這里先介紹中介效應分析。

如圖1,通過文獻資料及理論分析發現,變量c可能是介于因變量d和自變量a之間的一個因素。在這種情況下,就可以用中介效應模型來進行分析驗證。令Y=d,X=a,M=c(這里M表示中介變量),那么中介效應模型(mediation effect model)可以表述為:

通過模型(3)和(4)估計出回歸系數a,b,c之后,就可以用下面的方法計算中介效應:

通過模型(3)估計的回歸系數c就是自變量X對因變量Y的直接效應。數學上可以證明,估計的直接效應加上中介效應,就是X對Y的總效應。

2.4 交互效應分析

交互效應(interaction effect)也是經常用來研究兩個自變量與一個因變量之間的關系。假設第一個自變量仍然為X;為了與中介效應模型的中介變量M區別,令第二個自變量為W;分析交互效應的回歸模型可以表示為:

模型(6)中,X×W表示交互效應,而回歸系數表示交互效應的大小和方向;與模型(3)相同,e是殘差。

如果通過模型(6)估計的回歸系數β3具有統計學意義,就表示X與W具有交互效應。為了進一步證實交互效應,模型(6)可以仿照模型(3)進一步擴展,加入人口學變量和其他協變量。

3 討論

探索因果關系,是醫學科學研究中一個非常重要的命題。尤其當絕大多數基礎性研究不可能直接在人體上進行實驗,只能在盡可能接近實際的情況下展開,這時無法排除多種干擾因素。因為真實的事物關系處于一個龐大的關系網絡,我們只能選擇一對因素(X與Y)來進行評價分析其關系,所選擇的只是紛繁復雜的因果關系網絡里的一小部分。要想科學地證明所選擇的兩個變量X與Y之間的關系是否真實,這是極具挑戰性的工作。除了需要具備扎實的理論功底和豐富的實踐經驗之外,還需掌握牢固的流行病學基礎和嚴謹的統計學方法。

探索因果聯系的方法很多,新的方法和技術也在不斷涌現。本文希望能夠起到拋磚引玉的作用,引導更多從事醫療衛生工作的研究人員思考疾病與健康之間的因果關系,這樣既能提高我們發現問題、解決問題的能力,也能助推醫學科學不斷發展進步。

猜你喜歡
因素分析模型
一半模型
腹部脹氣的飲食因素
中老年保健(2022年5期)2022-08-24 02:36:04
群眾路線是百年大黨成功之內核性制度因素的外在表達
當代陜西(2021年12期)2021-08-05 07:45:46
隱蔽失效適航要求符合性驗證分析
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統及其自動化發展趨勢分析
3D打印中的模型分割與打包
短道速滑運動員非智力因素的培養
冰雪運動(2016年4期)2016-04-16 05:54:56
主站蜘蛛池模板: 久草国产在线观看| 国产不卡在线看| 2024av在线无码中文最新| 伊人蕉久影院| 国产欧美日韩精品综合在线| 久久精品人人做人人综合试看| 亚洲欧美极品| 99在线观看国产| 免费Aⅴ片在线观看蜜芽Tⅴ| 久久99久久无码毛片一区二区| 成人免费网站在线观看| 中文字幕欧美日韩高清| 欧美成人精品一级在线观看| 四虎影视国产精品| 伊人久久综在合线亚洲2019| 国产免费怡红院视频| 亚洲国产理论片在线播放| 亚洲第一页在线观看| 亚洲av日韩av制服丝袜| 色呦呦手机在线精品| 久久综合久久鬼| 亚洲av无码人妻| 亚洲无码精彩视频在线观看| 国产在线观看第二页| 精品91视频| 女人毛片a级大学毛片免费| 国产亚洲精品自在久久不卡| 精品无码视频在线观看| 亚洲欧美日本国产综合在线| 久热这里只有精品6| 亚洲a级毛片| 亚洲首页在线观看| 久久久精品国产SM调教网站| 18禁影院亚洲专区| 国产一区二区三区在线观看免费| 手机精品福利在线观看| 成年人国产视频| 国产精品人莉莉成在线播放| 亚洲视频二| 国产精品漂亮美女在线观看| 亚洲乱码精品久久久久..| 国产喷水视频| 无码'专区第一页| 无码福利视频| 午夜a级毛片| 高清国产在线| 亚洲乱码在线视频| 国产精品欧美激情| 日韩一区二区在线电影| 欧美日韩中文字幕在线| 亚洲第一视频免费在线| 国产剧情伊人| 欧美专区在线观看| 色成人亚洲| 一级毛片免费观看久| 国产 在线视频无码| 精品国产91爱| 国产三级国产精品国产普男人 | 99久久精品久久久久久婷婷| 特级毛片免费视频| 青青操视频在线| 一级黄色网站在线免费看| 亚洲美女久久| 58av国产精品| 黄片一区二区三区| 国产黄在线免费观看| 日韩不卡高清视频| 国产欧美精品一区aⅴ影院| 久久人妻系列无码一区| 老司机午夜精品网站在线观看 | 女人18毛片一级毛片在线 | 午夜精品福利影院| 久爱午夜精品免费视频| 伊人色天堂| 色综合久久无码网| 狠狠综合久久| 国产好痛疼轻点好爽的视频| 欧美亚洲欧美区| 亚洲欧洲免费视频| 狠狠亚洲五月天| 欧美日韩国产精品综合| 亚洲天堂免费在线视频|