999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

因果推斷的Lord 悖論解析

2022-11-25 03:39:30程開明
統計理論與實踐 2022年10期
關鍵詞:效應差異模型

程開明 程 燦

(浙江工商大學 統計學院,浙江 杭州 310000)

一、引言

因果關系探究是人類認識自然與社會的重要手段,哲學界很早就對因果關系進行了討論,但真正可操作的因果概念卻源于統計學。Fisher(1935)提出隨機化實驗,使統計學理論從相關性分析擴展到因果性考察[1]。隨機化實驗是在無法完全控制一些重要自變量或控制變量時,讓隨機機制來決定干預變量的分配,以獲得正確的因果效應。然而,在實際應用中隨機分配通常較困難,甚至不可行,往往只能依據觀測性數據進行因果推斷,容易造成統計悖論。

基于非隨機分配的觀測性數據,通過比較群組差異來考察變量關系是通常做法。然而,即使以同一觀測數據為研究對象,不同的模型假定下若引入第三變量作為校正因素,研究者感興趣的雙變量關系可能增強、減弱甚至逆轉,由此產生一些悖論如Simpson 悖論、Lord 悖論等。理解這些悖論的內涵及成因有助于洞察諸多研究的爭議與矛盾之處,進而識別與避免數據分析中的一些陷阱。Simpson 悖論為大家所熟悉,學界對其表現及成因進行了大量探討,而有關Lord 悖論的文獻并不多,國內尚未見到系統闡述。鑒于此,本文力圖對因果推斷中Lord 悖論的內涵、成因等進行解析,得到若干有意義的啟示,以避免因悖論引起的因果推斷謬誤。

二、Lord 悖論的內涵

(一)Lord 悖論的由來

Lord 悖論由美國教育測試服務機構(Educational Testing Service,ETS)的統計學家羅德(Frederic Lord)于1967 年提出,認為在使用統計方法進行組間比較時,因變量的差異可能由未被觀測到的變量差異所引起,如果不排除這種可能性,往往出現解釋上的悖論問題[2]。為簡單明了地描述這一問題,Lord 構造了一個假想案例:一所大學想研究食堂提供的飲食對學生體重的影響以及影響的性別差異,為此收集各種類型的數據,特別是記錄每個學生1963 年9 月和1964 年6 月的體重數據。學年結束時,兩位統計學家對這些數據進行獨立審查,并基于性別分類分別采用不同的統計方法考察食堂飲食對學生體重的影響,卻得到完全相反的結論:第一位統計學家認為食堂飲食對學生體重沒有任何影響,且不存在性別差異;第二位統計學家則認為食堂飲食對學生體重產生正向影響,且對男生體重增加的影響明顯強于女生,即存在顯著的性別差異。

第一位統計學家采用一種相對簡單的方法,先計算男生和女生入學時的平均體重,然后計算入學一年后的男、女生平均體重,最后將兩組數據進行對比。如圖1 所示,橫軸表示1963 年9 月入學時的體重X,縱軸表示1964 年6 月放假前的體重Y,男、女學生體重的散點圖分別用m 和f 標出[3]。從個體看,入學一年后絕大多數學生的體重均有變化,但從平均體重看,男生前后的平均體重均為150 磅(圖中右上方的黑點),女生前后的平均體重均為130 磅(圖中左下方的黑點)。因此,第一位統計學家認為食堂飲食對學生體重沒有產生影響,也不存在性別差異。

圖1 Lord 悖論示意圖

第二位統計學家采用相對復雜的方法——協方差分析(Analysis of Covariance,ANCOVA)。假定男生、女生的最終體重對初始體重回歸直線的斜率基本相同,且在男生、女生子群具有相同初始體重頻率分布的基礎上,構建一個線性回歸模型,既控制個體入學時的體重,又考慮性別差異,模型形式為:

式(1)中,Gi表示個體i 的性別,男生取值為1,女生取值為0;Xi是個體i 入學前的體重;Yi是個體i 入學一年后的體重;系數βg反映了男、女生之間的差異。通過最小二乘法擬合上述回歸模型,等價于分別對男生、女生擬合兩條平行的回歸直線。如圖1 所示,兩條實線的斜率βx相等但截距不同,截距之差就是回歸系數g。因此,第二位統計學家認為在男、女生初始體重差異適當限定的條件下,食堂飲食對學生體重產生正向影響,且男生體重的增加要明顯多于女生。

根據協方差分析的一般線性假設,兩位統計學家的結論顯然都正確,但為什么會相互矛盾呢?解釋這一問題的基本前提是不存在不可控制的先驗差異,而Lord(1967)認為對這類觀測性數據的研究,并沒有邏輯或程序能夠為組間不受控制的先驗差異提供合適的限定。因此,Lord 悖論給那些希望對群組進行類似研究的學者增加了一項困難的解釋性任務。不難看出,兩位統計學家的結論都離不開必要的假設前提,而這些假定往往不能依經驗加以驗證,故而避免Lord 悖論的關鍵在于厘清其內在的因果效應。Rubin(1974)提出潛在結果的概念,為定義因果效應問題提供了有效框架[4],能夠較好地解釋Lord 悖論[4]。

觀察性研究中,定量分析結論通常建立在一些不可經驗證偽的假定基礎之上,這使Lord 悖論活躍于因果探究的各個研究領域。針對Lord 悖論在不同領域的表現,可概括出Lord 悖論的一般定義:當研究人員考察兩個變量間的因果關系時,如果一個變量是連續型,而另一個變量是類別型,此時加入第三個連續型變量進行校正而產生相反結論的情形均可視為Lord 悖論。Tu 和Gunnell 等(2008)對出生體重與日后患高血壓的因果關系進行研究,單獨考察兩者之間的關系發現出生體重較重者相對于出生體重較輕者具有更高的平均血壓,而將當前體重作為共變項進行校正后,則發現出生體重較重者的平均血壓反而要低于出生體重較輕者[5]。Sorjonen 和Farioli 等(2017)以一群瑞典男性為研究對象,發現患有近視的男性擁有比正視眼男性更高的智力和教育水平,且這兩組人的水平都高于患有遠視的男性。若將智力作為共變項進行校正,卻發現遠視眼男性的教育水平反而高于正視眼男性[6]。此類Lord 悖論的案例還有很多,不再一一列舉。

(二)三大悖論的比較

因果推斷中的Lord 悖論、Simpson 悖論與抑制效應都呈現為反向悖論,但三者之間又有區別。Simpson悖論由英國統計學家辛普森(Edward Huge Simpson)于1951 年提出,在研究兩個類別型變量是否具有關聯性時,引入第三個類別變量時可能得到完全相反的結論[7]。抑制效應是指在線性回歸模型中引入一個與因變量無關的潛在協變量反而會提高模型估計的擬合優度。表1給出Lord 悖論、Simpson 悖論與抑制效應之間的聯系與區別。其中,Simpson 悖論由無條件概率和有條件概率結果之間的差異造成,Lord 悖論由無條件均值和有條件均值結果之間的差異造成,而抑制效應則由無條件的變量關系和以某一無關變量為條件的變量關系結果之間的差異造成。

表1 Lord 悖論、Simpson 悖論與抑制效應的比較

為了更直觀地認識Lord 悖論、Simpson 悖論和抑制效應的區別,根據Tu 和Gunnell 等(2008)的研究為案例進行闡述。其研究涉及三個變量:出生體重、當前體重和血壓,為考察出生體重是否與日后患高血壓有關,首先對樣本進行描述性分析,發現出生體重較輕者患高血壓的風險要低于出生體重較重者。若將當前體重和血壓定義為連續型變量,出生體重為類別型變量,雙樣本t 檢驗表明出生體重較重者的平均血壓要高于出生體重較輕者;將當前體重作為協變量進行校正,結果顯示出生體重較重者的平均血壓反而要低于出生體重較輕者,這一現象即為Lord 悖論。如果將當前體重分為大于90kg 和小于等于90kg 兩個組別并作為協變量進行校正,得到出生體重較輕者患高血壓的風險要高于出生體重較重者的結果,這一現象被稱為Simpson 悖論。若將出生體重、當前體重和血壓均定義為連續型變量,通過兩個線性回歸分別考察出生體重與血壓、當前體重與血壓之間的關系,發現出生體重、當前體重均與血壓呈正向關系,然而將三者同時進行回歸則發現出生體重的偏回歸系數為負值,當前體重的偏回歸系數為正且大于單獨回歸的系數,原因在于出生體重抑制了當前體重對血壓的噪音,這一現象即為抑制效應。

三、Lord 悖論形成的解釋

Lord 悖論形成的內在機制是什么?學者從不同角度展開了多方面解釋,本文遵從歷史演進的邏輯,解析Lord 悖論產生的內在機制。

(一)模型設定的影響

在Lord(1967)的案例中,第二位統計學家注意到男生的平均初始體重要高于女生,看似比較合理地將初始體重的差異歸于性別差異,因此對這一差異進行校正,單獨對男、女生的體重進行比較,得到與第一位統計學家相反的結論。當將男、女生作為一個整體來考察其平均水平時,男生體重增加更多的效應突然消失,這違背了“確定事件原則”,即當應用于作為一個整體的總體時,每個子總體之間的關系不應消失或逆轉[8]。

由于無法獲得舊的食堂飲食數據,早期致力于解釋Lord 悖論的學者假定了一個在舊飲食條件下的體重增長模型,得出幾乎一致的結論,即兩位統計學家實際上都是正確的,結果依賴于假定模型和統計學家試圖去回答的確切問題。Bock(1975)通過兩個不同的問題來印證兩位統計學家不一樣的結論,認為第一個結論是第二個結論的一般化形式[9]。Cox 和McCullagh(1982)假定在舊飲食條件下每個人的最終體重與初始體重保持相同,以此為基礎計算新飲食條件下的因果效應,發現第一位統計學家是正確的,新飲食條件對男性和女性體重增加的平均效應都為零[10]。基于相同的模型,他們發現第二位統計學家也是對的,因為最初體重超重的人往往會減肥,而最初體重不足的人往往會增重,那么比較相同初始體重的男、女生會顯示男生比女生增加了更多的體重。然而,Cox 和McCullagh(1982)并沒有回答為什么每個子群體的不同收益和相等的平均收益不能違背“確定事件原則”這一問題。Holland 和Rubin(1982)構建了幾種不同的舊飲食假設模型,發現飲食的性別因果效應對男生和女生來說可能都不為零,依據假設模型的參數,其差異可能是正值或負值,因此這兩位統計學家可能都是正確的或都不正確,結論取決于舊飲食增重模型的假設[11]。同樣,Holland 和Rubin(1982)也沒有解釋在新飲食數據下為什么兩位統計學家的結果不應該受到“確定事件原則”的約束。值得注意的是,“確定事件原則”并沒有禁止總體上局部關聯的逆轉或消失,僅僅是禁止在子群體保持相同時因果效應的逆轉。Lord(1967)案例中女生在初始體重較輕者中所占比重高于男生,因而隨著研究對象從男生轉向女生,以初始體重為特征的子群體就會發生變化。因此,檢驗是否違反“確定事件原則”的最優方式是將性別作為干預變量,考察其對體重增長的影響。

另一個早期學者無法回答的問題是:Lord(1967)允許初始群組差異的一般策略要求是什么?Lord(1967)指出,在可獲得數據的基礎上,研究者比較群體之間的關系時應當保證他們之間沒有不受控制的初始差異。回顧Lord(1967)的案例,其實際目的是為了考察在固定或給定飲食條件下,男生的新陳代謝對生長模式的影響是否與女生不同。如果不存在初始差異,毫無疑問性別對體重增長的因果效應是這一研究的關鍵因素。但是,Lord(1967)認為并沒有合適的一般標準能夠用于控制組間的初始差異,這一觀點給半個世紀以來該領域的因果推斷與解釋帶來巨大挑戰。

(二)因果中介的影響

盡管當時沒有一個通用標準能夠對組間不受控制的初始差異給予合適的限定,隨著潛在結果框架和因果網絡圖的提出,這一標準在有關因果探求的文獻中得到很好發展[12-15]。Lord(1967)的案例中第一位統計學家估計了性別對體重增長的總效應,第二位統計學家估計了基于中介變量(初始體重)校正的直接效應,而一般標準問題與中介變量校正是否適用于估計總效應和直接效應的答案一致。為了更直觀地理解Lord悖論中存在的因果中介問題,借助因果圖進行分析(見圖2)。

圖2 Lord 因果圖

圖2 中G 表示性別,W1是初始體重,WF為最終體重,令Y 為增加的體重(WF-W1)。從圖2(a)可以看出,初始體重W1受性別影響,而W1又影響到最終體重WF,因此W1可被看作是G 和WF的中介變量,或是G和Y 的中介變量。假設不存在其他混雜因子,令G=1表示男生,G=0 表示女生,得到總效應:

而直接效應為:

顯然,兩者的表達式存在較大差異,因而會得到不同的估計結果。為了更簡便地考察兩者結果的差異,借鑒Wright(1921)[16]和Pearl(2013)[17]的方法,對圖2(a)中的模型進行線性化,得到圖2(b)。假設變量已經過標準化處理,則總效應是G 到WF的所有路徑上系數效應的總和,即:

而直接效應則跳過所有經過W1的路徑,只考察性別對最終體重的影響,即:

可見,當b=a(1-c)時,總效應為0,而直接效應是一個正值。換句話說,雖然男生的平均初始體重高于女生,但性別差異會產生更多的高體重男生,扣除這一性別差異引起的部分會使男生體重的總效應等于女生。因此,兩位統計學家得到不同卻不矛盾的結論并不奇怪,問題的關鍵在于研究者事先指定的考察目標是直接效應還是總效應。實際生活中諸如此類的情況很多,例如天花接種會帶來致命的風險,但在整體上卻能降低死亡率。

(三)混雜因子的影響

Holland(1986)主張沒有操作就沒有因果關系,性別變量的不可操作性決定其不能產生因果效應[18]。鑒于此,Wainer 和Brown(2006)簡化了Lord 悖論,將性別因素排除在外,構建模型來考察兩個食堂所提供的不同飲食對學生體重的影響效應[19]。由于食堂選擇是可操作的,因果效應能夠被明確界定。他們同樣讓兩位統計學家采用不同的統計方法進行估計,結果如圖3所示。

圖3 簡化的Lord 悖論示意圖

第一位統計學家計算了每個學生在上一年9 月份和下一年6 月份的體重差異,從圖3 可看出體重差異分布于45° 對角虛線上,表明兩個食堂對學生體重增加的影響沒有差異。第二位統計學家則對每個學生上一年9 月份到下一年6 月份的體重進行協方差分析,從圖3 可看到食堂B 回歸直線的截距要高于食堂A,表明食堂B 的平均體重增加要大于食堂A。那么,究竟哪種計算結果是正確的呢?回答這個問題,首先要弄清楚食堂B 飲食的因果效應是什么。在W-B 因果圖(見圖4)中,初始體重(W1)不再是獨立的干預,實質上是一個混雜因子,因為體重超重的學生似乎更傾向于選擇食堂B,意味著W1既影響飲食(D),也影響最終體重(WF)。在估計因果效應時,如果存在混雜因子,須對其進行控制,否則會得出錯誤的結論。基于此,無論研究者是想考察飲食對最終體重的影響還是對體重增加的影響,都必須對初始體重W1進行校正。因此,此案例中第二位統計學家采用協方差分析所得的結論是正確的,而第一位統計學家的結論存在錯誤。

圖4 W -B 因果圖

比較Lord(1967)以及Wainer 和Brown(2006)的研究發現,為了考察兩個變量之間的關系,他們均引入共變項——初始體重W1,不同的是W1在Lord(1967)的研究中是一個中介變量,而在Wainer 和Brown(2006)的研究中是一個混雜因子,這一差異導致對Lord 悖論的兩種不同解釋:當W1是中介變量時,兩位統計學家的結果都是正確的;當W1是混雜因子時,第一位統計學家的結果是錯誤的,第二位統計學家的結果是正確的。

(四)Lord 悖論的衍生

上述關于形成Lord 悖論的解釋均以潛在結果框架為基礎,認為兩種方法之間的選擇取決于不可測試的假設條件,即不存在其他未被觀察到的混雜因子,如果存在混雜因子須通過嚴格的邏輯推導來決定目標效應是否可估計,否則估計的因果關系可能有偏。最近在健康科學領域,因果圖工具的運用表現出明顯的優勢,使出生體重悖論成為Lord 悖論衍生形式之一。出生體重悖論考察的是出生體重與吸煙母親所生子女死亡率之間的關系,一般來說低出生體重兒具有更高的死亡率,而吸煙母親所生子女的出生體重更可能低于非吸煙母親所生子女的出生體重,因此吸煙母親所生子女的死亡率應該更高。然而,Wilcox(2006)卻發現吸煙母親所生低出生體重子女的死亡率要低于非吸煙母親,這一結果似乎表明母親吸煙對嬰兒健康是有益的,顯然不符合科學常識[20]。

為了弄清出生體重悖論產生的根源,首先應考察出生體重對死亡率的因果效應。由于吸煙以及其他未被觀察到的混雜因子存在,估計結果往往有偏。即使對吸煙進行控制,仍然可能有其他混雜因子無法控制。值得注意的是,吸煙和其他因素都影響出生體重,控制吸煙這一因素將改變其他因素導致低出生體重的概率。假定相比于吸煙,造成低出生體重的其他因素可能更有害,使吸煙反而會降低其他因素所引起的死亡率,從而產生非吸煙母親所生子女死亡率更高的錯覺。此外,進一步考察吸煙對死亡率的影響,如果不存在其他影響出生體重初始差異的因素,這一問題就回到了最初Lord 悖論的因果中介問題。概括來說,Lord 悖論中面對的是兩種看似都合理的分析方法之間的沖突,而出生體重悖論面對的是有效分析方法與結論合理性之間的沖突。

四、Lord 悖論的啟示

隨機實驗是進行因果推斷的標準手段,當隨機實驗不可實施時,混雜因子往往不可避免地存在,阻礙著因果效應的正確估計。無論是最初的Lord 悖論還是其衍生形式,在群組間沒有不受控制的初始差異的前提下,解決悖論的根源在于界定共變項是中介變量還是混雜因子。如果是中介變量,研究者應事先明確研究目標是直接效應還是總效應;如果是混雜因子,即使兩個變量之間沒有因果關系也可能表現出相關性,此時應排除以混雜因子為條件造成的變量相關性,以分離出真正的因果效應。可見,避免Lord 悖論出現的關鍵在于明晰變量之間的因果關系。統計推斷本身并不足以給出因果關系的信息,不正確地運用統計模型可能產生一致、可復制但錯誤的結果[21]。為有效獲取變量之間的因果關系,須科學開展因果推斷,對非隨機分派的觀測性研究,建立統計模型時不僅要考量因果推斷準則,先驗知識與理論構建也扮演著至關重要的角色,因為找出同時與因、果都有聯系的變量并不僅僅是數學或統計問題,還需要相關領域的經驗積累。

Lord 悖論留給學界一個難題:基于現實世界的一個基本理論模型,是否應該允許初始差異的存在?如果允許,應當如何處理?通過Lord(1967)、Wainer 和Brown(2006)的案例可知,此類問題可采用合理的理論模型來加以解決,而不需對干預和結果之間關系的函數形式做任何假定。出生體重悖論也為這一爭議提供了有效解決方案的啟示,即學者應放棄傳統依靠統計定義而開展的中介分析,取而代之的是采用基于反事實框架的因果定義來進行分析。對某一特定場景,是否可以估計出預定效應是一個統計問題,不應被直覺的沖突所動搖。

實際應用中探究事物背后的因果關系時,應多用批判的眼光看待統計結果,并保持小心警惕的心態,遇到有悖于直覺的觀點和見解時,應放棄原有習慣性保持的直覺或舊觀念,以看清意外結果的內在本質,有效避免數據分析中的悖論和陷阱。◆

猜你喜歡
效應差異模型
一半模型
相似與差異
音樂探索(2022年2期)2022-05-30 21:01:37
鈾對大型溞的急性毒性效應
懶馬效應
今日農業(2020年19期)2020-12-14 14:16:52
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
找句子差異
生物為什么會有差異?
應變效應及其應用
3D打印中的模型分割與打包
主站蜘蛛池模板: 亚洲视频色图| 亚洲综合片| 国产永久在线观看| 国产精品成人免费视频99| 精品国产成人三级在线观看| 国产精品美女免费视频大全| 国产后式a一视频| 欧美激情综合一区二区| 中文字幕久久精品波多野结| 欧洲成人在线观看| 国产一区免费在线观看| 色有码无码视频| 无码视频国产精品一区二区| Jizz国产色系免费| 2021国产精品自拍| 在线综合亚洲欧美网站| 99久久精品国产自免费| 日韩a级毛片| 欧美日在线观看| www.精品国产| 在线精品自拍| 国产成人综合在线视频| 国产91高清视频| 九色91在线视频| 成人午夜亚洲影视在线观看| 少妇精品久久久一区二区三区| 人妻精品久久久无码区色视| 在线国产毛片| 国产成+人+综合+亚洲欧美 | 毛片免费视频| 亚洲国产欧美自拍| 欧美精品一二三区| 中国国产一级毛片| 亚洲天堂成人在线观看| 成人精品视频一区二区在线| 久久综合色视频| 另类专区亚洲| 扒开粉嫩的小缝隙喷白浆视频| 国产又大又粗又猛又爽的视频| 永久免费av网站可以直接看的 | 国产jizz| 亚洲区视频在线观看| 亚洲第一成年网| 色婷婷视频在线| 免费午夜无码18禁无码影院| 女人av社区男人的天堂| 亚洲欧美成人影院| 国产精品太粉嫩高中在线观看 | 国产综合精品日本亚洲777| 国产精品福利在线观看无码卡| 欧美区在线播放| 99热亚洲精品6码| 色窝窝免费一区二区三区| 欧美日韩国产在线人| 国产福利免费在线观看| 五月婷婷精品| 欧美黄色网站在线看| 亚洲天堂在线视频| 国产精品yjizz视频网一二区| 亚洲三级片在线看| 亚洲 日韩 激情 无码 中出| 亚洲无码精品在线播放| 亚洲精品在线影院| 在线高清亚洲精品二区| 91欧美在线| 黄片在线永久| 久久午夜夜伦鲁鲁片无码免费| 青青青草国产| 日韩午夜福利在线观看| 在线a视频免费观看| 五月天天天色| 国产黄色视频综合| 99热这里只有精品免费| 最新精品久久精品| 99re在线免费视频| 狠狠亚洲婷婷综合色香| 欧美日本在线播放| 国产AV无码专区亚洲A∨毛片| 欧美啪啪视频免码| 亚洲精品你懂的| 99福利视频导航| 国产91成人|