這是美國(guó)總統(tǒng)選舉史上一個(gè)真實(shí)的案例。這則案例反映出人們常規(guī)想象中的統(tǒng)計(jì)預(yù)測(cè),由于一些隱含因素的影響導(dǎo)致跟結(jié)果大相徑庭的事實(shí)。
1936年,美國(guó)總統(tǒng)羅斯福準(zhǔn)備競(jìng)選連任,他的對(duì)手是堪薩斯州州長(zhǎng)蘭頓,大多數(shù)的觀察家都認(rèn)為羅斯福可輕易實(shí)現(xiàn)連任。因?yàn)榱_斯福和蘭頓當(dāng)時(shí)的競(jìng)爭(zhēng)背景是,美國(guó)正從經(jīng)濟(jì)大蕭條中復(fù)蘇,盡管全國(guó)仍有900萬(wàn)失業(yè)人口,人民的實(shí)際收入比1929至1933那段時(shí)期少了約1/3,但總體情況正處于慢慢好轉(zhuǎn)的態(tài)勢(shì)。這給羅斯福為其在任期間財(cái)務(wù)赤字的辯護(hù)提供了有利支撐,有誰(shuí)不愿意這種良好的趨勢(shì)延續(xù)下去呢?所以剛剛成立的蓋洛普咨詢(xún)公司在調(diào)查了50000個(gè)樣本后,便預(yù)測(cè)羅斯福會(huì)得到56%的選票獲勝。但這個(gè)預(yù)測(cè)并沒(méi)有引起足夠重視,因?yàn)樵诋?dāng)時(shí)蓋洛普的名頭比起《文學(xué)文摘》(Literary Digest)雜志顯然要遜色的多。要知道,《文學(xué)文摘》在總統(tǒng)選舉的預(yù)測(cè)中素負(fù)聲望,自1916年開(kāi)始做預(yù)測(cè)以來(lái)從未錯(cuò)過(guò),所以它的預(yù)測(cè)結(jié)果才是人們特別關(guān)注的。
在大眾的期待中,《文學(xué)文摘》雜志給出了預(yù)測(cè)結(jié)果:蘭頓會(huì)以 57%的選票大勝羅斯福。這可不是隨意的判斷,雜志依據(jù)的是從龐大讀者群中回收的高達(dá)約240萬(wàn)份調(diào)查問(wèn)卷的統(tǒng)計(jì)數(shù)據(jù),這幾乎可稱(chēng)之為有史以來(lái)范圍最大的一次民意調(diào)查,無(wú)論如何都具有充分的說(shuō)服力。有不同意見(jiàn)的少數(shù)觀察家也不得不保持沉默靜待結(jié)果。可令大多數(shù)人意外的是,選舉結(jié)果卻是羅斯福以62.5%比37.5% 獲得壓倒性的勝利,正好與《文學(xué)文摘》的預(yù)測(cè)南轅北轍。而栽了大跟斗的《文學(xué)文摘》在總統(tǒng)選舉完不久就宣告破產(chǎn)。這讓大眾對(duì)雜志何以會(huì)犯如此離譜的錯(cuò)誤產(chǎn)生好奇,統(tǒng)計(jì)學(xué)家最終為人們揭開(kāi)謎底——調(diào)查樣本偏差。
可以理解的是,在科學(xué)嚴(yán)謹(jǐn)?shù)某闃诱{(diào)查中,樣本的挑選必須很公正,即必須涉及所有的可能范圍,才能獲得準(zhǔn)確有效的資訊。若在選樣過(guò)程發(fā)生“選擇偏差”,即有排除(或多取)某一類(lèi)樣本的傾向,那么依此進(jìn)行的統(tǒng)計(jì)判斷也極大可能發(fā)生偏差。《文學(xué)文摘》寄出的一千萬(wàn)份問(wèn)卷,去向是訂戶(hù)、電話(huà)簿及一些俱樂(lè)部的會(huì)員,顯然這是特定和特殊的人群。在1936年電話(huà)尚未普及(平均每四戶(hù)才有一臺(tái)),此外,參加任何俱樂(lè)部者都要具備一定經(jīng)濟(jì)實(shí)力。換句話(huà)說(shuō),這樣的抽樣過(guò)程存在排除窮人的傾向。 在1936年以前,這種選擇偏差對(duì)于預(yù)測(cè)結(jié)果沒(méi)有過(guò)多的影響,因當(dāng)時(shí)富人與窮人的投票行為差異并不太大。但在1936年,因經(jīng)濟(jì)的因素,造成選民政治傾向有很大的分歧:窮人較多選擇羅斯福,而富人則傾向支持蘭頓。這就造成了《文學(xué)文摘》的選樣偏差。不難看出,當(dāng)有這種偏差時(shí),樣本數(shù)雖多卻不見(jiàn)得有效。
除了這個(gè)主要原因,《文學(xué)文摘》還犯了另一個(gè)嚴(yán)重的錯(cuò)誤:對(duì)于受訪(fǎng)名單缺乏全面盡心的反饋爭(zhēng)取。簡(jiǎn)單地說(shuō),就是調(diào)查樣本中有過(guò)多沒(méi)有回復(fù)或作廢,也在一定程度上曲解了調(diào)查結(jié)果,這就是“拒絕(作廢)偏差”。《文學(xué)文摘》對(duì)全國(guó)所發(fā)出的一千萬(wàn)份問(wèn)卷中,只有比例不高的24%的回復(fù)。這24%反饋者的意見(jiàn),并不能代表全部被挑選的選民的意愿。因?yàn)樵跊](méi)有反饋回收的問(wèn)卷中,許多人的本意與反饋者的意見(jiàn)可能有很大的差異。比如,《文學(xué)文摘》在芝加哥所發(fā)出的問(wèn)卷數(shù),大約是芝加哥選民的1/3,不可謂不多,但其中回復(fù)者僅有20%。在回收問(wèn)卷中,支持蘭頓的超過(guò)半數(shù),但選舉結(jié)果,羅斯福獲得芝加哥約2/3的選票。可以看出,《文學(xué)文摘》的問(wèn)卷調(diào)查既存在樣本選擇偏差,又存在拒絕偏差,導(dǎo)致調(diào)查預(yù)測(cè)結(jié)果錯(cuò)誤就在情理之中了。
就一般而言,低收入與高收入者中作廢(不回答)問(wèn)卷的比例較高,這就導(dǎo)致在回收問(wèn)卷里中收入者的比例遠(yuǎn)遠(yuǎn)超過(guò)事實(shí)比率,而中收入者的意見(jiàn)與高收入或低收入者不見(jiàn)得相同,所以這種中收入者占大多數(shù)的調(diào)查就存在明顯的缺陷。因此現(xiàn)代重大議題的民意調(diào)查,在條件允許的前提下,側(cè)重于成功率可達(dá)65%的面訪(fǎng),這比回收率常不到25%的郵寄問(wèn)卷更全面也更有效。不過(guò)即使采用面訪(fǎng),類(lèi)似的偏差問(wèn)題仍然存在,這就要求調(diào)查者對(duì)被調(diào)查者的工作類(lèi)別、家庭狀況、社會(huì)背景等進(jìn)行詳細(xì)了解,盡可能采用巧妙合理的方法,解決偏差問(wèn)題以提高調(diào)查的有效性和科學(xué)性。