朱婉婷
2021年5月12日的《洛杉磯書評》網站上,刊載了克里斯托弗·J·菲利普斯的文章,題為《數字的背后:新冠疫情時代的累加風險》。在文中,菲利普斯對疾病統計學的歷史及其意義進行了評析。
統計數據和模型的運用如今非常普遍,從理論上說,我們能夠借助這些數據預測自己的健康風險,但所有這些數據卻并非精確,它們所針對的,其實并非你的個人健康風險,而是與你在年齡、性別、種族和街區等諸多方面相仿的一群人的累加概率。對統計學這一學科而言,累加的概念是其核心,但累加的過程,同時也是系統地抹除某些信息的過程,換言之,就是在得出數據平均數的同時,你也就抹除了每次單個測量的信息,進而你所得出的數字也與單個觀察的情況不同。而在醫學領域,被抹除的往往是關乎個人的細節——也就是使你與眾不同的地方,而你希望得到醫生的關注,也正是因為你認為自己是獨特的個人。反過來說,二十世紀的醫學統計學想要做的,就是使你將自身與和你共享某些特征的人聯系起來,并達成這樣的認知,即群體風險就是個人風險,即使前者只是對于風險的估算,并不可避免的既不清晰也不精確。舉例而言,你可能與一群人共享某些變量,且平均風險對于所有人來說都一樣,但總有一些未被測量的變量能夠揭示人與人之間的差異,比如家庭病史或飲食結構可能非常重要,但卻不在這些變量的范圍之中。而這也正是累加風險與個人風險之間的區別:你可以做測量、看數據并計算疾病風險,但如果并不清楚其在統計學意義上的分布情況(即你在多大程度上接近平均水平),那么你對個人風險的認知就會較低。
所有這些討論對于新冠疫情來說又意味著什么呢?從正面來看,疫情期間的統計數據、數字模型等,的確為我們的日常決策提供了基本依據:今天要不要出門?出門要避開那些地方?是否乘坐交通工具?乘坐哪種交通工具?有多少人注射了疫苗?疫苗的有效率是多少?不注射疫苗則風險幾率有多大?等等。但某種反諷情境依然無可避免:我們所生活的時代,數字模型更優、數據更為易得可靠、治療也更為有效,但所有這些,都無法抵御人類最古老的威脅之一——流行病。在此前的流行病時期,人們可以一面基于數據統計來吁求公共醫療服務,一面仍然堅信個人對自己染病負有責任:正如有學者在研究1980年代的艾滋病時所發現的,關于流行病的核心敘事之一,就是人們會借助某種既存的道德確信和精神假設來解釋誰得病、誰康復。如今,對于個人風險與集體風險的此類區分已經不再為人所熟知,我們也不太會說誰得病、誰康復是因為他/她有著不同的生活習慣或者精神信仰。面對新冠疫情,我們借助統計學能對一般的公共健康狀況有更多了解,但與此同時,如果想要知道你的家庭成員或朋友如何才能保證安全,你獲得的信息往往是不夠的,這大概正是大數據背后的反諷。