政客的笑話層出不窮,然而他們有一種素質卻是普通人望塵莫及的,那就是:盡管手下的人交上來的全都是虛假報表,但他們依然可以做出近似合理的判斷。
關于這個問題,數學家可以告訴你答案,并且這也是理工科出身的政治家更多的原因。
在多數調查中,回答者沒有說謊的理由,如果有人被問:上星期是否買過一罐烤豆,他們的回答一般都是誠實的。然而在其他場合,比如你問起他們的收入、性活動或近年來的政治傾向,你就必須要考慮他們是不是在說謊。
人說謊的理由也是千奇百怪,更多的情況,他們不是要欺騙別人,而是要保護自己。比如湯姆發現自己上星期看了35小時的電視,他可能不想承認自己的生活如此無聊,所以就在21~30的方框里打了個鉤。
其中一個有趣的例子是性習慣調查,有個問題是問他們和多少個異性有過性關系。男性的平均回答是3.7,女性的平均回答是1.9。按理說,如果某個男人和某個女人有性關系,那就是說這個女人和這個男人有性關系,所以這兩個數值應該非常接近,但現在竟有3.7-1.9=1.8個女性憑空消失了。因此社會學家們得出一個結論:男性傾向于夸大他們的性活動,而女性則寧可把這個數字減少一點。
那么對付這類棘手的問題,統計學家就要做一點手段了。
比如在越戰期間,美國官方需要知道有多少士兵吸毒,可是沒有一個有理智的士兵會承認自己吸毒,因為這是違法的。那么研究者如何獲得真相呢?
他們采用了這樣一種技術:調研者手中有一個口袋,口袋中有三張卡片(如圖),他向士兵出示這個口袋,并把這三張卡片給士兵看。然后要士兵把手伸入口袋內,隨意取出一張卡片,不必給研究者看,只要在答題頁上答“是”或“否”就可以了。這樣一來,士兵答“是”的時候,研究者不能判斷他是基于什么問題回答的,所以士兵不可能被處罰,這就意味著他們應該比較傾向于做出誠實回答。
假定研究者采訪了1200名士兵,結果有560人對卡片上的問題說“是”,那么在1200人中,平均每張卡片有400人抽過,這意味著在560個回答“是”的答案中,有400個人回答的是三角形問題,160人回答的是毒品問題。因此大致的估計是400名士兵中有160人吸毒,即40%。
當然,抽樣要采取一種公平的原則,但有時偏差是不可避免的,比如護士時常為病人號脈20秒鐘,然后推算出病人一分鐘的脈搏。但很可能這20秒鐘所代表的并不是病人的常規狀態,比如一個有吸引力的女護士握住一個男青年手腕時,脈搏就經常失常——雖然這聽起來很像笑話,但它確實是一些醫療事故發生的原因。
接下來,我們探討的不是怎樣統計信息,而是如何利用信息。
假如,廣告告訴你:“在最近的一次調查中,有80%的貓主人說他的貓喜歡3A牌貓餅干!”而你通過再調查,發現該公司只調查了10個人。于是你推斷:這只能說明商品好,否則就是商家的運氣爆棚了。接著你買回了3A牌貓餅干,但你家的貓非但不喜歡吃它,反而把它摔在你的臉上。你又問了幾個朋友,他們的貓也不喜歡。你終于憤怒了,決心揭露商家在統計結果上玩的詭計,并把他們告上法庭……
那么,如果你是商家,你要如何做才能得出歡迎率達80%的調查結果呢?
(馮宇摘自《三車同到之謎——隱藏在日常生活中的數學》,上海教育出版社)