〔美〕達萊爾·哈夫 廖穎林 譯
我相信你不是一個勢利小人,而我也并不從事房地產生意。但請讓我們作這樣的假定,并且假設現在你正在一條我熟知的街上看房子。對你的情況進行了初步判斷后,我巧舌如簧、費盡心思地讓你相信附近居民的年收入大約有10000英鎊。也許這增加了你居住于此的興趣,不管怎樣,買賣最終成交了,那美妙的數字也被牢記在你的腦海中。你有那么一點勢利,當與朋友聊天時,你就會不經意地流露出你居住的地點:我住在一個相當棒的高收入小區。
大約一年后,我們又見面了。作為某納稅者委員會的成員,我正在四處奔走,為降低稅率、降低財產估價、降低公共交通費用而呼吁。我的理由是:我們支付不起各種上漲的費用,畢竟,附近居民的平均年收入只有2000英鎊。也許你會加入我們委員會的工作中來——這說明你不僅勢利,而且還挺吝嗇。但是,當聽到那可憐的2000英鎊時,你也禁不住大吃一驚。到底是我現在撒了謊呢,還是一年前撒了謊?
其實這兩次你都無法怪罪于我,這便是利用統計撒謊的妙處。兩個數字都是正規的平均數,計算方法也完全正確。兩個數字都基于相同的數據,來自相同的居民,根據相同的收入。所有都是相同的,但顯然至少其中一個數據令人誤解,足以與彌天大謊相媲美。
我的花招是兩次分別使用了不同的平均數,而“平均數”這個詞有很寬泛的含義。當一個家伙希望影響公眾的觀點,或者向其他人推銷廣告版面時,平均數便是一個經常被使用的伎倆。雖然有時出于無心,但是更多的時候是明知故犯。所以,當你被告知某個數是平均數時,除非能更進一步地說出它的具體種類——均值、中位數還是眾數,否則你對它的具體含義仍知之甚少。
當希望數值較大時,我所使用的10000英鎊是均值,即附近居民收入的算術平均數。你只要將所有家庭的收入加起來并除以家庭總戶數,便可得到該平均數。數值相對較小的是中位數,它透露了這樣的信息:一半家庭的收入超過2000英鎊,另一半家庭的收入不及2000英鎊。我還可以利用眾數,它是在所有家庭收入序列中出現次數最多的那個收入。例如,如果附近的居民中,年收入為3000英鎊的家庭數多于其他收入的家庭數,那么收入的眾數就是一年3000英鎊。
在這個例子中,不合適的平均數實際上是毫無意義的。只要碰到收入數據,這種情況就經常出現。
(曾紀洲摘自中國城市出版社《統計數字會撒謊》一書)