張曉暉
問:你只有10平方米的房屋,鄰居從90平方米換到190平方米,你的居住面積有沒有增加?
答:沒有。
錯,你在平均住房面積里增加了50平方米。
這雖然是有關平均數的一則笑話,卻能夠說明我們常常會被各種統計數字所欺騙和愚弄,忘記了這些數字也許是被精心挑選出來的,也許是有水分的。
統計的陷阱在哪里呢?首先是統計本身的不真實性。比如統計樣本的選擇偏差,或是樣本空間過小,導致代表性差。
統計樣本的選擇偏差是比較常見的,由于調查者的主觀意向或者客觀失誤的影響,統計樣本的選擇偏差會直接影響到統計的結果。
比如,你有一桶豆子,有紅色的,有白色的,那么紅色的豆子有多少呢?如果按照統計學的辦法,就是抓一把豆子(抽樣),然后算一下紅白豆子的比例就能夠得到近似的結果。但這個前提是,紅白豆子在體積、形狀、重量上的無差異化。如果是大豆子和小豆子呢?按照物理學原理,小豆子會在桶的下面,而大豆子在上面,如果你在上面抓一把樣本,就是大豆子多;在桶底抓一把樣本,就是小豆子多。
另一個陷阱在于統計之后的分析過程。在分析中,統計者是否遺漏了什么,或者忽視了統計所依賴的條件。
真正地了解統計數字,破除它身上的神秘感,你才會理智地站在各種各樣的數字面前,坦然地做出正確的判斷與選擇。