歷史上有一個著名的偵破數據造假的案例,特別有趣。發現數據造假的“大偵探”,是19 世紀法國著名數學家龐加萊。
原來,龐加萊有一個習慣,每天從家附近的面包店買一條標注1000 克重的面包。他回家仔細稱量這些面包后卻發現,面包的平均重量只有950 克,顯然面包師故意缺斤少兩,龐加萊氣得馬上報了警。面包師當著警察的面賭咒發誓,以后堅決不犯了。
之后,龐加萊繼續在他家買面包,發現每天買到的面包確實大了一些。但他仍然覺得有什么地方不對勁。于是,每天都去買面包仔細稱重,結果都超過了1000 克。龐加萊終于印證了自己的懷疑:這個面包師根本沒有改過自新,而是繼續缺斤少兩。
龐加萊的推論過程是這樣的:如果面包店里的面包平均重量是1000 克,面包師每次隨機拿一條給他,他拿到的面包應該是有的比1000克稍微重一點,有的比1000克稍微輕一點。所有面包的重量分布曲線應該呈鐘形,也就是正態分布,在坐標為1000 克的地方達到最高點,兩端逐漸下降并左右對稱。然而,龐加萊買的面包偏輕的太少,偏重的卻過多,鐘形曲線被扭曲了。這意味著,面包師并不是從面包中隨機拿一條給他,而是特意選出一條最大的給他。當警察再次上門,面包師大吃一驚,死活想不通龐加萊是怎么看穿他的把戲的。
后來,人們把龐加萊的方法叫作“統計偵察術”。有人用同樣的方法,發現了美國籃球比賽中打假球的現象。你也可以試著用這種方法,當一回生活中的數據偵探。
(摘自《百科知識》)