他在2008年美國大選中曾準確預測了49個州的選舉結果,而2012年的美國大選,他則準確預測了全部50個州的選舉結果。34歲的內特·希爾沃憑著自己的數(shù)學模型打敗了所有時政記者、政黨媒體顧問和政治評論員。美國公眾沸騰了,媒體稱他為超級極客、“算法之神”,并認為其成功讓所有書果子揚眉吐氣。
準確預測美大選結果
內特·希爾沃可以說是超級政治明星,他知道自己在說什么。在美國人看來,權威專家一直是擁有合適的發(fā)型、潔白的牙齒或者符合保守派觀點的人。希爾沃完全不符合這些條件,他有的只是數(shù)據,許許多多的數(shù)據,而美國總統(tǒng)大選之夜證實了這些數(shù)據的準確性。
投票前,許多評論家都認為無法預計哪方會獲勝。他們預計本次選舉兩名候選人的得票率將不相上下。但事實并非如此。結果證明奧巴馬和羅姆尼完全不是旗鼓相當,正如希爾沃幾個月來的預測。在大選日當天,他預測奧巴馬將有90.9%的可能獲得大半選舉人票,如果按州計算,他準確預測了所有州的選舉結果。
“你們知道誰是今晚(選舉開票夜)的贏家嗎?”美國微軟全國廣播公司節(jié)目新聞主播自問自答,“是內特·希爾沃。”
“算法之神”受到狂熱追捧
推特瞬間沸騰了,各大博客網站也為希爾沃沸騰了。希爾沃的處女作《信號和噪音:預測學的藝術與科學》的銷量一夜間增長800%,排到了暢銷榜第二位。媒體一致認為本次大選預測的成功并不只是希爾沃個人的勝利,它還使所有書呆子都揚眉吐氣。希爾沃憑他的數(shù)學模型打敗了所有時政記者、政黨媒體顧問和政治評論員。
希爾沃一點也不像電視新星,也不像《華盛頓郵報》所說的言論界新寵,現(xiàn)年34歲的他反倒更像美劇《超人前傳》中克拉克肯特變身前的形象。他謙遜而不招搖,當他低著頭拖著步子走進屋里,他似乎對自己被采訪而感到尷尬。
“整個事情變得有點瘋狂,”他說,但他并不認為這種狂熱與他有關,“我仿佛具有這種象征性力量,然而人們對我所做事情的推崇遠超了我所應得的。我必須首先說明大家應該知道兼聽則明,而不是把某個人的意見當成神諭。”
然而,這忠告似乎來得有點晚了。大選后的第二天當他出現(xiàn)在《每日秀》脫口秀節(jié)目時,節(jié)目主持人喬恩斯圖爾特稱他為“算法之神”。
選舉前的數(shù)周,他的批評者們(大多數(shù)是不滿他預測奧巴馬將獲勝的保守派們)不僅攻擊了他的預測方法,還對他進行了人身攻擊。迪安錢伯斯召集人們抵制希爾沃的“巫術數(shù)據”,宣稱他神志不清,并嘲諷他是個矮小瘦弱的娘娘腔。
不過從某些角度來說,人們的奉承似乎更難以應付。“奉承的話讓我感到緊張,因為我確定我們將會出錯。”這里的“我們”指的是他在2007年設立的提供以數(shù)據為主的時政分析的博客“FiveThirtyEight”(因538張選舉人票總數(shù)得名)。2010年,他把博客轉移到了《紐約時報》的網站上。
希爾沃那界面簡陋的博客在大選前為《紐約時報》網站帶來了20%的瀏覽量。如果說希爾沃不是“大數(shù)據”超人,那么他肯定是超級極客,也是極客界的偶像級人物。
用數(shù)學模型分析棒球
希爾沃一直是數(shù)據的愛好者。“我一直都被人稱作書呆子。”他出生于在密歇根州,家鄉(xiāng)的棒球隊底特律猛虎在他6歲的時候贏得了美國職業(yè)棒球全國錦標賽的冠軍,而他也是在那個時候接觸了各種統(tǒng)計數(shù)據并愛上了數(shù)據。
從芝加哥大學獲得經濟學學位后,他在專門提供審計、稅務和咨詢等服務的畢馬威公司當了4年顧問,接著,他開始迷上了網絡撲克。那時候許多玩網絡撲克的人對撲克并沒有很多了解,而他卻能從他們手中贏錢,這些錢足夠讓他辭掉工作靠玩撲克養(yǎng)活自己。
撲克就像希爾沃生命中的天然磁石,不僅教會了他抓住機遇,還使他明白機遇在人生中扮演怎樣的角色。“玩撲克對我而言是最好的訓練,我從中學會了怎樣衡量新信息的作用,怎樣辨別信息的重要性。我們的直覺在分析信息方面并不是十分在行,我們總是傾向于高估新信息的重要性。”
希爾沃說:“技巧和運氣間存在著微妙而又模糊的關聯(lián)。贏錢的時候是因為牌技好還是運氣好,你永遠也不知道。”希爾沃估算他自己當時從網絡賭博中贏了有大概40萬美元,這些錢足夠他去追求他另一項愛好棒球。棒球這項體育運動正在不斷的改變中,而希爾沃是最早發(fā)現(xiàn)這項運動有數(shù)據導向潛在可能性的少數(shù)人之一。他后來建立了Peeota網站,該網站建模分析預測美國職業(yè)棒球大聯(lián)盟運動員的職業(yè)前景,后來他又把該網站賣給了《棒球簡介》。
棒球預測就像一場保守的情報員與善于分析數(shù)據的新成員之間的斗爭,這場斗爭后來被邁克爾·路易斯在暢銷書《點球成金》中記錄了下來,后來布拉德坡特主演了同名電影。2007年,希爾沃開始尋找新的契機。
擔心會在未來影響選情
“我當時在尋找像棒球分析那樣的,有龐大的數(shù)據庫而且鮮有競爭者的新領域,就在那個時候我找到了政治這個領域。”起初,他使用筆名“Poblmo”。幾個月后,他開始使用真名。
希爾沃覺得自己當時將已有的數(shù)據套用貝葉斯理論,如此一來他將“小有優(yōu)勢”。美國政治領域原本就充斥著許多數(shù)據,而他所使用的貝葉斯理論也不是什么尖端科技。英國神父貝葉斯于18世紀初發(fā)現(xiàn)了計算有條件的事件發(fā)生可能性的貝葉斯理論。
在美國政治評論圈里,希爾沃的選情分析是前所未有地準確。希爾沃不會見說客、黨派媒體顧問、競選經理及新聞發(fā)言人之類的人。簡而言之,他不是“體制內”的人。美英兩國的政治報道就像一個類似壟斷集團的體制。在英國,政治圈里彌漫的這種狼狽為奸的氛圍是在議員報銷丑聞后才受到質疑,而這丑聞則是政治圈外的記者最早曝光的。在美國,希爾沃將政治形容成“交易”。
“如果你表現(xiàn)良好,偶爾會得到獨家消息,但這不過是許多既得利益間的游戲。我盡量回避和兩邊的競選團隊打交道,因為他們所給的信息大都是干擾性的噪音。”有意思的是,競選團隊(尤其是奧巴馬的團隊)本身也清楚數(shù)據的重要性。據奧巴馬團隊的競選經理吉姆梅西納稱,他們請了一位“首席專家”,目的是“量化一切”。數(shù)據告知他們應當關注哪些選民及如何吸引他們。由此看來,希爾沃的技能對競選活動至關重要。
希爾沃認為“書呆子”才是他的“秘密武器”。“我總覺得自己是個局外人。我身邊總有朋友,可是我總是有跟他們不一樣的觀點。我覺得這點很重要。”希爾沃漸漸開始擔心:他的能力是否意味著將來他不僅能預測選舉結果,還將影響選情。此外,他還擔心失去旁觀者的優(yōu)勢。“我獲得各種機遇,不過我不希望自己墮落或者淹沒在體制內。”
希爾沃正在尋找下一個目標——個擁有許多數(shù)據卻沒有太多競爭對手的領域。他認為經濟新聞是一個不錯的選擇,而地方政府選舉則是“難以預測”。幾年前他曾經對紐約的社區(qū)進行過分析,“你可以通過自己所關注的因素(例如綠化空間和好學校)結合從市長辦公室獲得的數(shù)據,得到個性化的居住社區(qū)選擇分析。”
希爾沃在成功預測了2008年美國大選結果(準確預測了50個州中49個州的選舉結果)后簽下了一份價值70萬美元的出版合約,他在書的序言里坦言,與出版社簽約的原因是希望他能寫出一本“書呆子的勝利”之類的書。但當時沒有人能料到他會有多大的成就。