“預測行業”的聲譽并不太好,那些名氣很大的專家和分析師,看上去很高的預測正確成果,也多是數據剪裁加工的結果。盡管如此,人們還是不敢忽視天氣預報機構、地震臺等機構發布的警示信息,就算這種警示信息落空了若干次,但人們仍然承擔不起因為忽略某一次“偶然”說對的警示信息而帶來的沉重代價。
這就提出了兩個問題,為什么不管是專家,還是作為普通人的我們,都會出現大量的預測錯誤?該怎么提高預測的準確性?美國統計學家納特·西爾弗所著的《信號與噪聲》一書,就對以上問題做出了解答。
美國2007~2009年金融危機不僅讓華爾街多家頂級投行陷入向美國政府伸手要援助的窘境,更讓評級機構陷入尷尬。以標準普爾為代表的評級機構在美國房地產泡沫、有毒債券泡沫破滅之前乃至破滅過程中,仍在發表帶有極強誤導性的預測結論。這些評級公司忽略了泡沫現象,嚴重低估了顯示高風險的信息。納特·西爾弗指出,評級公司孤立判定許多項目內的風險,并在預估總體風險時將各項風險的概率相乘,這樣就得出可以被忽略不計的極小數據;問題是,以次級債為例,涉及到的各個環節在風險上是相互連接的,即一個風險的爆發會觸發其他的、系統性的風險,計算總體風險應該以最高風險值的項目為錨定。并且,風險概率的存在,并不意味著風險事件將嚴格按照特定周期的時長出現,比如某金融機構出現壞賬的概率為5%,這不能被理解為在頭一次壞賬出現后的第20年才會曝出第2次壞賬問題。歸結起來,預測常常流于錯誤,第一個原因就是我們對風險、概率等基本問題的不正確理解。
國際政治學者常常通過大眾媒體和自媒體,發表對歐美國家政治選舉的預測結論。一些學者的預測結論頻頻出錯,并不是因為對影響政治選舉結果的各項因素、風險、概率的理解出了問題,而是受到意識形態影響,在收集各方面信息得出預判之前在自己的大腦里就形成了先入為主的判斷,認為自己的判斷是“應當正確”的判斷,拒絕接受與之相反的信息。納特·西爾弗將這種學者稱之為“刺猬型專家”,分析指出他們雖然善于從噪聲中辨識和捕捉信號,卻遺漏和忽略了其他信號,預測正確率也因此降到了“路人”隨機選擇的勝率之下。先入為主、固執己見,就成為導致預測出錯的第2項原因。
納特·西爾弗建議人們要注意吸取“刺猬型專家”的教訓,學會“狐貍型”的預測方法,用概率的方法思考問題、重視外部信息包括那些顯示己方預判存在錯誤的信息,承認自己在做出判斷時面臨的局限性。
判斷一個年輕運動員的成長潛力,球探的主觀經驗更值得信賴,還是基于計算機平臺的數據分析系統更靠譜?計算機數據分析的優勢在于,可以不帶偏見的根據運動員過去和現在的訓練、比賽準確數據,參照其他運動員的數據資料和成長軌跡做出判斷,會幫助足球、籃球等職業體育項目的俱樂部從看似同等水準表現的運動員中,選出相對較好的一批;但要讓這個優勢得以發揮,前提在于數據系統對數據收集要做到準確、權重設置要趨于科學。并且,計算機往往不能準確反映出年輕運動員的比賽投入、壓力管理、協作意識等情況,而這些恰恰是資深球探所擅長的,后者往往還能以直覺從一群有潛力的新苗中挖掘出真正意義上的競技天才。只重視那些實際上代表性存疑的數據,或者只依賴感性經驗而得出預測,可歸為預測出錯的第3項原因。
具有諷刺意味的是,按照納特·西爾弗的分析,導致預測出錯的第4項原因,是預測者屈從于商業利益或社會觀念壓力而對預測結果所作的“技術性處理”。如果一項天氣預報結論顯示下雨,實際上并沒有下雨,民眾頂多嘲諷預報機構“又錯了”,但反過來,如果預報天晴卻下了大雨,預報機構就會面臨更大壓力甚至訴訟。這直接推高了天氣預報中的災害天氣比重。金融機構往往也基于同樣的考慮,“報喜不報憂”,免得因悲觀預報信息而流失客戶。
預測的準確性有賴于預測者對不確定性的認識,預測者越能認識到自己的局限,對不確定性的影響越抱以敬畏,做出的預測就能相對更準確;反之,那些僅僅根據一套精妙的數據模型,或者在“大數據”系統的幫助下掌握更多信息而顯得自信滿滿,對不確定性不屑一顧的人,就會非常明顯的產生偏離乃至錯誤。