999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

如何理解“所有的模型都是錯誤的”?

2020-06-04 04:23:34
上海保險 2020年5期
關鍵詞:模型

袁 曦

一、背景與問題

《精算通訊》邀我談談“計量”在風險決策中的作用,我的心情是蠻復雜的。從哲學角度的方法論說,量化是觀察世界的重要手段之一,而我們選擇用于認識世界的這種方法,正面臨著各種錯誤的解讀,其中之一便是“所有的模型都是錯誤的(All models are wrong)”。

比如在《風險與好的決策》這本書中,列舉了很多讓“計量經濟學者崩潰的事實”,然而作者也仍然認同好的決策需要運用統計學思維、經驗法則和風險行為心理學。

筆者的觀點是:量化和模型是對復雜現象的簡化處理和描述,是人們在工業化社會中賴以工作的基礎。但也正因為是一種對復雜事物的簡化,必然會有考慮不足的地方,由此造成一種稱為“假性精確”(pseudo accuracy)的現象,也確實可能損害、違背初衷。因此,應用者需要對模型有通透的理解,只有了解模型的起因、結果以及局限性,才能透過現象看到本質,從而作出合理決策。

二、因果與統計

在我們面對的紛繁世界中,每一個結果都是由多個因素合成的,并隨時間的變化而變化。身處大數據時代,我們透過數據分析事實的能力是否加強了?

這個問題還待商榷。在美劇《量子疑云》中,宇宙在無限擴展的時候,每一個事實發展都會包括該事件的所有可能,并將每一個可能無限延續,就像一棵無限生長的樹,在每個樹杈分出多個分支并繼續下去。我們所看到的因與果,是否有直接的聯系,或是其直接影響已經在互相作用中彌散,這是需要仔細考究的。

在社交網絡時代,簡單的、吸引眼球的、有時候驚世駭俗的結論往往得到更廣泛的傳播,分析能力反而退步了,雜音更多了??觳臀幕?、武斷結論、先入立場,都阻擋了我們追求真相的腳步。自媒體拉平了交流的平臺,但是投入資源的、全面調查的、覆蓋統計各個角度的結論反而被湮沒了。不知道是幸還是不幸。

在統計學家的世界里,現象是各種統計結果匯總的結果,沒有一個因素能起決定性的作用,除非顯著(significant)到一定程度。不能因為幾個單獨的事件得出一個普遍結論,即使在某個階段非常緊跟潮流、媒體大量傳播的事也一樣。馬云曾經說過,每個國家都有1%的混蛋,如果我們糾結于這1%的混蛋而忘記99%的善良,這將是人類的災難。馬云顯然是一個有統計思維的大咖。對于平常人來說,因為那1%說話聲音更響,說的次數更多,很可能看不見那99%。這就是為什么統計思維很重要。

三、導致模型錯誤的內因

回到“所有的模型都是錯誤的”這個命題,如果將其看作“果”,我們探討“因”,為什么所有的模型都是錯誤的呢?

典型模型錯誤的原因,有的來自模型的內部,有的來自模型的外部。內部原因能歸結為三類:

(一)模型樣本不周全,所謂幸存者偏差(Survivorship bias bias)

如果從一個房間里連續出來五個人都是穿紅衣服的,我們是否可以認定這房間里的人都穿紅衣服?假設事實是房間里有60個人均勻分布在紅黃藍三種顏色衣服上面,以上現象發生的概率大概為0.3%。大數據工具的增加并不等于有效數據觀測點的增加,就好像用大炮打蚊子。在未來數據科學中除了發現更有效和有力的處理工具,如何去偽存真、如何摒棄雜音同樣重要。精算師致力于研究各種算法的利與弊,從手寫到繩結、到表格、到計算機,再到現在更先進的工具,核心是找到數據后面的實際因果。

(二)模型未能囊括所有可能的狀況

帝國理工大學新冠肺炎預測模型最大的問題在于,它假設不管傳播的快慢,感染病毒的人數總量是不變的并且不可重復。打破次元壁,需要大量的假設和想象力,沒有在模型中的變量可造成根基性的錯誤(model error)。我們對冠狀病毒的很多醫學特性不清楚,是否免疫了就不再復陽,免疫能夠持續多久等。

(三)使用模型的立場是錯誤的

比如傳播甚廣的“搞垮華爾街”的模型,以李祥林教授應用高斯連接(Gaussian copula)作為尾部風險量化工具:李教授的模型因為專攻尾部相關性希望能更好地考慮到極端事件的影響,雖然沒有使用更加保守的Weibull copula,但是也強勝一般的VaR。然而,為了授信次貸產品并通過公司的風險審核,借用李教授公式固化部分風險并予以推廣,用看上去非常復雜的模型掩蓋了實際的風險事實,可以看到,搞垮華爾街的是貪婪,以及對模型背后事實的忽視。因此,在精算師的職業操守里面,“正直(integrity)”是放在最前面的,這才是模型的最終基礎。

四、導致模型錯誤的外因

外部原因,主要來自使用者對模型的誤讀和誤用。

最常見的誤讀是媒體的斷章取義、搏眼球、蹭熱點、語不驚人死不休,實際并沒有從頭到尾閱讀嚴謹的論文,導致失之毫厘,謬之千里。

舉例而言,前段時間牛津大學有學者采用模型來預測新冠病毒感染規律,其中提到68%的人已經“暴露在(exposed)”病毒之下(原文是“It also estimated that,as of last week,68%of the population had been exposed to the virus”),而媒體的解讀是“超過一半的人感染了新冠病毒”。

“暴露”是指可能發生的病毒接觸。同時,該數據只是在有疫苗和無疫苗的情景測試中的一個結果,還有其他影響情景存在,比如最好的情景是只有小部分嚴重患者,媒體則沒有提及。

誤用,則是在不適合的場合使用模型(mis-use the model)。

模型往往是對現實世界的簡化,每個模型都有其應用目的,為了達到目的,統計學家會在模型中對與結論不重要的部分進行簡化,并集中力量探討需要論述的問題。因此,脫離模型原有應用目的的使用可能會導致災難。比如精算師用于評估準備金充足性的模型,就不能用作公司的整體估值。所以,精算師要注意保護自己的報告使用的語境。

五、結語

模型及量化,是探尋真理的重要工具之一,但不是全部。

能否用好模型及量化工具,首先需要對這套工具有正確的理解,需要將“管理大局觀”與對一個具體事實的追尋統一起來,既能對大趨勢作出判斷,又能將其與其他因素進行妥協。

就算“模型是錯誤”的,但我們每跑一次模型,都是一次糾偏,離真理更近一步。

希望在這個變化多端的世界里,更多人能夠更好地使用量化作為工具之一來探尋真理,尤其在其他工具缺失的情況之下。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 亚洲第一天堂无码专区| 欧美中文字幕无线码视频| 日韩成人免费网站| 99精品在线视频观看| 91免费国产高清观看| av天堂最新版在线| 亚洲精品无码抽插日韩| 青青青国产视频手机| 国产成熟女人性满足视频| 国产日韩久久久久无码精品| 亚洲欧美日韩动漫| 日韩国产亚洲一区二区在线观看| 狠狠做深爱婷婷久久一区| 精品国产成人三级在线观看| a毛片在线播放| 亚洲aⅴ天堂| 欧美一区二区人人喊爽| 亚洲综合久久成人AV| 色首页AV在线| 2021国产乱人伦在线播放| 亚洲久悠悠色悠在线播放| 精品久久777| 国产一区二区网站| 亚洲αv毛片| 亚洲另类国产欧美一区二区| 美女扒开下面流白浆在线试听| 国产成人综合在线观看| 亚洲成人高清无码| 国产免费观看av大片的网站| 亚洲成人网在线播放| 99视频有精品视频免费观看| 波多野结衣无码AV在线| 国产欧美日韩专区发布| 国产精品综合久久久| 国内精自线i品一区202| 国产无码精品在线| m男亚洲一区中文字幕| 亚洲视频在线网| 无码国产伊人| 狠狠五月天中文字幕| 国产网站一区二区三区| 色综合a怡红院怡红院首页| 无码内射中文字幕岛国片| 国产麻豆91网在线看| 亚洲欧洲自拍拍偷午夜色无码| 中文字幕亚洲精品2页| 亚洲精品视频免费看| 欧美亚洲激情| 欧美日韩国产精品综合 | 国产熟女一级毛片| 亚洲男人的天堂久久精品| 久久久久久午夜精品| 亚洲黄色成人| 五月天综合网亚洲综合天堂网| 久久国产V一级毛多内射| 国产一区二区三区在线观看免费| 亚洲成人77777| 青草娱乐极品免费视频| 国内毛片视频| 欧美日韩成人| 国内视频精品| 国产第三区| 农村乱人伦一区二区| 直接黄91麻豆网站| 青青国产视频| 欧美啪啪一区| 亚洲欧洲日本在线| 久久99精品国产麻豆宅宅| 精品国产污污免费网站| 亚洲色图欧美| 亚洲中文在线看视频一区| 18禁黄无遮挡免费动漫网站 | 精品视频91| 国产精品太粉嫩高中在线观看 | 在线观看精品国产入口| 日本在线视频免费| 一级毛片无毒不卡直接观看| 欧美在线导航| 日韩精品欧美国产在线| 一级做a爰片久久毛片毛片| 国产小视频a在线观看| 成人91在线|