郭振華 上海對外經貿大學金融學院
本文受國家自然科學基金面上項目(71173144)的資助。
在行為保險學系列(三)(四)的《風險判斷偏差與非理性保險決策》中筆者已經提出,保險消費者的風險判斷主要依賴感性的直覺思維和經驗判斷,而不是像經典經濟學理論所預期的那樣主要依賴理性的基于統計數據的風險評估。而且,保險消費者主要依賴“可得性啟發式”進行風險判斷,進而以可得性啟發式為基礎或公理,推導出個體對小概率保險風險的風險判斷規律為“多數人低估、少數人高估”,進而得到“多數人低估保險價值、少數人高估保險價值”的結論,這對解釋保險需求疲弱有重大的理論意義。
保險消費者的風險判斷主要依賴感性的直覺思維和經驗判斷,判斷結果是主觀的,可以稱為“主觀風險”。行為保險學系列(三)(四)中關于“風險判斷偏差與非理性保險決策”直接使用了主觀風險的研究成果“系統1和系統2”和“可得性啟發式”來闡述保險消費者風險判斷的主觀性。文章發表后,不少讀者就“主觀風險”這一議題提出各種問題,希望有更深的討論。
為此,本文對主觀風險的相關研究進行梳理和綜述,著力于厘清這些理論是否以及如何適用于保險風險的主觀判斷,并將保險風險判斷的相關研究進行了梳理和評述,以便我們對主觀風險以及主觀風險對保險需求的影響有更深刻的理解。梳理與主觀風險相關的研究后,筆者發現,根據時間先后,主觀風險研究有三個階段,采用了不同的研究方法,研究越來越深入,得到了愈來愈符合實際的結論,分別是:風險感知研究、風險判斷的啟發式原則研究和經驗風險判斷研究。
本文首先對主觀風險和客觀風險的區別及其對消費者保險決策的影響進行分析,然后分別綜述主觀風險研究三步曲的主要研究成果:風險感知研究綜述、風險判斷的心理機制研究綜述和經驗風險判斷研究綜述。在風險判斷的心理機制研究綜述和經驗風險判斷研究綜述之前,我插入了兩部分內容,討論了主觀風險研究中與保險風險判斷相關的兩項著名研究成果,然后說明這兩項成果的結論對保險風險判斷其實都是“煙霧彈”,需要撥開云霧見月明,事實上,最后的經驗風險判斷研究結論才是現實中小概率風險判斷的真相。
我們以一個案例來說明客觀風險與主觀風險的區別。假定張三有價值10萬元的汽車一部,汽車有被盜風險,假定1年內有1‰的機會被盜,導致10萬元的損失;有999‰的機會不會被盜,沒有損失。
所謂客觀風險,實際是指統計風險,即用不確定變量(如盈利或損失)的概率分布、期望值、標準差等來描述風險。以上述汽車被盜風險為例,不確定變量為盜竊損失,我們可以計算得到期望損失為100元,標準差為3164元,借此來描述張三面臨的汽車被盜風險的大小。而且,保險公司主要依賴客觀風險進行保險定價,例如,如果張三投保汽車盜竊險,保險公司收取的價格=純保費+附加保費=期望損失+附加保費=100元+附加保費。附加保費高低取決于消費者的風險厭惡程度、保險公司之間的競爭程度等因素。
所謂主觀風險,是指除用統計分析方法評估風險外,判斷和決策心理學認為,人們還會使用直覺來判斷風險大小,即,人們會根據自己的直覺、近期經驗或經歷、鮮活的記憶或者受到某則新聞的刺激,采用認知心理學中提出的一些“啟發式原則”來做出風險判斷。而且,個體的主觀風險往往與客觀風險(或統計風險)存在明顯差異。
顯然,消費者會用自己的主觀風險而非客觀風險來評判保險產品的價值,消費者對保險產品的價值有自己的主觀看法,高估風險會導致其高估期望損失或純保費,進而高估保險價值,導致較高的保險購買意愿;低估風險則會導致其低估期望損失或純保費,進而低估保險價值,導致其不愿意買保險。
人們為何會采取直覺判斷方式來評估風險呢?認知心理學認為,人們每天都需要做出大量決策,面臨非常大量的信息,但時間有限,認知和計算能力有限。于是,當面對不確定情形和復雜決策時,人們傾向于依賴心理捷徑(mental shortcuts)來簡化決策過程,進而降低其認知需求(cognitive demands)和 心 理 壓 力(psychological stress)。簡而言之,就是為了降低決策成本,讓自己能夠即時處理大量的決策問題,而不是在每個決策問題上糾纏不清。
當然,并非每個人對每個問題都采用直覺判斷方式進行決策,風險感知相關研究認為,專家在自己的專業問題上更加依靠深思熟慮模式,而非專家或普通大眾則可能更加依賴經驗模式。例如,對疾病風險,醫生更加依賴統計分析,而普通大眾則更加依賴直覺判斷;對保險承保的風險,精算師更加依賴統計分析,普通大眾更加依賴直覺判斷。
如前所述,主觀風險研究三步曲分別是風險感知研究、風險判斷的心理機制研究和經驗風險判斷研究,這里討論風險感知研究。
風險感知研究的代表性人物是Slovic教授,從1959年念心理學專業研究生一年級開始,Slovic一直在研究人們在賭博中的偏好和行為選擇,這是大學教授最容易研究的典型不確定性決策問題。
1970年,Slovic被引薦給White教授,那時,White教授觀察到了人們在面對自然災害時的奇異行為,如即便政府給大量保費補貼,大量災區家庭也不會主動購買洪水保險。因此,White想了解Slovic對賭博的研究成果可否用來理解或解釋人們應對自然災害的行為。結果,這件事使Slovic非常尷尬,因為他發現用自己在簡單賭博行為選擇方面的研究成果,根本無法解釋洪泛區平原或地震斷層地區居民們的風險決策行為。但是,White提出的問題激發了Slovic的興趣,從此,Slovic和Howard一起將研究重點轉向了自然災害(Howard也被同時引薦給了White),試圖將“人們在面對自然災害時的行為”與“概率判斷和風險選擇的心理學”結合起來。1974年,Slovic、Howard和White發表《決策過程、理性以及自然災害管理》,認為:1)若對心理因素、經濟因素和環境因素三者之間的相互作用了解得不夠深入,則試圖管理自然災害的各種政策都將徒勞無功;2)現在的災害管理計劃都假定人們是理性的,但人們是有限理性的,提高對公眾決策過程的認識刻不容緩,也是系統改進公共政策的核心環節;3)人們的有限理性包括有限的備選方案、對風險的錯誤認識(如不懂隨機性,認為洪災有周期性等)、在信息處理時存在局限性(如概率判斷的小數法則)、對不確定性的否認、經歷危險后才會去管理等;4)克服人們的偏見,是有效管理自然災害的前提。有趣的是,從此之后,Howard教授一直致力于自然災害風險與保險問題的研究,至今已超過了45年,發表了大量相關研究成果,而Slovic則很快將研究興趣轉向了技術風險的風險感知。
1970年代中期,人們對殺蟲劑和核能潛在危險的關注與日劇增,于是,Slovic將研究重點從自然災害轉移到了技術風險上,極大地擴展了自己的風險研究領域。所謂技術風險,是指新技術如特效藥、化學肥料、殺蟲劑、核能等提高了產量、健康和能源利用效率,但也帶來技術風險如副作用、環境污染等,甚至可能引發大規模死亡,這使人類面臨兩難境地,新技術帶來收益,但也帶來風險,控制風險將會降低收益,政策制定者被迫進行收益與風險的權衡。但政府面臨一個重大問題是,普通公眾對技術風險的認知是主觀的,與專家的看法迥異,這使政策制定異常棘手。Starr(1969)在《Science》上發表“Social Benefits Versus Technological Risk”,被認為是系統研究風險感知的開始,在這篇經典文章中,Starr提出了經典問題“How safe is safe enough”。正是受到了上述現實重大問題和Starr研究成果的影響,Slovic將研究重點放在了人們對技術風險和收益的主觀感知上,他認為,人們對技術風險和收益的主觀感知將會對政府制定相關政策形成巨大影響。
Slovic研究團隊首先梳理了相關文獻,形成了一些看法或推斷:1)人類一直沒有機會進化形成一種能夠概念化處理不確定性的能力。人類本質上是試錯法的初學者,常常忽視不確定性的存在。我們的行動主要還是依賴于習慣或簡單的決策準則。2)有些風險壓根無法評估,如發膠、除臭劑會破壞臭氧層,但是在使用多年后才知道的,石棉危機也是一例(保險從業者通常知道美國保險業曾經歷與石棉沉著病有關的責任險危機)。3)社會上有些奇異現象得不到很好的解釋,如:①人們寧愿多花錢去解救一個已知的陷入危險的生命,而不愿去拯救統計意義上待解救的生命;②如果反復經歷某種災害卻平安無事,會造成對災害的風險低估;③公眾能夠容忍某些災害(如X光輻射),但卻不能容忍另一些災害(核反應堆);④由于一些災害的后果是延遲的(如吸煙),人們對這類災害通常估計不足;⑤感知到的風險大小很大程度上取決于相關信息的呈遞方式,如“在核電站四周,人們的平均預期壽命會下降”就比“在核電站四周,死于癌癥的人數每年都在不斷增加”聽起來風險要小一些。由此,Slovic研究團隊提出:“與那些基于復雜分析方法所做出的決策相比,人們是否更青睞于建立在膚淺原理之上的決策呢?”進而認定有必要對風險感知進行嚴格的心理學研究。
接著,Slovic專注于風險感知研究,一干就是幾十年。研究開始時,Slovic想采取相對客觀的研究方法,但在數據收集上困難重重,于是,Slovic走了新路,采取了一種當時全新的風險研究范式——“心理測量學范式”。所謂“心理測量學范式”,就是用問卷直接詢問人們對風險和收益的感知,以及人們對“風險—收益”進行的權衡,這是一種“表達偏好”而非“顯示偏好”,評估的是人們的情感感受和認知,而非評估人們的實際行為。這一方法假設風險是由人們主觀定義的,人們對風險的主觀看法可能受到廣泛的心理、社會、制度和文化因素的影響,而且人們能夠對那些難以回答的風險感知問題給出有意義的答案。該方法先使用大量心理測量量表,得到一些有關感知到的風險、感知到的收益和其他感知(如對某一活動死亡人數的估計)的定量化數據,然后使用統計工具分析影響最終結果的各種因素。
1987年,在系列研究成果基礎上,Slovic在《Science》上發表“Perception of Risk”,對前期風險感知代表性研究成果進行了綜述。該文認為,技術專家會采取復雜的評估技術對風險進行評估,但普通公眾則會采用直覺判斷方式對風險進行感知,專家與公眾在風險問題上的矛盾可能是因為雙方對風險的評估方法不同導致的。
研究表明,公眾感知到的風險大小與眾多因素有關,但這些因素可以合并為兩個風險因子:①可怕程度,代表10個風險因素,包括風險的可控性、人們對風險是已經接受還是擔驚受怕、全球災難性、結果致命性、承擔風險與獲得收益的公平性、個體受損還是群體受損、對后代的風險性、是否容易降低、風險是否逐漸增大,以及自愿承擔還是非自愿承擔;②熟悉程度,代表5個風險因素,包括風險是否可觀察、處于風險中的人是否知曉、風險后果是延遲的還是立刻的、新的還是舊的風險,以及科學界對該風險的把握程度。如圖1所示。
圖1中的公眾風險感知模式來源于約3萬名被調查者的綜合調查分析結果,普通公眾的風險感知規律是,可怕程度(后果嚴重程度、令人擔驚受怕程度、不可控程度、非自愿承擔程度)越高,或/和未知程度(新的風險、無法觀察的、科學上未知的風險、效果延遲的)越高,感知風險越大。即,在圖1的心理測量學因子空間中,越是靠近右上角位置的風險,人們的主觀風險就越大。例如,公眾之所以認為核能風險巨大,主要是因為其“可怕程度”極高,人們感覺其缺乏控制、令人恐懼、具有毀滅性潛能、后果極其致命、可能影響子孫后代等;再比如,公眾之所以認為某些新型化學產品技術風險很高,是因為其可能內含有毒或致癌物質,而其毒害風險往往屬于新的風險、未知的風險、危害后果隱蔽且具有很大的延遲性。
進一步的研究結論包括:①公眾感知到的風險越大,要求降低風險的人越多,要求降低的程度也越大。②由于公眾風險感知與專家評估結果有著很大的差別,這導致了專家與公眾在風險管理政策上的矛盾或沖突。例如,盡管核能專家們一再重申核能的安全性,核能還是會引起公眾的強烈抵制,人們往往認為核能風險高得不可接受,在圖1的心理測量學因子空間中處于最極端的右上角位置。
此外,后續還有大量風險感知研究成果,主要研究結論包括:①與感知風險關聯最強的因素是這一危險在多大程度上激發了人們的恐懼。②感知收益與感知風險負相關,即隨著某項技術感知收益的增加,感知風險會降低。如果人們喜歡某項活動,就會傾向于認為其收益較高而風險較低,反之則會認為低收益高風險。③情感對風險感知有重大影響,例如,當風險是非自愿承擔時,當風險自己無法控制時,當風險與收益不對稱時,當損害后果致命時,往往會誘發人們的情感關注,進而推高了其主觀風險感知。④男人比女人更少關注風險,感知風險較小,原因可能是男性本身就是風險方面的技術專家或參與了相關工作,能從技術方面理解風險,而女性很少參與相關技術工作。
風險感知研究成果給我們帶來三點啟示:第一,如果普通大眾存在較大的風險感知偏差,主觀風險與客觀風險存在較大的差異,必然帶來自身的風險管理偏誤,要么管理過度,要么缺少管理。比如,低估風險會導致消費者該買保險時不買保險,高估風險則導致消費者購買過多的保險或者付出過高的保費。第二,政府往往希望通過某些政策抑制人們的風險行為(如控煙、自然災害管理等),但由于政府政策的成本和收益基本都是按照客觀風險計算的,而不是按照人們的主觀風險或風險感知來設計的,這很可能會導致政策失效。如,在美國,即便政府補貼大量保費,洪泛區居民還是不愿購買保險,導致政府無法通過保費補貼政策解決洪水的損害補償問題。第三,只相信理性主義、只強調客觀風險的專家或標準教材主義者無法理解現實中人們的風險管理決策。如,在我國,即便政府補貼80%以上的保費,不少養豬戶仍不愿購買生豬保險,這讓政府官員和部分專家大惑不解。

?圖1 公眾風險感知規律
如前所述,主觀風險研究三步曲分別是風險感知研究、風險判斷的心理機制研究和經驗風險判斷研究,這里討論風險判斷的心理機制研究。
風險感知研究采用心理學量表,直接問被試者對各種風險在各種維度上的心理感受,進而得到普通公眾風險感知存在偏差的結論,但并沒有討論為什么人們會有風險感知偏差,風險感知偏差的心理機制是什么?
在西蒙對有限理性和推理啟發式進行研究、布魯納(Bruner)開展思維策略研究過程中,兩位學者都在關注能降低判斷任務復雜性的簡化策略,這些策略有助于人們用現有的心智能力駕馭各種復雜判斷任務。受上述研究的激發,不少認知心理學研究者開始關注人們在判斷中的心理內在過程或心理機制。
1974年,Tversky和Kahneman在《Science》上發表“Judgment under Uncertainty:Heuristics and Biases”,首次系統總結了人們在估計不確定事件的概率或不確定量的數值時,會采用三種啟發式原則進行簡化判斷,分別是代表性啟發式(Representativeness Heuristic)、可得性啟發式(Availability Heuristic)和錨定與調整啟發式(Anchoring and Adjustments Heuristic),認為這些原則對人們估計不確定事件非常有用,但也會帶來各種偏差。
在不確定狀況下的判斷的研究中,主要研究范式是,學者們普遍將被試者的判斷結果和規范模型的結果進行比較,進而檢驗是否存在判斷偏差以及偏差大小。
下面分別討論三種啟發式原則的含義和案例,并討論是否適用于保險風險判斷。因為不確定條件下的判斷范圍很大,至少包括兩種情形:第一種情形是,某個事件其實是確定的,只是判斷者不知情,于是對判斷者而言屬于未知,有不確定性。例如,請被試者根據一些描述判斷某位大學生的所學專業,或請被試者估計一條麻袋中白色球和黑色球的比例等。第二種情形是,某個事件在未來可能發生也可能不發生,請判斷者判斷其未來發生概率或頻率,例如,請某人判斷其汽車在未來一年內的被盜概率,或者更復雜些,請判斷者估計未來結果的概率分布。顯然這是兩種完全不同的不確定性,第一種情形下,某個事件只是對判斷者是未知的,但有人完全清楚這一確定的數值,而且屬于對當下某事件的判斷。第二種情形下,某個事件對判斷者是未知的,但有人可以根據歷史數據推斷其發生概率、頻率或概率分布,屬于對未來的判斷。我們所關心的風險或保險風險屬于第二種情形。
所謂代表性啟發式,是指人們會基于相似性進行判斷。適用的典型判斷問題是:A屬于類別B的概率是多少?但其實A是否屬于B是確定的,只是判斷者不知情,從而有了不確定性。
例如,一項研究中提出如下問題請被試者回答:“佩內洛珀是一個大學生,朋友們形容她稍微有些不切實際、情緒化和敏感。她游遍了整個歐洲,能說一口流利的法語和意大利語。她目前還不確定畢業后的職業方向,但是已經證明過自己高水平的才能,并且多次獲得書法比賽的獎項。她在男朋友過生日時寫了一首十四行詩作為禮物。根據以上描述,你認為佩內洛珀的主修專業是心理學還是藝術史?”
結果,大部分被試者認為佩內洛珀主修藝術史,因為她似乎符合被試者概念中藝術史學生的特點。這就是代表性啟發式,人們使用“自己概念中藝術史學生的特征”來進行判斷,如果佩內洛珀與自己心目中藝術史學生的特征相似,就判斷其主修藝術史。
但是,這一判斷方式的重大缺陷是:很可能忽略了先驗概率。數據顯示,在這項研究進行時,美國一所近18000學生的公立大學中,大約2300人主修心理學,15名主修藝術史。這意味著隨機挑出1名學生,主修心理學的概率是13%,主修藝術史的概率是0.08%,兩者為150∶1。被試者顯然應該先想到這一點,再考慮佩內洛珀的特征,進而作出佩內洛珀大概率主修心理學的結論。或者說,人們基于代表性啟發式進行判斷,很可能會出現判斷偏差。
此外,代表性啟發式也常被用于對未來不確定性作判斷,例如,考慮硬幣拋擲出現正面和反面的情況,人們往往會認為序列“正—反—正—反—反—正”比“正—正—正—反—反—反”更可能發生,因為后者看起來并不隨機。這反映了人們的心理思維模式:人們期望由隨機過程而產生的事件序列,甚至是很短的序列,也能代表這個過程的本質特征“隨機性”。例如,對于拋擲硬幣來說,隨機特征不僅應該體現在整體序列中,也應該表現在局部的部分序列中,換言之,要求局部序列也具有代表性,或者說,用隨機性這一代表來要求所有的序列,包括局部短序列。一個更容易理解的案例是賭徒謬誤,如在輪盤賭中,看到一長串紅色后,大多數人錯誤地相信現在應該是黑色了,因為黑色的出現才會導致一個更具代表性的“隨機”序列。

美國一所近18000學生的公立大學中,大約2300人主修心理學,15名主修藝術史。這意味著隨機挑出1名學生,主修心理學的概率是13%,主修藝術史的概率是0.08%,兩者為150∶1。
但是,個人覺得,人們通常不會用代表性啟發式對未來保險風險做出判斷。人們不會這樣想,汽車盜竊是隨機發生的,我的汽車已經若干年沒有被盜了,按照隨機性理論,我的汽車該被盜了,這種想法通常不會出現。
可得性啟發式的判斷邏輯是,人們通過能想到的例證和想到例證的容易性來評估這類事件的發生頻率或概率。例如,人們通過回憶其熟人中心臟病的發生情況來估計自己患心臟病的風險;人們通過想象某企業可能遭遇的種種困難,來評估該企業的破產概率。
可得性啟發式通常會導致判斷偏差,這里列舉兩類判斷偏差:
第一種是由例證的可提取性引發的偏差。例如,一項研究讓被試者聽到一串男女名人的名單,然后要求他們判斷這一串名字中男人多還是女人多(實際上一樣多)。但是,研究者操縱了名人名單中更有名的男人數量或女人數量,在對第一組被試者呈現的名人名單中,男人比女人更有名;對第二組被試者呈現的名人名單中,女人比男人更有名。判斷結果是,第一組被試者認為男人更多,第二組被試者認為女人更多。顯然,每組被試者都受到了例證可提取性的影響,當男人更有名時,被試者更多地提取了男人做例證;當女人更有名時,則更多地提取了女人做例證,進而導致每組被試者都做出了錯誤或偏差的判斷。
第二種是由有偏記憶樣本集引發的判斷偏差。一項研究要求被試者回答:“從英文文章中隨機抽出一個單詞(3個字母及以上),請問,它是‘第一個字母是r的詞’還是‘第3個字母是r的詞’的可能性更大?”此時,人們通過回憶road之類和car之類的詞的容易性來評估它們的頻率,因為前者更容易從記憶中搜索到,大多數人判斷前者更多。但事實上后者更多。顯然,對于風險事故來說,媒體有偏差的報道(風險事故越新奇或反常,被報道得越多)會導致人們形成有偏記憶,進而導致判斷偏差。
顯然,可得性啟發式特別適用于人們估計未來風險,包括用來估計保險風險的大小。例如,當需要估計自己的癌癥風險以確定是否需要購買癌癥保險或大病保險時,個體可以通過回想到的癌癥實例和想到癌癥實例的容易性來評估自己患癌癥的概率,還可以通過回想到的癌癥實例的醫療費用來估計自己患癌癥后需要的醫療費用。
依靠錨定與調整啟發式做判斷的邏輯是,很多情境下,人們的推測是以初始值為參照點或出發點進行調整后得到答案的。但是,調整基本都是不充分的,導致判斷值有偏差。
例如,一項研究要求被試者用百分制來估計非洲國家在聯合國中所占席位的百分比,如估計值60代表60%。當著被試者的面,研究人員通過轉動幸運輪盤來確定一個0到100之間初始數字,讓被試者說出這個初始數字大于還是小于其心目中的估計值,然后請被試者從這個初始數字開始順時針或逆時針轉動輪盤到其心目中的估計值。對不同的被試群體,研究者給了不同的初始數字。結果,這些武斷的初始數字對估計值有顯著影響,如,對初始數字為10和65的兩個群體而言,非洲國家在聯合國中所占席位的中位估值,分別為25和45,被試者顯然受到了武斷的初始數字的錨定,后續雖然進行了調整,但調整是不充分的。
另一項研究,要求兩組高中生在5秒內分別估計“1×2×3×4×5×6×7×8”和“8×7×6×5×4×3×2×1”的數值,結果,前者中位估值為512,后者中位估值為2250,正確值是40320。在極短的時間內計算上述問題,人們得先計算幾步,然后通過外推或調適來推測最終結果,而先計算那幾步的結果就會成為外推的初始值或錨定值,初始值越低,未來調整后的最終結果也就越低,所以,第一組的估值低于第二組的估值。而且由于調整通常是不充分的,所以兩組高中生都低估了最終結果。
從錨定與調整啟發式的思維邏輯來看,通常不大會用于人們對保險風險發生概率的評估,但可能會被用于保險風險損失規模的評估。例如,對于癌癥風險,人們不太可能有一個出險概率的初始值或錨定值,即便從專家那里得到癌癥發生概率,依賴直覺而無法依賴理性的人類也無法相信這一數值的真實性,即便相信這一數值的真實性,也無法確認這就是自己的癌癥發生概率,也不會從這一統計概率出發進行調適以得到自己的癌癥發生概率。但是,人們很可能會根據自己聽說過的癌癥醫療費用數值來判斷自己一旦發生癌癥后的醫療費用,這里先用了可得性啟發式,然后可能會用錨定與調整啟發式根據通貨膨脹、地區因素、醫療條件等因素進行調整。
從以上分析可以看出,人們在進行保險風險判斷時,對于出險概率,很可能主要依賴可得性啟發式進行判斷,例如,人們通過回憶其熟人中癌癥的發生情況來估計自己患癌癥的風險。對于損失規模,則可能首先使用可得性啟發式來作出初始判斷,然后再根據實際情況(如地理位置、通貨膨脹、醫療條件等)進行調整。