郭振華上海對外經貿大學金融學院
?
行為保險學系列(一)什么是對的保險決策?
——理性保險決策理論及其由來(下)
郭振華上海對外經貿大學金融學院
本文受國家自然科學基金面上項目(71173144)的資助。

郭振華,上海對外經貿大學金融學院保險系主任、副教授,兼任中國保險學會理事、上海保險學會理事。長期講授《保險學》《保險公司經營管理》等課程,主持完成國家自然科學基金、教育部社科基金、上海社科基金項目各一項。
上文梳理了理性風險決策理論①及其由來。所謂理性風險決策理論,就是指丹尼爾·伯努利1738年發明的期望效用理論。所謂理性風險決策,或對的風險決策,就是指在面臨風險時,決策者對可能的行動方案(如不買保險和買保險)所致的期望效用進行比較,選擇期望效用最大的行動方案。
丹尼爾·伯努利發明期望效用理論后,20世紀40年代,馮·諾依曼和摩根斯坦(von Neumann and Morgenstern,馮·諾依曼被后人稱為“計算機之父”,摩根斯坦和馮·諾依曼合作發明了博弈論)將其進行了公理化②,建立了公理化的期望效用理論③。
馮·諾依曼和摩根斯坦首先為理性決策提供了一套明確的基本假設或者公理,這些公理主要包含:(1)有序性公理。即理性決策者可以對任意兩個備選行動方案進行比較,結果是,要么偏好其中一個,要么對兩個都無所謂。(2)占優性公理。即理性決策者永遠都不會采取一個被其他行動策略占優的行動策略,所謂A策略比B策略占優,是指采取A策略一定比采取B策略更好,會帶來更大的效用。(3)相消性公理。如果兩個備選方案的行動結果都是不確定的,可能的結果中包含了一些數值相同且出現概率相等的結果(即兩個概率分布中有部分完全相同),那么,理性決策者在對這兩個方案進行選擇時,應該忽略那些數值相同且出現概率相等的結果的效用,或者說兩個方案的相同部分應該相互抵銷。(4)可傳遞性公理。如果理性決策者在方案A和方案B中更偏好方案A(即A比B好),在方案B和方案C中更偏好方案B(即B比C好),那么這個人在方案A和方案C中肯定更偏好A方案。(5)連續性公理。對于任何一組結果,如果出現最好結果的概率非常大,那么,理性決策者總是偏好在最好和最壞的結果中進行賭博而不是選擇一個中間值。例如,如果面臨這樣的選擇,方案1的結果是確定地獲得100元,方案2是以1/100萬億的概率遭受巨額損失、以“1- 1/100萬億”的概率獲得1000元,理性決策者會偏好方案2。(6)恒定性公理。理性決策者不會受到備選方案的表現方式的影響。例如,面對本質上相同的一個復雜賭博(如兩階段彩票,第一、第二階段的獲獎概率均為50%,兩階段均中獎則得到1000元)和一個簡單賭博(如一次性彩票,獲獎概率25%,獲獎金額1000元),理性決策者肯定會認為兩者無差異,而不是偏好某一個。
在定義上述公理的基礎上,馮·諾依曼和摩根斯坦從數學上對期望效用最大化準則的合理性進行了論證,他們從數學上證明了,如果個體的偏好能夠滿足上述理性行為的基本公理,那么該個體所做出的決策就可以被認為達到了期望效用最大化。反之,如果決策者違背了這些公理,期望效用就無法達到最大化。
從此,不確定條件下的決策理論取得了重大進展,期望效用最大化被視為理性行為準則,因為它是由一些所有理性人都會接受的公理化原則推導出來的,是一套科學的理論體系。
馮·諾依曼和摩根斯坦將期望效用理論公理化后,期望效用理論逐漸成為標準化的風險決策理論,經濟學家逐漸將該理論指導下的不確定條件下的選擇理論寫入了經濟學教科書,并且將保險決策作為經典案例。
所以,經典經濟學中保險決策理論的基礎就是期望效用理論,所謂理性保險決策,或者對的保險決策,就是在面對可保風險時,理性人會選擇使自己的期望效用最大化的行動方案。
(一)理性保險決策
這里用一個案例來說明經典經濟學中的理性保險決策。假設張三的效用函數為U(W),目前擁有的總財富為W0。張三有一處房產,該房產面臨火災風險,火災發生概率為p,一旦發生火災,張三將遭受損失L。在面臨火災風險的情況下,張三有兩個行動方案可供選擇:一是向保險公司投保,保險金額為L,假定保險公司僅收取純保費,純保費等于火災風險的期望損失pL;二是不向保險公司投保。
張三該如何選擇呢?按照理性風險決策理論,張三需要將投保和不投保這兩個方案的期望效用進行比較,選擇期望效用較大的方案。保險決策及其后果可以用收益矩陣來描述,矩陣中的每一行對應的是可供決策者選擇的各種行動方案,每一列對應的是可能發生的自然狀態,每個單元格的內容是由某一行動方案與某一自然狀態共同決定的張三的財富水平。張三的保險決策的收益矩陣如表1所示,在發生火災且投保的情況下,張三的財富水平之所以是W0-pL,是因為損失L被保險公司的賠償完全抵消掉了。

表1 保險決策的收益矩陣
則,方案“不投?!焙汀巴侗!钡钠谕в梅謩e為:
EU(不投保)=p·U(W0-L)+(1-p)·U(W0)
EU(投保)=p·U(W0-pL)+(1-p)· U(W0-pL)=U(W0-pL)=U[p(W0-L)+(1-p)W0]
在張三的效用函數是凹函數(即邊際效用遞減)的情況下,根據詹森不等式E[f(X)]<f[E[X]],任何凹函數f(X)的期望值總是小于X的期望值的函數值,所以,不投保的期望效用小于投保的期望效用。
EU(不投保)<EU(投保)
這說明,如果保險公司僅收取純保費,理性的張三會選擇投保。也正是由于張三投保的效用大于不投保的效用,保險公司可以在純保費之上再向張三收取一些附加保費,只要保證附加保費不要大到使張三的選擇改變為止。于是,在附加保費不高的情況下,張三的理性選擇仍然是投保。
另外,從表1最后一列可以看出,在保險公司僅收取純保費的條件下,張三在投保和不投保兩種方案下的財富期望值其實是相同的,均為W0-pL,那張三為何會選擇投保呢?根本原因就在于張三是風險厭惡的,正是張三對風險的厭惡使得張三在投保時的效用相對較大,使得張三愿意在純保費之外支付風險溢價——附加保費,從而使保險公司也有利可圖,使保險交易得以真正達成。
(二)理性保險決策的圖形描述

圖2 張三的效用函數及投資決策
可以用效用函數圖形來描述上述方案選擇。圖2為張三的邊際效用遞減的效用函數,橫軸表示財富W,縱軸表示不同財富水平對應的效用U(W)。按照上述計算,在保險公司僅收取純保費的情況下,張三不投保時的期望效用為B點的效用水平,投保時的期望效用為C點的效用水平。顯然,投保的期望效用大于不投保的期望效用,所以,張三的理性選擇是投保。
如果保險公司在純保費pL基礎上收取附加保費,則,當總保費為W0-WD時,張三選擇投保和不投保兩種方案的期望效用相等。所以,DB的長度對應著保險公司可以收取的最大附加保費水平,或者說,只要保險公司收取的附加保費低于W0-pL-WD,張三的理性選擇就是投保。
(三)數字化的例子
假設張三的效用函數為√W,目前擁有的總財富為100萬元。張三有一處房產,該房產面臨火災風險,火災發生概率為1/5000,一旦發生火災,張三將遭受損失50萬元。在面臨火災風險的情況下,張三有兩個行動方案可供選擇:一是向保險公司投保,保險金額為50萬元,假定保險公司僅收取純保費100元(1/5000×50萬元);二是不投保。
張三該如何選擇呢?按照理性風險決策理論,張三需要將投保和不投保這兩種方案的期望效用進行比較,選擇期望效用大的方案。張三面臨的收益矩陣如表2所示。

表2 保險決策的收益矩陣 單位:元
則,方案“不投?!焙汀巴侗!钡钠谕в梅謩e為:
EU(投保)=√999900=999.95
EU(不投保)<EU(投保)
理性的張三將選擇投保。張三愿意支付的最大附加保費為:
昌吉油田吉7井區(以下簡稱吉7井區)梧桐溝組油藏屬于深層普通稠油油藏[1]。目前,采用常規水驅開發方式已初見成效,但是水驅標定采收率較低,介于11.1%~16.1%之間,與國內其他同類油田相比,采收率屬于中等偏低水平[2-4]。提高稠油砂巖油藏采收率的方法主要有熱力采油和注聚合物驅油,這兩種方法技術比較成熟且效果較好[5-6]。但由于吉7井區油藏埋藏深,熱采難度大,所以在吉7井區開展了聚合物驅提高采收率試驗研究,為提高吉7井區常規水驅開采方式下的采收率提供技術支持。
999900-[EU(不投保)]2=999900-999880= 20(元)
即,只要保險公司收取的保費不超過120元(純保費100元加最大附加保費20元),理性的張三將會選擇投保。
保險購買決策與日常消費決策相比有很大的不同,一般的消費決策是消費者花錢買一件自己需要的用品,如食品、衣服等,而保險購買決策是消費者自己本來就有一件不好的東西——“風險”,想通過購買保險這種風險管理措施把“風險”這件壞東西除掉或降低。
這里從風險管理角度,即消除或降低風險的角度對理性保險決策進行分析。風險會讓人感覺到擔心或不舒服,這種令人不舒服的東西會給人帶來負效用,保險的作用就是消除這種負效用,但保費支出同樣會降低消費者的效用。所謂理性的保險決策,就是比較風險本身帶來的負效用與保費支出帶來的負效用的大小,如果后者小于前者,說明花費較小的代價可以把較大的壞東西除去,就應該選擇購買保險。
仍以張三面臨火災風險為例進行分析。先計算火災風險給張三帶來的負效用。如果張三沒有火災風險,他的效用是U(W0),即圖2中的A點;張三面臨火災風險后,他的期望效用是“p·U(W0-L)+(1-p)· U(W0)”,即圖2中的B點。也就是說,該火災風險給張三帶來的負效用是UA-UB。
接下來計算保費支出給張三帶來的負效用。如果保險公司僅收取純保費pL,保費支出將使張三的財富水平從W0降低到W0-pL。相應地,這項花費將使張三的效用水平從U(W0)降到U(W0-pL),即從圖2中的A點降到C點。也就是說,如果張三購買保險,保費支出給張三帶來的負效用是UA-UC。
兩害相權取其輕,因為UA-UC小于UA-UB,所以,張三的理性選擇是購買保險。從圖2來看,保險公司可以收取的最大保費為W0-WD,可以收取的最大附加保費為W0-pL-WD。
(一)理性保險決策理論的假設條件
上述理性保險決策理論暗含一系列假設條件,只有在消費者滿足如下條件的情況下,消費者才會做出上述的“理性選擇”或對的保險決策。
第一,完全信息假設。即個體對自己的每一行動方案(投保和不投保)的結果及其對應的概率擁有完全信息。例如,在上例中,張三不但精確地知道自己的房子面臨火災風險,火災發生概率為1/5000,一旦發生火災,自己將遭受50萬元的損失,而且,張三還清楚地知道,如果自己購買50萬保額的保險,自己的財富水平將被鎖定在999900元。
第二,個體遵從期望效用理論的各個公理,包括有序性公理、相消性公理、可傳遞性公理、恒定性公理等。
第三,個體的效用函數適用基數效用理論,個體能夠在掌握風險信息的基礎上依照期望效用理論進行計算,并選擇期望效用較大的行動方案。
第四,保費充足假設。在上述理性保險決策理論中,并沒有從個體收入角度去考慮個體是否有足夠的錢去支付保費,或者說理性保險決策理論假設有足夠的保費預算。
(二)假設條件與現實世界有諸多不符
但在現實世界中,上述各條假設都可能得不到滿足:
第一,消費者很難準確估計自己面臨的風險。如果消費者低估了自己面臨的風險,按照期望效用理論,消費者很可能就不會選擇購買保險了。

第二,消費者也不一定能夠遵從期望效用理論的各個公理。例如,框架效應的研究成果表明,決策者經常違背恒定性公理,人們的選擇會受到問題呈現的順序、問題出現的情境、答案選項的范圍、答案選項出現的順序、問題是從收益還是從損失的角度來提問等因素的影響。面對本質上相同的問題,只要改變措辭方式和順序,決策者的選擇就可能改變。
第三,期望效用計算其實主要發生在理論研究和大學教室中,現實世界中很少有人會真的去計算期望效用,而且效用其實只是個人的一種主觀感覺,很難將其量化,基數效用理論在現實世界很可能并不適用。
第四,消費者在保險決策中顯然會受到收入水平的限制?,F實世界中,個體的收入有諸多用途,需要購買各種各樣的商品和服務來滿足自己的需求,換句話說,各種商品和服務在消費者那里其實是相互競爭的,收入水平顯然會影響個體的保險決策。例如對一個收入很低的家庭來說,其收入只能滿足其生活必需品的消費,自然就無法或沒有心思去購買保險。
(三)需要構建能夠解釋保險市場的決策理論
基于期望效用理論的理性保險決策理論是一個標準化決策模型,該理論說明,在滿足上述假設條件情況下,理性人將會選擇購買保險,這里稱之為理性保險決策或對的保險決策。
可在現實世界中,多數人不會主動購買保險。而且,出險概率越低,保險購買意愿越低,越是需要保險公司投入大規模人力進行面對面銷售。
所以,基于期望效用理論的理性保險決策理論并不是一個很好的描述性模型,即現實中人們如何作保險決策的模型,需要建立更加符合現實的保險決策理論,用以解釋真實的保險市場。
①本文不區分風險決策與不確定決策,因為這樣并不影響本文的討論和邏輯,盡管有些論著認為風險和不確定性存在區別。
②公理是指依據人類理性的不證自明的基本事實。公理化是一種重要的研究方法,它的主要精神是從盡可能少的幾條公理以及若干原始概念出發,應用邏輯規則和數學推導出盡可能多的命題。這種邏輯推演過程被稱為“證明”,被證明的結論稱為“定理”,科學體系就是由一系列概念、公理和命題(或定理)構成的。
③效用理論分為基數效用理論和序數效用理論?;鶖敌в美碚撜J為,效用可以精確計量和加總,其大小可以用1,2,3,……來表示。序數效用理論認為,效用不可以度量,只能根據主體偏好的程度排出偏好順序:第一、第二、第三……
注釋: