王洪利
(1.西安交通大學 管理學院,西安 710000;2.中原工學院 經濟管理學院,鄭州 450007)
所謂決策風險,是指在決策活動中,由于主、客體等多種不確定因素的存在,而導致決策活動不能達到預期目的的可能性及其后果。時間壓力下的風險決策是指決策者的決策行為受到決策時間的限制,要求決策者在規定的時間內作出決策行為。對于風險決策的理論分析和研究中比較著名的是期望效用理論。期望效用函數理論是20世紀50年代,馮·紐曼和摩根斯坦(Von Neumann and Morgenstern)在公理化假設的基礎上建立的。期望效用理論認為,期望效用函數如下:
如果某個隨機變量X以概率Pi取值xi,i=1,2,…,n,而某人在確定地得到xi時的效用為u(xi),那么,該隨機變量帶給此人的效用是:
U(X)=E[u(X)]=P1u(x1)+P2u(x2)+...+Pnu(xn)
其中,E[u(X)]表示關于隨機變量X的期望效用。因此U(X)稱為期望效用函數,又叫做馮·諾依曼—摩根斯坦效用函數(VNM函數)。
1.2.1 概念和步驟
(1)概念:根據各種事件發生的先驗概率進行決策一般具有較大的風險。減少這種風險的辦法是通過科學實驗、調查、統計分析等方法獲得較為準確的情報信息,以修正先驗概率。利用貝葉斯定理求得后驗概率,據以進行決策的方法,稱為貝葉斯決策方法。
(2)步驟:
①進行預后驗分析,決定是否值得搜集補充資料以及從補充資料可能得到的結果和如何決定最優對策。
②搜集補充資料,取得條件概率,包括歷史概率和邏輯概率,對歷史概率要加以檢驗,辨明其是否適合計算后驗概率。
③用概率的乘法定理計算聯合概率,用概率的加法定理計算邊際概率,用貝葉斯定理計算后驗概率。
④用后驗概率進行決策分析。
1.2.2 貝葉斯定理
兩事件的乘法法則:P(A1B)=P(A1)P(B/A1)
邊際概率:如果事件A1和A2是互斥完備的,則
P(B)=P(A1)P(B/A1)+P(A2)P(B/A2)
兩事件的貝葉斯定理公式:如果事件A1和A2是互斥完備的,其中某個事件的發生是事件B發生的必要條件。則

n個事件的貝葉斯定理公式:如果事件A1,A2,…,An是互斥完備的,其中某個事件的發生是事件B發生的必要條件。則

傳統經濟學假定效用是隨時間以指數貼現的,其效用最大化問題表示為:
maxU=∑δtU(Ct)
其中

上式中,ρ為時間貼現率,δ指以指數曲線貼現的貼現系數,Ct為時間t某個事件的價值,U(Ct)為Ct在時間t的效用值。
很多實驗和數據表明,決策的邊際時間效用在一定的時間段是遞增的,但到達一定高峰后,隨著時間的增加,邊際時間效用就會停止不動甚至開始遞減(見圖1b),因此累計的決策時間效用會隨著時間的增加先增后減(見圖1c)。即一個決策過程存在一個最佳的決策時間點。原因可能是多方面的,因為決策受到決策任務特征,決策環境和決策者個人因素的影響。其中一個比較直接的原因在于決策中的信息影響,隨著時間的增加各種因素導致決策中信息搜索量的變化規律為先增加后減少(見圖1a)。
最佳決策的時間點是存在的,主要原因在于:首先,隨著時間的增加成本是增加的,處理時間的增加,成本會越變越大,但收益是有限的,決策主體所能獲取的收益不能夠隨著時間同比例增長或者可能停止增長甚至遞減。所以不斷的增加處理時間將帶來收益的遞減,直接導致效用的減少;其次,隨著時間的增長,決策環境的變化可能會很大,但是決策者的信念的變化是一個很復雜的過程,不可能及時地隨著決策環境的變化而變化。所以,無窮盡的增大決策時間,反而會使人的信念有可能偏離原來的決策環境,而使決策變得沒有現實意義。第三,決策時間的延長,決策者收集信息和考慮方案會更充分,但是過度的延長決策時間會增加一些額外的干擾因素,這些很可能被決策者誤認為是重要因素而將其加入到自己的信念中去,這被稱為過度思慮。所以,無限的延長決策時間,并不會提高決策效用,反而會增加無謂的心理偏差和行為偏差。最佳決策時間點如圖1b所示。
根據Hartley的信息公式[3]:
I=logN
其中I表示確定N個等概率事件中的一個出現時提供的信息。如果事件y把不確定范圍從N1個縮小為N2個,那么信息就等于

這個公式被稱為Hartely相對信息公式。
用Hartley公式計算信息,要求N個事件是等概率的,即P=1/N,但是通常的情況并不如此[4]。這時候我們用實際的概率代替假設的相等的概率,即用P1代替1/N1,用P2代替1/N2。于是,Hartley信息公式就變為[5]:
I=log(1/P)
上面的相對信息公式就變為:

在考慮時間壓力的情況下,把客觀事件集合A={x1,x2,…}中的一個表示為xi;把T={Tx,x=1,2,3,…,n}時刻的決策者獲得的信息(message)集合中的一個表示為,那么T時刻提供的關于xi的信息就是:

其中 P(xi)是 xi發生的先驗概率,P(xi|yj)是 yj發生后 xi的條件概率。因為有Bayes公式

所以有


進一步求平均,得到T時刻YT提供關于X的平均信息:

其中H(X)和H(X|Y)分別是Shannon熵和Shannon條件熵:

現在我們進一步考慮時間壓力的影響,設在不同的時間 Ta和 Tb(Ta<Tb)時刻的決策者獲得的信息(message)集合分別為由于決策時間的限制和影響,在此有BTa≠BTb。即決策者在不同的時間限制條件下,所獲得的信息量是有差異的。因為決策者在時間壓力條件下,受到做出決策的情緒壓力和信息搜尋的時間的限制,導致了決策者信息搜尋量的差異。這種差異直接導致獲得信息量的多少。
根據上面的公示,進一步求得,得到時刻Ta和Tb時刻的提供關于X的平均信息差異:


信息的價值在于其能提供的決策信息的收益高于為獲取信息所付出的花費。如果補充新信息的成本小于完全信息的價值(任何信息的價值均小于完全信息的價值),則可認為這種補充信息的價值是合算的。
根據期望理論和傳統經濟學效用是隨時間以指數貼現的假定,定義在Tb-Ta這段時間中,時刻Ta和Tb時刻的提供關于 X 的平均信息差異|I(X;YTb)-I(X;YTa)|的期望收益增加的函數為:

其中把客觀事件集合A={x1,x2,…}中的一個表示為xi。
上面的平均信息差異公式考慮了時間的貼現效用,對時間的價值以現在時間為參照點,從決策者的價值出發,具有更大的客觀性。
在時間限制條件下,如果超時決策會帶來一定的損害后果,這種損害后果表現為一種懲罰。和我們對時間的機會成本的理解類似。如每延時一定的時間從總收益扣除k%,如總延時超過一定的期限,則扣除全部總收益,或總收益變為負值,表現為損失,則扣除比例R(超過時間限定的懲罰條件)其可用以下公式表示:

其中,Tl=TL+l-TL=TL+2l-TL+l=…=TLmax-TL+(N-1)l=ΔT,TL為決策的時間限制,在此限制時間內,決策時間的延長不帶來的收益的損失,TLmax也可理解為決策強制終止時間,當T<TL時,信息搜尋時間的增加不會帶來對收益的懲罰。在此時間限定內我們考慮是否繼續進行信息搜尋的條件是信息搜尋的成本和收益的差值。
當TL<T<TLmax時,我們還應進一步考慮決策時間的延長帶來的收益的損失(懲罰)。即總損失為:

其中Ci為信息搜尋的成本。
即此時是否進行信息搜尋的條件是比較ΔU和LT的差值。如果 ΔU-LT>0,則應該進行信息搜尋。如果 ΔU-LT<0 則停止信息搜尋。
時間壓力下風險決策的信息修正過程由補充新信息、計算修正概率、重新決策和計算補充信息的價值四部分組成。
3.2.1 補充新信息
在時間限定條件下,通過信息搜尋得到新信息,獲取條件概率。
3.2.2 計算修正概率
利用貝葉斯公式計算:

(3)根據(2)的后驗概率,計算各方案的期望收益:
E(dj|Ai)=ΣP(Ai|Bj)Uij,maxE(dj|Ai)=E(djk|Ai)
(4)當T<TL時,計算補充信息的期望價值,并和信息獲取的成本進行比較以進行決策:
Es=ΣP(xi)E(xi)
當TL<T<TLmax時,則根據時間壓力下停止信息搜尋的條件分析而進行決策。
本文從理論的角度詳細分析了時間壓力對風險決策的影響。從Hartley的信息公式出發,根據期望效用理論,考慮時間的貼現效用,從理論上研究了時間對決策中信息搜尋的影響,分析了時間壓力下停止信息搜尋的條件。時間壓力影響了人們的信息搜尋和獲取量,理論上人們的信息搜尋有一個最佳的停止時間,而且其取決于不同的時間壓力。本文給出了時間壓力下風險決策的信息修正過程,得出了相關結論和需進一步分析的問題。
[1]郭仲偉.風險分析與決策[M].北京:北京機械工業出版社,1986.
[2]董志勇.行為經濟學原理[M].北京:北京大學出版社,2006.
[3]Hartley,R.V.L.Transmission ofinformation[J].Bell System Technical Journal,1928,(7).
[4]晨光.廣義熵和廣義互信息的編碼意義[J].通信學報,1994,5(6).
[5]Lu,Chenguang.A Generalization of Shannon's Information theory[J].Int.J.of General Systems,1999,(6).