宋子明
哲學的發展經常從科學理論中汲取養分。決策論(Decision Theory)作為當代社會科學中的重要理論之一,對我們理解人類行動既提供了素材,也頗具洞見。經典的決策論又稱“期望效用理論”(expected utility theory,[22,23]),形成之初便具有實證和規范的雙重色彩,既是經驗描述性質的科學理論,同時,其中的關鍵概念(如效用、偏好、選擇)和其對合理性原則的刻畫,使得該理論可以被視為具有規范內容。哲學界對經典決策論規范性問題的討論,立足實證科學而探討規范問題,有助于理解合意的選擇遵循怎樣的規范原則。
決策論的規范性刻畫主要面臨兩大難題。其一,是來自工具主義(instrumentalism)解釋的挑戰。([8,15])規范性刻畫依賴心智主義(mentalism),認為理論中的概念對應心理狀態(信念、愿望和動機),因此理論可以表征意圖行動者的選擇行動。但工具主義認為這是對理論的誤解,否認早期的決策論使用者普遍采納的期望效用最大化主張,即理論為行動的合理性所提出的規范主張是“應該最大化期望效用”。可是如果決策論不反映心理狀態,也就難以幫助理解選擇的合意性(desirability)規范。其二,決策論也面臨來自心理學和行為經濟學上的實證反駁。證據顯示,人們實際所做的選擇與理論預測存在系統性偏差。([2,6,11,19])然而對于規范地解釋決策論而言,實證意義上的失敗并不自動排除規范的解釋。第二節將提出一種以心智主義為基礎的規范性決策論。通過回應兩個難題(第三、四節),本文進而辯護并說明這種規范的解釋怎樣幫助我們理解一種評估行動合意性的普遍規范(第五節)。
戴維森(D.Davidson)認為,作為理性人的我們通過常識心理學(folk psychology)看待彼此和自己的行動,并以此實現理解。([3])這是一種基于工具-目標合理性并訴諸愿望和信念的理解:如果我有和你一樣的愿望和信念,那么我會做出和你相同的決定;當我具有某愿望和信念,那么在某種必然的意義上,我會——并且應該——那樣行動。簡言之,常識心理學是合理性原則規范理論的起點。
20 世紀中葉,社會科學家將決策論發展為一種刻畫選擇行動的公理化形式理論。作為刻畫行動的理論,決策論不是常識心理學的替代品,相反,它是一種以之為起點并精確化、規整化的理論。劉易斯(D.Lewis)很好地闡述了決策論的起源和它所扮演的規范角色:
決策理論(至少如果我們忽略那些修飾)不是艱深的科學,無論它在局外人看來是多么陌生。相反,它系統地闡述了關于信念、愿望、偏好和選擇的某些精挑細選的陳詞濫調。它是我們關于人的常識理論的核心,被剖析并優雅地系統化。
([12],第114 頁)
常識心理學可以描述(包括說明、預測)一個理性人為什么會做某個選擇,也可以規定(包括建議、評估)行動者應當做何選擇。而因對常識心理學的精確化,決策論也同時具備了描述和規范雙重維度。這一傳統理解為早期的決策論使用者所采納,且理論的初創者們也默認了決策論的雙重屬性。
本節闡述一種對期望效用理論的規范解釋1理論的形式模型參考[10,14,16,18]。,突顯常識心理學為理論提供起點,并以此引出傳統解釋中的一些問題。闡述分為兩個階段,首先考慮確定條件下的簡單決策,然后處理不確定的情況。第二階段強調偏好的更新,彰顯從對確定結果的偏好到對不確定選項的偏好的更新過程。
首先,擁有愿望的理性主體關心結果。用命題表征結果,例如“我吃這個蘋果”,“我在海南島度假”,“我的朋友被拘留”。結果可以是好的或壞的,它們是理性主體可以對之進行價值評估的對象。理性主體對其想要結果的評估,通過其偏好排序(preference ranking)來體現。該排序反映主體在綜合考慮所有因素的情況下,會選擇不同結果的先后順序。形式上,設Z為結果集,偏好排序是定義在Z上的二元關系,用R*表示。R*要滿足弱序的一致性要求,即滿足以下兩個條件。
完備性:對于每個x,y ∈Z,xR*y或yR*x。
傳遞性:對于每個x,y,z ∈Z,如果xR*y和yR*z那么xR*z。
隨后,決策論中通常再定義一個效用函數(utility function,U),從數字上表征偏好排序。U分配更大的實數給更好的結果。亦即,U:Z→R,使得xR*y當且僅當U(x)≥U(y)。這是決策論如何開始將常識心理學的愿望部分形式化。信念部分的建模則基于主體認為可行的一個行動集。信念函數為每個行動賦值對應結果。形式上,設A是主體認為可從中選擇的一個行動集,B*:A→Z表征主體關于行動如何與結果關聯的那些信念。
然后,關于主體如何選擇,決策論的基本思想仍然是常識心理學的:在主觀認為的會導致不同結果的可選行動范圍內,理性主體應該(而且經常會)選擇她認為最能滿足她的偏好的行動。形式上,主體應該選擇某行動a ∈A,使得對所有b ∈A,B*(a)R*B*(b)。或者用效用函數表達為:主體應該選擇某行動a ∈A,使得對所有b ∈A,U(B*(a))≥U(B*(b))。
以上是確定情況下的決策,尚未引入概率處理不確定情況,故理論中的偏好和信念關系都暫時帶“*”。而我們已經看到,理論中的R*和B*分別對應常識心理學的愿望和信念,由兩者共同導向行動。在此意義上說,決策模型是對常識理論的精確化。描述維度上可以說,某人選擇了——會選擇——行動a,是因為,根據她當下的信念,a(將會)導致她的價值評估中的最好結果;規范維度來說,她應該選a,依據“a使得對所有b ∈A,B*(a)R*B*(b)”。
面向決策論使用者的教科書往往從這樣的對應關系出發,開始介紹理論元素的建構。直觀上也因貼近常識而更易理解。然而,這預設了在當代被稱為“心智主義”的解釋,受到了以哲學家奧卡沙(S.Okasha)為代表的批評。([8,15])事實上,期望效用模型源自應用數學領域中的測量理論(measurement theory),并由經濟學家們發展應用到社會科學。在馮諾依曼和摩根斯坦(J.von Neumann,O.Morgenstern)、薩維奇(L.Savage)等初創者看來,理論出發點并非對其中參數的某種解釋;理論是由模型參數和在模型下證明的定理所構成的形式工具。但社會科學之所以能夠使用這一數學工具對人的選擇偏好進行說明和預測,仍然需要依賴某種解釋橋介。
上述第一階段關于決策論如何刻畫愿望/信念理論對于信念部分的處理不夠靈活。即使從主觀上,一個理性主體也很少能確定地知道她的某個行動會導致什么結果。一般來說,一個給定的行動可能會導致許多可能的結果。為了處理這種風險情況,決策論訴諸于概率。理性主體有一個概率函數,來表征她對選項行動產生各種結果的可能性的信念。形式上,設L是一組前景(prospects),有時稱“樂透”或“賭博”,它將結果集Z的元素作為具有特定概率的“獎品”。L包含了Z上的所有概率分布。本文用小寫的p,q,r等來表示L的元素。每個概率分布將結果集Z映射到區間[0,1],且所有分布的值加起來為1。換句話說,L中的概率函數p定義為p:Z→[0,1]使得∑z∈Z p(z)=1。選擇主體所面臨的每一個風險情況,都可以理解為這樣一個前景,由p表征。
第一階段有對確定結果的偏好排序R*。當選擇行動與確定結果緊密聯系時,R*會延續。在第二階段,行動與前景相聯系,因此,我們需要對這些前景形成偏好排序,用R表示。根據決策論中的著名結果“表征定理”(representation theorem),存在這樣的偏好排序R。具體地,圍繞對結果的偏好排序(關系R*)和由概率構建的前景,存在一集公理,允許我們形成對前景的偏好排序(關系R)。這些公理以及從它們導出的引理可以以不同方式呈現,不同的公理系統有技術細節上的差別,例如von Neumann-Morgenstern 理論的表征定理和Anscombe-Aumann 理論的表征定理在形式上略有不同。本文忽略不同表征定理形式上的不同,僅以馮氏理論作為正統理論的一個代表。對與本文有關決策論規范內容的論證來說,重要的是對表征定理的解釋。
表征定理說:由一個效用函數u出發,表征對結果的偏好排序R*,結合一個定義良好的概率函數p,當它們滿足一集公理,則能夠證明,存在一集效用函數,并且它們經線性變換后是唯一的,該函數期望地表征對前景的偏好排序R。定義主體的信念函數B:A→L,在這一階段,B將每個可選行動賦值一個前景選項。有了定理對R的保證,決策論對理性選擇的刻畫也就順理成章:理性主體會選擇行動a ∈A,使得對所有b ∈A,B(a)RB(b)。更精確的量化表征為:一個選擇行動的效用,是由該行動可能獲得的每個前景的效用經概率加權后的總和,數學上稱“期望效用”。例如,某行動會以概率r導致結果x,否則導致結果y,那么該行動的期望效用可計算為xr+y(1-r)。一般來說,行動p的期望效用是u:L→R,使得:
這里,函數u(p)期望地表征了主體對前景選項p的偏好R。在p的期望效用大于q的情況下,p是一個比q更好的選擇。由此說,表征定理對選擇偏好的表征是期望的(expectational)。雖然有表征定理參與的第二階段在形式上更復雜,但其基本想法仍然是常識心理學的。
經濟學家對期望效用模型的解釋,通常認為是工具主義的。模型本身來自測量論,定義一些偏好相關參數并推導出決策的期望效用。經濟選擇上的應用則建立在對行動主體真實偏好的觀測上:通過向主體分別展示多組前景,邀請主體比較對它們的偏好;所表達的偏好被用來構建“標尺”,進而得以測算主體的效用函數u和概率函數p。而理論中的關于偏好的公理保證了這樣的測量方式對于偏好的期望表征,是充分且必要的。經濟學家瓦克爾(P.Wakker)在其決策論教材中,稱此為決策論的“行為基礎”(behavioral foundations,[20])。而奧卡莎也使用“行為主義”(behaviorism)指這里的工具主義。但正如奧卡沙也注意到,“行為主義”一詞容易和薩米爾森(P.Samuelson)的行為主義經濟學混淆。([7,17])因此本文稱“工具主義”。U和p來自對偏好態度的實證測量,由此看出,理論的參數只不過是一種方便的數學工具,用來描述一個“好像”(as if)的故事。主體依其偏好做決策就好像是她在計算著一個期望效用函數的值。理論的描述并不預設效用、信念(度)等概念具有心理的實存內容。行動a的期望效用值大于b,并不從心理實存意義上因果地說明為什么某人更偏好a。期望效用的計算與偏好態度并不構成因果關系,只是表征關系。
本體意義上,上述工具主義的解釋承諾一種反實在論,不同于心智主義所認為的效用函數對應著某些實在,例如愿望強度和滿足程度。在偏好和效用函數的關系問題上,兩種解釋都屬于“建構主義”(constructivism),認為u只是理論參數,由主體的偏好態度所決定。相對地,強實在論則認為效用是獨立于偏好的心理狀態。在建構主義的兩種解釋下,我們都可以既談理論通過u,怎樣描述偏好,也談理論怎樣規范偏好。甚至在強實在論下,我們可以談偏好怎樣通過效用而形成。既談效用怎樣說明和預測主體具有的偏好,也談效用怎樣要求主體應當形成怎樣的偏好。
近年來,隨著討論決策論的哲學家和將之作為工具應用在其他哲學問題的學者逐漸增多,對理論的解釋也不盡相同。例如政治哲學家高契爾認為,后果主義的幸福最大化原則與期望效用最大化原則是一致的。([5])哲學家杰克遜認為,期望效用最大化的主張是一種后果主義的道德選擇理論。([9])又如奧卡沙列舉的諸多例子表明,當代哲學界習慣采納心智主義的解釋來賦予決策論以規范內容。德萊爾(J.Dreier)也指出了類似問題。([4])當代哲學界似乎普遍認為,決策論通過表征定理主張“理性主體應該最大化行動的期望效用”:
表征定理經常被用來為決策理論奠基。首先,該定理表征信念度和效用。其次,該定理辯護兩個理性的基本原則:我們應該有符合概率的信念度,并且我們應該按照期望效用最大化的方式行事。([13])
我們先看對期望效用最大化主張的批評。在經典決策模型中,表征定理的主張是:
某主體的偏好(與由之定義的u和p)滿足了一集公理(弱序、獨立性、連續性),當且僅當,該主體的偏好可由一集效用函數期望地(亦即,期望效用最大化地)表征。(1)
命題(1)在邏輯上獨立于、且嚴格地弱于下述命題(2)
主體的偏好應該最大化期望效用。(2)
根據奧卡沙的論證,即使命題(2)為假,命題(1)也可以為真。即使主體的行動實際上違反期望效用最大化,她的偏好關系依然可以滿足理論公理。而一旦滿足了公理,那么她的效用函數就是期望地可表征的。因此,完全有可能的是,要么該主體的效用函數與其真實心理意義上的效用函數不同,要么她的概率函數與其心理的信度函數不同,或兩者皆是,而兩種情況下,她的偏好關系都完全可能符合公理。信念方面,當主體的概率函數和偏好關系符合決策論公理時,其真實信度函數可異于該概率函數。([21])換言之,表征定理中出現的u和p,只是便利的數學工具建構。在主體的偏好滿足公理的條件下,僅能證明存在某個u作為偏好的期望表征,但是理論并不保證那個u與主體真實特定的心理狀態有關,因此更不保證理論中構建出來的某些效用和概率函數與主體那些真實的愿望和信念一一對應。
奧卡沙論證的部分結論是合理的,即“偏好應最大化期望效用”這一主張是對決策論規范內容的誤解。但他接著關于理論所支持規范內容的推論卻不夠嚴謹。奧卡沙認為,決策論的規范主張是“偏好應當滿足決策論的公理”,且該規范內容排斥對理論的心智主義解釋。需要注意的是,從其文顯示,奧卡沙的“心智主義”承諾了強實在論,認為效用是獨立于偏好且不可還原的事實。若將對行動的描述和規范,歸因于獨立實存的愿望等心理狀態,這樣的常識心理學理解也承諾強實在論。但按照本文已經界定的劃分,心智主義完全可以只承諾建構主義的弱實在論。因此,奧卡沙對“心智主義”的排斥,實際上只是排斥了強實在論解釋。
而且,以奧卡沙為代表,將“決策論并不承諾某些先于理論而獨立存在的效用和信度”這一工具主義解釋直接與“偏好應當滿足公理”這一規范主張掛鉤,有捆綁工具主義之嫌。奧卡沙并未直接辯護工具主義,只是一筆帶過其強實在論版本所面臨的困難。決策論經典文獻中([10,14,16,18]),工具主義也通常視為默認選項。這樣的做法給人誤導性的印象,似乎決策論的規范內容來自于對理論的某種解讀。但這顛倒了邏輯順序,理論的內容屬于理論本身,應先于對其的解讀。相反,如果我們沒有從認定工具主義出發,那么奧卡沙的論證只說明,具有心理實存意義的效用、概率函數的存在,對滿足理論公理不必要。這為心智主義留下了空間。因為即使心智主義下的效用、概率函數不必要,也不意味著它們必須不存在。一種混合式解釋是開放的:將工具主義和心智主義的部分真相結合起來,刻畫決策論的規范內容。
雖然哲學界對決策論規范內容存在一定誤解,但該現象有其充分的原因。心智主義解釋的傾向,源自常識心理學合理性原則。雖然社會科學家考慮決策論是為服務于描述性地說明和預測行動,哲學家對決策論的興趣則主要來自它的規范性。正如歷史上亞里士多德、休謨及當代學者對實踐理性的關注,哲學家們更關心理性人應遵循怎樣的選擇規范,而非對選擇過程呈現機制的描述。
決策的規范維度,指的是對某行動是否合理的評估判斷,包括“厚的”和“薄的”理性評估。外部評估通常是厚的,從評估者視角考慮如,決策問題的定義(選項和結果的認定、信息的收集)、所選行動在道德價值意義上的辯護等。而薄的內部評估是一致性評估,從行動者視角,只考慮所選行動與所想目標是否內在地自洽。因此,規范維度既包含外部評價,也包含內部一致性的評估,都是對選擇是否合理的評估判斷。
貝穆德茲(J.Bermúdez)討論理性在不同學科領域的不同維度,及決策論能否為這些不同訴求提供一個統一的理論基礎。([1])關于描述與規范兩個維度能否統一的問題,他分析了相容論與不相容論兩種立場。不相容論者認為,規范維度必須建立在決策論公理被滿足的基礎上,而描述維度則蘊含對公理的違背,因此兩者不相容。近數十年來,行為經濟學和心理學對人的非理性現象的研究顯示,人們實際的行動在很多方面廣泛系統地偏離了經典決策論的描述,真實的選擇和動機幾乎是非理性的。([2,6,11,19])如要決策論發揮其規范作用,則意味著公理必須被滿足,但也因此不具備描述準確性。而相容論者持反對意見,認為對決策論描述準確性的否定,獨立于其規范內容。
在區分了描述與規范維度的基礎上,對于決策論是關于過程或結果的理論,我們進一步做出解釋上的區分。首先,作為關于過程的描述,決策論描述人們真實的選擇依據怎樣的機制。例如心理學上描述部分學生寫論文拖延的心理機制。而根據決策論,想要獲得好成績又相信論文成績很重要的學生,不會延遲論文寫作。把決策論解釋為關于過程的描述是不合理的,人們真實的心理過程與決策論的描述不符。第二種區分是把決策論解釋為關于結果的描述。例如經濟學上關于企業總是以最大化利潤的方式選擇,但有時企業也為了追求社會公平等價值而放棄利潤最大化。決策論對于結果的描述性預測有時也與事實不符。因此,合理地解釋經典決策論需要離開描述維度。
在規范維度討論決策論,同樣可以區分關于過程或結果的兩種解釋。作為關于過程的規范理論,決策論扮演規定(prescriptive)選擇的作用,主張行動者應當怎樣實現效用最大化。而作為關于結果的規范理論,決策論只扮演“答案”的角色,主張理性主體應當以怎樣的理想結果為標準。2當然這里的理性僅指薄的意義上一種工具-目標合理性。規定過程的決策論需要預設其與真實選擇至少大致相符,畢竟“應當蘊含可能”。但作為理想標準的決策論則不要求現實的準確性。因此實證證據對這種解釋并不構成挑戰。
事實上,對于決策論的兩種規范解釋,在哲學文獻中常常是模糊的。貝穆德茲雖然看似區分了兩者——將規定過程的解釋定義為行動者第一人稱的內部評估,但卻將理想標準的解釋局限為厚的外部評估。第三人稱描述視角須以滿足公理為前提,否則理論無法適用。而對于第一人稱的內部評估規范,如果將這種規范理解為對行動的規定,那么同樣受限于理論的現實準確性和適用條件。但它們都不是對規范性決策論的唯一解釋。
規范性決策論是過程規定,還是理想標準這一區分,可通過表征定理的兩種陳述方式顯示。回顧第二節的命題(1)發現,該條件句的前件(主體的偏好是否滿足決策論公理)是或然的。而根據表征定理,一旦偏好滿足了公理,那么偏好和效用函數可期望地表征,這是邏輯必然地。換言之,通常認為,表征定理主張的是下述“狹域”命題,即使我們不預設工具主義解釋:
狹域命題如果某主體的偏好(與由之定義的u和p)滿足一集公理,那么,必然地,該主體的偏好可由一集效用函數(好像,或真實地)期望地表征。
可以看到,表征定理是否適用,需要建立在前件公理被滿足的基礎上,不論是描述維度或過程規定的解釋。按照“應當蘊含可能”原則,如果證據顯示人們幾乎不可能遵循表征定理的前件,那么該定理也幾乎無法用來規定行動。但是,我們可以把決策論的規范內容解釋為一種理想標準,也就是說,當我們賦予表征定理以廣域的理解,此時不僅規避了實證證據對決策論描述不準確的批評,獲得描述與規范維度相容論立場,而且提供了一種理性選擇的普遍準則:
廣域命題必然地,如果某主體的偏好(與由之定義的u和p)滿足一集公理,那么該主體的偏好可由一集效用函數(好像,或真實地)期望地表征。
第二節闡述了一種對經典決策論的規范解釋,凸顯怎樣從公理系統內部將愿望、信念和行動聯系起來。通過第三節的分析看到,決策論對心智主義解釋是友好的:愿望和信念分別由效用函數和信念函數表征,行動的選擇價值則以行動的期望效用為指標。這使得“決策論提供理性選擇的規范”這一解釋成為可能。通過第四節對實證挑戰的回應,我們區分出一種關于結果而非過程的規范解釋。出于這種關于結果的規范解釋,亦即對表征定理的廣域理解,本節將進一步闡明決策論的規范性刻畫:與演繹邏輯對真值的更新、歸納邏輯對信度或證據支持度的更新相類似,這種規范性決策論是關于理性主體更新偏好的普遍規范。
表征定理表征主體怎樣由“輸入”其對結果的偏好排序R*,到“輸出”對前景選項的偏好排序R的過程。它提供了一個從R*到R的偏好更新機制。通俗而言,如果這些是某人對事態的基本偏好和信念,那么那個行動就是她應該想要選擇的。因此稱其為一種“評估的邏輯”(logic of evaluation)。這種“邏輯”與傳統演繹邏輯和歸納邏輯存在有趣的共通特征。首先,三種理論的規范性都可獨立于其描述部分。即使很多人實際上不按照邏輯規范進行推理,也不妨礙邏輯規范成立。例如,當人們的推理實際上符合modus tollens 時,理論家會認為自己既闡明了應該如何推理的規范,又描述了人們實際推理的一些方式。決策論在多個學科領域中的不同研究視角恰恰體現了這點。在經驗科學中,它可以被視為對實際決策方式的(有限的)描述,但這并不應該自動定義和窮盡其所能扮演的角色。相比描述事實,經典決策論更成功地扮演了闡明關于評價和選擇的“觀念關系”的角色。這里借用休謨對“觀念關系”和“事實問題”的區分,即使描述決策論事實為假,規范決策論所蘊含的觀念關系依然成立。
其次,演繹邏輯表征邏輯有效性,歸納邏輯表征證據支持的強度。演繹系統輸入一組真句子,經過系統的公理和推演規則,輸出另一組真句子,具有“保真性”(truth-preserving)。或者說,演繹系統是一種更新真值的機制,對兩組句子的真值進行“再分配”。歸納邏輯的情況類似,從輸入一組假設的證據支持度開始,經貝葉斯更新規則,輸出另一組信度或支持度。這種重新分配支持度的過程受到貝葉斯歸納邏輯的約束。具有較強證據支持的假設的后驗概率將增加,而具有較弱支持的假設的后驗概率將減少。因此,歸納邏輯具有“真值指示性”(truth-indicating)。
相應地,決策論提供了有關合意性評估的“再分配”機制,更新主體對于合意性的偏好評估。像演繹邏輯和歸納邏輯一樣,決策論形式系統的內在自洽,可以說具有“有效指示性”(effectiveness-indicating)的優點。我們可以清楚看到演繹邏輯、歸納邏輯與評估的邏輯之間的這種比較,如下表所示:

本文分析并回應了規范地解釋經典決策論所面臨的兩個難題。第一,工具主義解釋并不自動排除心智主義解釋,相反,規范性決策論依賴一種混合式心智主義。通過分析傳統解釋對工具主義偏頗的默認,本文開發了心智主義的理論空間。決策論并不只是為了工具式地預測而講述“好像”的故事。第二個難題來自經驗證據:理論的描述預測與現實的選擇行動相去甚遠。但這并不妨礙決策論作為一種理想規范對理性選擇發揮評估作用。進而,本文提出一種刻畫這種理想規范的方案,認為規范性決策論是更新偏好的機制。由于規范決策論是對常識心理學的精確化,因此也繼承了其中的規范性。如果常識心理學是理性選擇的規范尺度,那么規范決策論為這把標尺劃上了清晰的刻度。本文并未處理描述層面怎樣選擇的問題([24]),只在抽象地理解理性選擇問題上具有啟發意義。