谷 飆
(西南財(cái)經(jīng)大學(xué) 人文學(xué)院,成都 611130)
?
從蒙提·霍爾問(wèn)題看認(rèn)知計(jì)算
谷飆
(西南財(cái)經(jīng)大學(xué) 人文學(xué)院,成都611130)
摘要:蒙提·霍爾問(wèn)題涉及如何界定決策中的隨機(jī)事件、如何刻畫(huà)決策者的認(rèn)知和概率計(jì)算。通過(guò)與相關(guān)抽彩問(wèn)題的比較和認(rèn)知計(jì)算得出的結(jié)論是:標(biāo)準(zhǔn)概率論在蒙提·霍爾問(wèn)題的概率計(jì)算中仍然有效,但采用樸素條件化概率忽略了問(wèn)題情境中的認(rèn)知因素;改變選擇的決策在原問(wèn)題中是期望效用最大化意義上合理的,但其推理論證存在邏輯循環(huán),關(guān)于概率轉(zhuǎn)移的解釋是錯(cuò)誤的。蒙提·霍爾問(wèn)題表明不確定性決策中認(rèn)知推理和概率計(jì)算之間不協(xié)調(diào)。這個(gè)悖論說(shuō)明決策合理性與相應(yīng)認(rèn)知推理的邏輯可證性不等價(jià),差異源于概率計(jì)算和不確定性推理依賴認(rèn)知編碼,這意味著隨機(jī)性的知識(shí)是不可證的。
關(guān)鍵詞:蒙提·霍爾問(wèn)題;認(rèn)知計(jì)算;邏輯有效性;決策合理性
所有的博弈和決策問(wèn)題都要涉及認(rèn)知計(jì)算,認(rèn)知事件的描述和決策問(wèn)題的表征是決策的關(guān)鍵環(huán)節(jié)。認(rèn)知與計(jì)算的關(guān)系一直是認(rèn)知領(lǐng)域爭(zhēng)論的焦點(diǎn)。從邏輯的角度說(shuō)就是“認(rèn)知推理能否歸結(jié)為計(jì)算”。認(rèn)知科學(xué)中提出過(guò)“為了理解大腦的認(rèn)知功能,必須了解這一系統(tǒng)的計(jì)算目標(biāo)”的論題,但確定完整認(rèn)識(shí)活動(dòng)的計(jì)算框架和規(guī)模是不大可能的,尤其是在不確定決策中控制認(rèn)知和決策的概率計(jì)算依賴于隨機(jī)事件的認(rèn)知描述,使得上述論題受到質(zhì)疑[1]112。認(rèn)知與計(jì)算之間的糾纏是形形色色的認(rèn)知疑難和決策悖論的根源,因而,解析認(rèn)知決策悖論,玩一玩思維的魔方,也成為認(rèn)知決策研究中風(fēng)景獨(dú)異的一條進(jìn)路。
一、蒙提·霍爾問(wèn)題中的概率計(jì)算
蒙提·霍爾問(wèn)題(Monty Hall problem)源自抽獎(jiǎng)游戲。這個(gè)游戲的規(guī)則是:參賽者面對(duì)3扇關(guān)閉的門(mén),其中一扇門(mén)的后面有汽車,選中后面有汽車的那扇門(mén)就可以贏得該汽車。而另外兩扇門(mén)后面則各藏有一只山羊。當(dāng)參賽者選定了一扇門(mén),節(jié)目主持人會(huì)打開(kāi)剩下兩扇門(mén)中的一扇,露出其中一只山羊。主持人其后會(huì)問(wèn)參賽者是否改變選擇,即,是放棄原來(lái)選的門(mén)換成剩下的沒(méi)打開(kāi)的那扇門(mén)還是堅(jiān)持原來(lái)的選擇。計(jì)算和決策問(wèn)題是:在一扇門(mén)被打開(kāi)的條件下原來(lái)選的門(mén)和剩下的門(mén)后面有汽車的概率是多少?改變選擇的期望效用值是否高于堅(jiān)持原來(lái)選擇的期望效用值?
主張改變選擇的觀點(diǎn)認(rèn)為,換一扇門(mén)中獎(jiǎng)幾率為2/3,如果不換門(mén)中獎(jiǎng)幾率為1/3,因而選擇換一扇門(mén)是合理的。其中,莎凡特的論證最有代表性。她解釋說(shuō):“當(dāng)你第一次從3扇門(mén)中選擇1號(hào)門(mén)時(shí),該門(mén)后有汽車的可能性為1/3,而另外兩扇門(mén)后有獎(jiǎng)的可能性為2/3。但此時(shí),主持人出場(chǎng),給你提供一條新線索。如果獎(jiǎng)品在2號(hào)門(mén)后,主持人會(huì)開(kāi)3號(hào)給你看,如果獎(jiǎng)品在3號(hào)門(mén)后,他則會(huì)開(kāi)2號(hào)門(mén)。因此,如果你選擇換門(mén),那么假如獎(jiǎng)品在2號(hào)或3號(hào)門(mén)后你都將獲勝。但如果你不換門(mén),只有當(dāng)獎(jiǎng)品在1號(hào)門(mén)后時(shí)才能獲勝。”在她看來(lái),解決這個(gè)問(wèn)題的關(guān)鍵是主持人,因?yàn)樗J(rèn)為主持人總是會(huì)挑后面沒(méi)有獎(jiǎng)品的門(mén)。這里的概率計(jì)算問(wèn)題是,為什么“主持人提供的一條新線索”沒(méi)有改變已選擇那扇門(mén)中獎(jiǎng)的概率,卻更新了剩下那扇門(mén)的概率呢?改變論者給出了兩種解釋。一種說(shuō)法:主持人打開(kāi)了剩下兩扇門(mén)中的一扇空門(mén)這件事并不能改變“參賽人選擇的門(mén)中獎(jiǎng)機(jī)會(huì)為1/3”這一概率設(shè)定,這一信息對(duì)概率沒(méi)有影響;另一種說(shuō)法:另外兩扇門(mén)后有獎(jiǎng)的可能性為2/3,如果其中一扇沒(méi)有中獎(jiǎng),那么改選另一扇門(mén)的中獎(jiǎng)機(jī)會(huì)為2/3。雖然這兩種說(shuō)法對(duì)于信息的作用語(yǔ)焉不詳,但都使用了這樣一個(gè)認(rèn)知計(jì)算: P(A∪B)=a,~B?P(A)=a。那么,這一計(jì)算是否正確呢?
我們先來(lái)回顧古典概率模型中的一個(gè)命題——抽彩的順序無(wú)關(guān)性:在一個(gè)等概抽彩中,一張彩票的中獎(jiǎng)概率與抽取的先后順序無(wú)關(guān)。例如,一個(gè)抽彩中只有3張彩票,其中僅有一張能中獎(jiǎng)。3個(gè)抽獎(jiǎng)?wù)呒住⒁摇⒈来纬榈骄幪?hào)為1、2、3的彩票,3人得獎(jiǎng)的概率均為1/3。具體地說(shuō),甲第一個(gè)抽取時(shí)是從概率相等的3張彩票隨機(jī)地抽一張,根據(jù)等概條件,他所抽到的1號(hào)彩票中獎(jiǎng)概率為1/3;乙第二個(gè)抽取時(shí)是在剩下的兩張中抽一張,他抽到的2號(hào)彩票中獎(jiǎng)為1/3=((3-1)!/(3-2)!)/(3!/(3-2)!)=2!/3!。輪到丙抽取時(shí),他只能“抽到”剩下的3號(hào)彩票,但這張彩票中獎(jiǎng)的概率和前兩張一樣是1/3=((3-1)!/(3-3)!)/(3!/(3-3)!)=2!/3!。這一看似乏味的計(jì)算意在說(shuō)明,等概性不受抽取順序的影響,而且在一系列隨機(jī)事件下等概性可以保持。假設(shè)3個(gè)人中乙是急性子,不等其他人揭曉就把剛抽到的彩票撕開(kāi)了發(fā)現(xiàn)沒(méi)中獎(jiǎng),此時(shí)已抽到1號(hào)彩票的甲得獎(jiǎng)的概率變?yōu)?/2,還未來(lái)得及抽取的丙得獎(jiǎng)的概率也是為1/2。為了說(shuō)明這一計(jì)算,用A記“第i號(hào)中獎(jiǎng)”, 用B記“第j號(hào)沒(méi)中獎(jiǎng)”,i≠j, P(A)=1/3,B的概率P(B)=2/3,得知事件B發(fā)生后A的條件概率P(A|B)=P(A∩B)/ P(B)=1/3/2/3=1/2。 上式中A∩B表示事件“第i號(hào)中獎(jiǎng)并且第j號(hào)沒(méi)中獎(jiǎng)”,由A?B知 P(A∩B)=P(A)。
不難發(fā)現(xiàn),推理P(A∪B)=a,~B?P(A)=a是選言推理否定肯定式“A∪B,~B?A”的一種變形。差別在于,否定肯定式中A∪B是設(shè)定為真的前提,概率表示為P(A∪B)=1,當(dāng)假設(shè)~B為真即P(~B)=1時(shí),可以衍推P(A)=1。對(duì)于概率a≠1的事件A∪B以及A,上述計(jì)算只有當(dāng)~B與A∪B的補(bǔ)事件c獨(dú)立才成立:
P(c)P(~B)=P(c∩~B)? P(c|~B)=
P(c∩~B)/ P(~B)=P(c)
?P(A |~B)=P(A∪B|~B)=P((A∪B)∩~B)/ P(~B)=a。
莎凡特的論證中“打開(kāi)剩下兩扇門(mén)中的一扇是空門(mén)”與 “參賽人選擇的門(mén)中獎(jiǎng)”的獨(dú)立性并不是題設(shè)前提,莎凡特將這一待證結(jié)論當(dāng)作前提,做了一個(gè)循環(huán)論證。
概率論學(xué)者提出了相反的意見(jiàn)。他們按照 “無(wú)差別原則”和已知信息,設(shè)事件B “打開(kāi)的門(mén)有山羊”的概率P(B)=2/3與事件A“參加者選擇的門(mén)有汽車”的先驗(yàn)概率P(A)=1/3,以及事件A∩B “打開(kāi)的門(mén)有山羊并且參加者選擇的門(mén)有汽車”的先驗(yàn)概率P(A∩B)=1/3,然后計(jì)算可得:
P(A|B)= P(A∩B)/ P(B)=1/3/2/3 =1/2≠1/3=P(A)
這一計(jì)算得出的是樸素條件概率,其中只要事件B的概率P(B)≠0,那么條件概率P(A|B)= P(A∩B)/ P(B)就有定義。如果兩個(gè)事件A與B是相互獨(dú)立的,即等式P(A)P(B)= P(A∩B)成立,則P(A|B)= P(A∩B)/ P(B)= P(A),表明事件B已發(fā)生的信息不改變事件A的初始概率,否則B已發(fā)生的信息會(huì)導(dǎo)致事件A的概率更新。在蒙提·霍爾問(wèn)題中,這一計(jì)算預(yù)設(shè)事件B “打開(kāi)的門(mén)有山羊”是隨機(jī)的,它與事件B*“打開(kāi)一扇有山羊的門(mén)”不同,后者可能是主持人的認(rèn)知行為。由P(A) P(B)≠P(A)可知事件A與B是相關(guān)的,因而得知事件B“打開(kāi)的門(mén)有山羊”會(huì)改變事件A“參加者選擇的門(mén)有汽車”的概率。這一條件概率之所以被稱為“樸素的”,是因?yàn)楹雎粤酥鞒秩说恼J(rèn)知行動(dòng)特征,將其行動(dòng)條件簡(jiǎn)單等同于隨機(jī)事件“一扇門(mén)被打開(kāi)其中有山羊”。
二、交互認(rèn)知:我知道什么?別人知道什么?我如何知道別人知道什么?

(一)兩種認(rèn)知條件預(yù)設(shè)
如前所述,蒙提·霍爾問(wèn)題上認(rèn)為不必改變選擇的論證是以樸素條件概率計(jì)算為基礎(chǔ)的,它將主持人的行動(dòng)結(jié)果簡(jiǎn)單等同于一個(gè)隨機(jī)事件“一扇門(mén)被打開(kāi)其中有山羊”,其預(yù)設(shè)是主持人隨機(jī)地打開(kāi)剩下兩扇門(mén)中的一扇;認(rèn)為應(yīng)該改變選擇的論證預(yù)設(shè)的是主持人知道哪扇門(mén)中有汽車哪扇門(mén)中有山羊,主持人的行為不是隨機(jī)的,而是有意 “打開(kāi)一扇有山羊的門(mén)”。不過(guò),這兩種認(rèn)知預(yù)設(shè)都不在該游戲規(guī)則中,也不能從決策情境中推出。對(duì)于一個(gè)第一次玩游戲的局中人,當(dāng)他選擇一扇門(mén)后等待驗(yàn)證自己的好運(yùn)氣時(shí)看到蒙提·霍爾打開(kāi)另一扇門(mén)發(fā)現(xiàn)其中有山羊,他會(huì)如何推斷蒙提·霍爾的行為特征?在這樣的情境下,參賽者可能考慮的絕不僅限于上面兩種認(rèn)知預(yù)設(shè),他可能做出各種猜測(cè)。例如,“主持人喜歡在參賽者已選了有汽車的門(mén)時(shí)打開(kāi)一扇有山羊的門(mén)”或“主持人只在參賽者選了有山羊的門(mén)時(shí)打開(kāi)有山羊的另一扇門(mén)”,不同猜測(cè)下選擇也截然不同。
(二)認(rèn)知條件與計(jì)算模擬
在支持改變選擇的論證中,論者強(qiáng)調(diào)主持人知道大獎(jiǎng)在哪扇門(mén)中,并將這一認(rèn)知條件作為概率推理的基礎(chǔ)。Mueser 和 Granberg 為主持人的認(rèn)知和行為做了明確的限制,提出了完整的問(wèn)題描述[2]312:
(1)參賽者在3扇門(mén)中選一扇。他不知道門(mén)后是什么。主持人知道每扇門(mén)后面有什么。
(2)主持人必須開(kāi)啟剩下兩扇門(mén)中的一扇,并且必須給參賽者提供換門(mén)的機(jī)會(huì)。
主持人永遠(yuǎn)都會(huì)開(kāi)啟一扇有山羊的門(mén)。
a.如果參賽者挑選了一扇有山羊的門(mén),主持人必須開(kāi)啟另一扇有山羊的門(mén);
b.如果參賽者挑選了一扇有汽車的門(mén),主持人隨機(jī)開(kāi)啟另外兩扇門(mén)中的一扇。
(3)參賽者會(huì)被問(wèn)是堅(jiān)持他的原來(lái)的選擇,還是選擇剩下的那一扇門(mén)。
在上述約束條件下,我們用 B*表示“主持人打開(kāi)一扇有山羊的門(mén)”,這是由一個(gè)規(guī)則確定的事件,計(jì)算相應(yīng)的條件概率:P(A|B*)=P(A∩B*)/ P(B*)=1/3 。用P(C|B*)表示“主持人打開(kāi)一扇有山羊的門(mén)的條件下剩下那扇門(mén)后有汽車”,則P(C|B*)=1- P(A|B*)=2/3。這一結(jié)果與改變選擇論證中的結(jié)果相同,但這里的計(jì)算將B*作為一個(gè)確定事件,因而A與B*獨(dú)立,得到P(A|B*)= P(A),后一等式利用了條件事件(C|B*)與(A|B*)的互補(bǔ)性,在避開(kāi)循環(huán)論證后得到P(C|B*)=1- P(A|B*)。
在這一“完整的”問(wèn)題描述中,將“主持人知道每扇門(mén)后面有什么”作為推算的前提條件,那么這個(gè)條件對(duì)于參賽者的決定會(huì)產(chǎn)生什么影響呢?它能否使支持改變選擇的論證得到邏輯辯護(hù)?按照上面的限制條件(1),參賽者知道 “3個(gè)門(mén)后面有且僅有一個(gè)是汽車”,因而應(yīng)用“無(wú)差別原則”對(duì)它們賦予相等的概率或信念度;這里并沒(méi)有說(shuō)明“主持人知道每扇門(mén)后面有什么”是參賽者與主持人之間的共同知識(shí)。另一方面,條件(2)要求“主持人永遠(yuǎn)都會(huì)開(kāi)啟一扇有山羊的門(mén)”,并不衍推“主持人知道每扇門(mén)后面有什么”,主持人的認(rèn)知條件對(duì)前者是不必要的。條件(3)中主持人會(huì)問(wèn)參賽者“是堅(jiān)持他的原來(lái)的選擇,還是選擇剩下的那一扇門(mén)”,并沒(méi)有增加主持人與參賽者的相互認(rèn)知信息。
由上述分析可知,“主持人知道每扇門(mén)后面有什么”對(duì)于“打開(kāi)一扇沒(méi)有汽車的門(mén)”不是必要條件;另一方面,它也不是充分條件——知道以及應(yīng)該不能衍推行為。比如說(shuō),主持人在輪到他打開(kāi)一扇沒(méi)有大獎(jiǎng)的門(mén)時(shí)忘記了獎(jiǎng)在哪扇門(mén)中,但是仍然打開(kāi)了一扇門(mén),結(jié)果其中沒(méi)有大獎(jiǎng)。這可不是意外,對(duì)于n扇門(mén)游戲,隨機(jī)打開(kāi)一扇其中沒(méi)有大獎(jiǎng)的可能性為(n-1)/n。為了避免確定認(rèn)知條件的困難,可以將游戲的主持人換為自動(dòng)機(jī),自動(dòng)機(jī)可以完成主持人在游戲中的所有任務(wù),其規(guī)則為:
a.如果參賽者挑選了一扇有山羊的門(mén),自動(dòng)機(jī)必須開(kāi)啟另一扇有山羊的門(mén);
b.如果參賽者挑選了一扇有汽車的門(mén),自動(dòng)機(jī)隨機(jī)開(kāi)啟另外兩扇門(mén)中的一扇。
用自動(dòng)機(jī)代替主持人意在消除限制條件中認(rèn)知概念帶來(lái)的含混性,其直接后果是:剩下的哪扇門(mén)被打開(kāi)不再是認(rèn)知推理的結(jié)果,而是以參賽者的選擇為前件的“如果,則”規(guī)則的運(yùn)行。在以上述自動(dòng)機(jī)為原型的計(jì)算機(jī)模擬實(shí)驗(yàn)中,參賽者不改變?cè)羞x擇獲獎(jiǎng)的比例是1/3左右,改變選擇獲獎(jiǎng)的比例是2/3左右[3]168。
(三)直覺(jué)悖論與自欺論證
有論者認(rèn)為,蒙提·霍爾問(wèn)題的支持改變選擇的推理,以及計(jì)算機(jī)模擬的結(jié)果是反直覺(jué)悖論,那么論者所謂直覺(jué)是什么呢?直覺(jué)一詞頗多歧義,人們所指出的反直覺(jué)之處也不盡相同。有一個(gè)反對(duì)莎凡特論證的游戲設(shè)置是這樣的:游戲中有100扇門(mén),它們之中只有一扇門(mén)后有汽車大獎(jiǎng),當(dāng)參賽者選擇1號(hào)門(mén)后,主持人打開(kāi)了從2號(hào)到99號(hào)的所有的門(mén),其中沒(méi)有大獎(jiǎng),那么參賽者在已選的1號(hào)門(mén)與剩下的100號(hào)門(mén)之間該做何選擇呢?按照莎凡特論證,1號(hào)門(mén)中獎(jiǎng)概率仍然是1%,而100號(hào)門(mén)中獎(jiǎng)概率變?yōu)?9%,這可能嗎?這一論證揭露了莎凡特論證中的兩個(gè)反直覺(jué)之處。第一個(gè)是:游戲中參賽者最初的選項(xiàng)總是“不好的”,改變?cè)瓉?lái)的選擇才是合理的。第二個(gè)是:主持人的行動(dòng)總是帶來(lái)提高參賽者獲得大獎(jiǎng)概率的信息。倘若后者是主持人行動(dòng)的意圖,實(shí)施這一意圖的行動(dòng)應(yīng)該是 “主持人在參賽者已選了有山羊的門(mén)時(shí)打開(kāi)另一扇有山羊的門(mén),并且,在參賽者已選了有汽車的門(mén)時(shí)不打開(kāi)其他的門(mén)”,這樣,“主持人總是打開(kāi)一扇有山羊的門(mén)”就不再是游戲的規(guī)則,參賽者和觀眾看到的應(yīng)該是“主持人有時(shí)會(huì)打開(kāi)一扇有山羊的門(mén)”讓參賽者再做一次選擇。但是,主持人有選擇的行動(dòng)是否是幫助參賽者獲得大獎(jiǎng)?正如哈爾澎所指出,主持人選擇是否打開(kāi)一扇有山羊的門(mén)可能出于相反的意圖:“主持人喜歡在參賽者已選了有汽車的門(mén)時(shí)打開(kāi)一扇有山羊的門(mén)”。因而,需要更仔細(xì)地考察主持人的行動(dòng)規(guī)則才能避免陷入反直覺(jué)論證陷阱[4]217。
在這個(gè)游戲中,對(duì)參賽者選擇的門(mén)、主持人打開(kāi)的門(mén),以及其他各扇門(mén)均做了相應(yīng)的編碼,這對(duì)于認(rèn)知推理和概率計(jì)算是必要的。沒(méi)有編碼就沒(méi)有認(rèn)知,也就沒(méi)有確定性和不確定性的區(qū)分。相對(duì)于兩個(gè)序列的編碼,認(rèn)知確定性是指兩個(gè)序列的編碼間的確定匹配,認(rèn)知不確定性是指兩個(gè)序列的編碼間的隨機(jī)匹配。在上述編碼下,當(dāng)參賽者選擇了i號(hào)門(mén),主持人可以按照某一順序打開(kāi)一系列門(mén),他隨機(jī)地打開(kāi)除i號(hào)門(mén)之外的第一扇門(mén)后沒(méi)有大獎(jiǎng)的概率是99%,隨機(jī)地打開(kāi)第二扇門(mén)門(mén)后沒(méi)有大獎(jiǎng)的概率是98/99,……,當(dāng)他打開(kāi)第98扇門(mén),其后沒(méi)有大獎(jiǎng)的概率為2/3。此時(shí),另外兩扇門(mén)中有大獎(jiǎng)的概率取決于他是如何打開(kāi)這扇門(mén)的,換句話說(shuō),回到了原先的三門(mén)游戲。
由此可以看出,莎凡特論證中將復(fù)合事件“大獎(jiǎng)在參賽者選定門(mén)之外的其他門(mén)中”的概率轉(zhuǎn)移到“大獎(jiǎng)在剩下的一扇門(mén)”這一事件上,無(wú)論是假設(shè)“主持人知道每扇門(mén)后面有什么”還是認(rèn)為“主持人隨機(jī)打開(kāi)某些門(mén)”,其推理都是錯(cuò)誤的。另一方面,當(dāng)打開(kāi)第98扇門(mén)時(shí)決策問(wèn)題回到了蒙提·霍爾游戲,如前所說(shuō),這時(shí)改變選擇在期望收益最大化的意義上是合理的。在蒙提·霍爾游戲中,參賽者最初的“選擇”是隨機(jī)的,在一扇門(mén)打開(kāi)后堅(jiān)持這一選擇得到大獎(jiǎng)的概率不會(huì)高于另一扇,改變選擇的決策是在弱意義下——不比堅(jiān)持原選擇更差——是合理的,因?yàn)橹С指淖冞x擇的計(jì)算僅僅在特定的問(wèn)題情境(三門(mén)游戲)中才適用。
如果從莎凡特論證得出 “改變?cè)瓉?lái)的選擇才是合理的”,那么這一論證是自我否定的。假設(shè)有一個(gè)參賽者做了這樣的推理:1、2、3號(hào)門(mén)中奇數(shù)號(hào)門(mén)有兩個(gè),偶數(shù)號(hào)門(mén)只有一個(gè),她有了一個(gè)先驗(yàn)信念:大獎(jiǎng)在奇數(shù)號(hào)門(mén)中的可能性比在偶數(shù)號(hào)門(mén)中的可能性大,并且接受了莎凡特論證,她首先“選擇”了2號(hào)門(mén),然后看著蒙提·霍爾打開(kāi)了3號(hào)門(mén)是空門(mén)。當(dāng)蒙提·霍爾像往常一樣等待她“改變選擇”時(shí),她對(duì)蒙提·霍爾說(shuō):“我當(dāng)然會(huì)選剩下的,不過(guò),那就是我最初的選擇。”悖謬在于,接受莎凡特論證意味著 “改變?cè)瓉?lái)的選擇才是合理的”成為先驗(yàn)信息,這使得參賽者可以 “先選擇一扇我不看好的門(mén)”。
莎凡特為了強(qiáng)化她的論證列出了兩張表,第一張表將三門(mén)編號(hào)為1、2、3,列出了大獎(jiǎng)汽車在1、2、3號(hào)門(mén)后面而參賽者選擇1號(hào)門(mén)時(shí)可能的場(chǎng)合,第二張?jiān)谕痪幪?hào)下列出了參賽者最初選擇1號(hào)門(mén)而后改變選擇可能的場(chǎng)合,莎凡特將兩張表中得到汽車大獎(jiǎng)的場(chǎng)合占全部場(chǎng)合的比例分別稱為“堅(jiān)持原來(lái)選擇(1號(hào)門(mén))得大獎(jiǎng)的概率 ”和“改變想法另外選擇得到大獎(jiǎng)的概率 ”。為明晰起見(jiàn),列出修改過(guò)的對(duì)比表,見(jiàn)表1。

表1 得大獎(jiǎng)概率
從表1看出,若將獲得大獎(jiǎng)的概率等同于有利場(chǎng)合所占比例,則初選1號(hào)門(mén)獲得大獎(jiǎng)的概率為1/3,爭(zhēng)議點(diǎn)是如何認(rèn)定主持人開(kāi)門(mén)后應(yīng)計(jì)入的場(chǎng)合與有利于獲大獎(jiǎng)的場(chǎng)合:莎凡特將堅(jiān)持原有選擇獲獎(jiǎng)的有利場(chǎng)合等同于初選1號(hào)門(mén)獲得大獎(jiǎng)的有利場(chǎng)合,而將第一行中主持人打開(kāi)3號(hào)門(mén)或打開(kāi)2號(hào)門(mén)算作一個(gè)有利場(chǎng)合,這實(shí)際上是假設(shè)主持人打開(kāi)另外的哪扇門(mén)不影響參賽者的選擇;而她計(jì)算參賽者改變選擇獲得大獎(jiǎng)的概率卻將主持人打開(kāi)2號(hào)門(mén)(第二行)、打開(kāi)3號(hào)門(mén)(第三行)算作兩個(gè)有利場(chǎng)合。事實(shí)上,在參賽者改變選擇的場(chǎng)合中,第一行主持人打開(kāi)3號(hào)門(mén)或打開(kāi)2號(hào)門(mén)對(duì)應(yīng)于參賽者改選2號(hào)門(mén)或改選3號(hào)門(mén),是兩個(gè)不利的場(chǎng)合。在沒(méi)有其他信息的條件下,參賽者不能分辨第一行主持人打開(kāi)3號(hào)門(mén)與第二行主持人打開(kāi)3號(hào)這兩個(gè)場(chǎng)合,同樣也不能分辨第一行主持人打開(kāi)2號(hào)門(mén)與第三行主持人打開(kāi)2號(hào)這兩個(gè)場(chǎng)合。如果主持人是隨機(jī)打開(kāi)3號(hào)門(mén)或2號(hào)門(mén)并且其后有山羊,則堅(jiān)持選擇1號(hào)門(mén)獲大獎(jiǎng)的有利場(chǎng)合與不利場(chǎng)合之比為1∶1,改變選擇獲大獎(jiǎng)的有利場(chǎng)合與不利場(chǎng)合之比亦為1∶1。換句話說(shuō),將表1中第一行分成兩行計(jì)算有利場(chǎng)合與不利場(chǎng)合,就得到前述樸素條件概率。莎凡特關(guān)于堅(jiān)持原有選擇和改變選擇獲大獎(jiǎng)有利場(chǎng)合的計(jì)算源于其循環(huán)論證,即預(yù)設(shè)“主持人打開(kāi)2號(hào)門(mén)其后有山羊或打開(kāi)3號(hào)門(mén)其后有山羊”獨(dú)立于“參賽者最初選擇的門(mén)后有汽車”這一事件。
莎凡特列表中門(mén)的編號(hào)實(shí)際是一種編碼,在推理和決策分析中編碼標(biāo)識(shí)狀態(tài)、行動(dòng)、結(jié)果,理性決策者的認(rèn)知與計(jì)算總是在一定編碼下刻畫(huà)和分析。但是,合理的認(rèn)知計(jì)算不依賴于特定的編碼。表1第一行“主持人打開(kāi)3號(hào)或2號(hào)”是指主持人可以隨機(jī)打開(kāi)兩扇門(mén)中一扇門(mén),這一不確定性對(duì)應(yīng)于主持人行動(dòng)與兩扇門(mén)的某種編碼下的隨機(jī)匹配,這就產(chǎn)生了一系列問(wèn)題:參賽者關(guān)于各扇門(mén)的編碼與主持人的編碼一致嗎?如果一致,參賽者如何知道主持人的行動(dòng)選擇是在該編碼下是確定匹配還是隨機(jī)匹配?如果一定編碼是預(yù)先給定的,該編碼下選擇匹配就沒(méi)有時(shí)間性,“最初選擇”或“新的選擇”僅僅是編碼中的不同匹配序列。蒙提·霍爾問(wèn)題引出的認(rèn)知編碼的兩個(gè)問(wèn)題,這里先指出第一個(gè):參賽者“改變選擇”是否歸因于 “改變想法”,即表示行動(dòng)轉(zhuǎn)變的編碼序列是否對(duì)應(yīng)于表示認(rèn)知狀態(tài)的編碼序列的轉(zhuǎn)換?
三、認(rèn)知計(jì)算
蒙提·霍爾問(wèn)題又稱為“三門(mén)問(wèn)題”,如果改變門(mén)和獎(jiǎng)的數(shù)量,那么原來(lái)支持改變和支持不改變的論證會(huì)產(chǎn)生什么結(jié)論呢?以下構(gòu)造一個(gè)變體——“六門(mén)問(wèn)題”說(shuō)明認(rèn)知計(jì)算在這類問(wèn)題中的作用。6扇門(mén)中,有2扇門(mén)門(mén)后有獎(jiǎng)品,4扇門(mén)門(mén)后沒(méi)有,游戲規(guī)則是:
(1)參賽者在6扇門(mén)中隨機(jī)挑選1扇門(mén)。
(2)主持人開(kāi)啟剩下5扇門(mén)中的3扇,如果其中有2扇門(mén)門(mén)后有獎(jiǎng)品,游戲結(jié)束。
(3)如果其中有1扇門(mén)門(mén)后有獎(jiǎng)品,或其中3扇門(mén)都是空門(mén),參賽者會(huì)被問(wèn)是堅(jiān)持他的原來(lái)的選擇,還是選擇剩下的2扇門(mén)中的任一扇門(mén)。
當(dāng)打開(kāi)的3扇門(mén)都是空門(mén)時(shí),利用逆概率公式不難計(jì)算,參賽者已選的門(mén)有獎(jiǎng)的概率是2/3,此時(shí)改選是以2/3中獎(jiǎng)概率換取1/2的中獎(jiǎng)概率和1/3概率換取中獎(jiǎng),其期望效用仍然是2/3。總之,改選不會(huì)增加期望效用值。
當(dāng)打開(kāi)的2扇門(mén)是空門(mén)時(shí),參賽者已選的門(mén)是空門(mén)的概率是2/3,此時(shí)改選將得獎(jiǎng)的概率是1/2;參賽者已選的門(mén)有獎(jiǎng)的概率是1/3,此時(shí)改選將得獎(jiǎng)的概率是0。此時(shí),改變選擇和不改變選擇的期望值都是1/3。
在這兩種情形下,主持人問(wèn)參賽者是否改選后,可以再打開(kāi)一扇門(mén),使得3扇空門(mén)和1扇有獎(jiǎng)門(mén)已打開(kāi),就回到了“三門(mén)問(wèn)題”。可以看出,“六門(mén)問(wèn)題”的決策除了增加一些隨機(jī)事件的計(jì)算外,并沒(méi)有改變問(wèn)題的實(shí)質(zhì)。可以證明,類似的“多門(mén)問(wèn)題”都可以歸結(jié)為“三門(mén)問(wèn)題”。兩種決策建議的論證中,莎凡特論證使用了啟發(fā)式信息,素樸條件化論證只使用樣本信息,這是該決策問(wèn)題中認(rèn)知和計(jì)算的兩種類型。
上述兩種決策都可以用包含狀態(tài)集、初始狀態(tài)、行動(dòng)函數(shù)、轉(zhuǎn)換函數(shù)的自動(dòng)機(jī)表示。其中行動(dòng)函數(shù)確定了局中人在相應(yīng)博弈中的行動(dòng)規(guī)則,轉(zhuǎn)換函數(shù)是狀態(tài)隨著行動(dòng)變化的描述。蒙提·霍爾游戲可以這樣進(jìn)行:輸入是編號(hào)1,2,3中的任意一個(gè),當(dāng)自動(dòng)機(jī)掃描到i,則狀態(tài)轉(zhuǎn)換到f(q,i)=a并轉(zhuǎn)向編號(hào)j。后面每個(gè)階段的博弈是重復(fù)上述行動(dòng)和轉(zhuǎn)換程序。不同的游戲規(guī)則用不同的自動(dòng)機(jī)模擬,具體轉(zhuǎn)換依賴于在獎(jiǎng)品放置序列與門(mén)的選擇、開(kāi)啟序列之間的編碼匹配。計(jì)算機(jī)模擬蒙提·霍爾游戲展示了決策合理性的一種確證方式:如果概率計(jì)算在一種可行的計(jì)算下帶來(lái)期望收益最大化,則概率計(jì)算是合理的。決策論中描述選擇行為的模型是理性、認(rèn)知和行動(dòng)組成的三元組,其中合理性包括行動(dòng)選擇的合理性和認(rèn)知合理性,即決策者具有完善的邏輯推理能力和計(jì)算能力,理性選擇是局中人認(rèn)知計(jì)算的結(jié)果。用計(jì)算機(jī)程序估計(jì)堅(jiān)持選擇A門(mén)和選擇另一扇門(mén)的獲勝概率分別是多少,體現(xiàn)決策合理性中計(jì)算的作用。根據(jù)這個(gè)游戲的計(jì)算機(jī)模擬結(jié)果的統(tǒng)計(jì),那些選擇換門(mén)的玩家獲勝得獎(jiǎng)的幾率是沒(méi)有選擇換門(mén)者的兩倍。需要指出,用計(jì)算機(jī)重復(fù)游戲中“好”策略的取勝頻率并不代表該策略的概率計(jì)算和邏輯論證有效,至多表明其認(rèn)知推理及計(jì)算在一定條件下是自我實(shí)現(xiàn)的。這里涉及與編碼有關(guān)的第二個(gè)問(wèn)題:如果隨機(jī)自動(dòng)模擬游戲局中人的認(rèn)知行動(dòng),假定主持人知道上述編碼匹配,那么,他的認(rèn)知行動(dòng)在何種意義上是確定的或隨機(jī)的?是否有人完全知道變量序列{xi}與參數(shù){θi}序列的編碼匹配,同時(shí)又知道這種匹配是隨機(jī)的?在另一些條件下(比如說(shuō)多門(mén)蒙提·霍爾游戲中允許主持人或模擬其角色的自動(dòng)機(jī)表現(xiàn)博弈論所說(shuō)的遺忘或顫抖的手),自我實(shí)現(xiàn)的預(yù)言就可能轉(zhuǎn)為自我否定的預(yù)言。
蒙提·霍爾問(wèn)題表明,期望效用最大化作為合理性準(zhǔn)則在抽彩游戲及其計(jì)算機(jī)模擬中可能是“成功”的,但在具體問(wèn)題情境中需要引入某些啟發(fā)式信息,它們提供了認(rèn)知推理的前提,而確定它們自身的可信性需要另外的認(rèn)知前提,推理鏈條如此延伸會(huì)導(dǎo)致認(rèn)知計(jì)算“爆炸”[5]224。在這一問(wèn)題中,概率計(jì)算與推理論證相比要簡(jiǎn)單得多,反映出不確定決策的合理性準(zhǔn)則與認(rèn)知推理的邏輯標(biāo)準(zhǔn)的差異,這種差異在使用認(rèn)知編碼及其隨機(jī)匹配分析計(jì)算和推理的關(guān)系時(shí)顯現(xiàn)為不協(xié)調(diào)性,這啟發(fā)我們做出這樣的推測(cè):關(guān)于隨機(jī)性的知識(shí)是不可證的。
參考文獻(xiàn):
[1]格萊姆齊.決策不確定性與大腦 [M].賀京司,王曉嵐,李峰,等,譯.北京:中國(guó)人民大學(xué)出版社,2010:112-117.
[2]任曉明,陳曉平.決策博弈與認(rèn)知[M].北京:北京師范大學(xué)出版社,2014:306-314.
[3]魏振軍.探訪隨機(jī)世界 [M].北京:中國(guó)統(tǒng)計(jì)出版社, 2010:180.
[4]HALPERN J.Reasoning about uncertainty[M].Cambridge massachusetts:MIT press,2005:217.
[5]陳波.悖論研究[M].北京:北京大學(xué)出版社,2014:224.
(責(zé)任編輯張佑法)
Cognition and Computation in Monte Hall Problem
GU Biao
(School of Humanities, Southwest University of Finance and Economics, Chengdu 611130, China)
Abstract:Monte Hall Problem involves in how to identify random events in decision, how to show the cognitive decision makers and the probability computation. Comparing with the raffle issues related and cognitive computing, we concluded that standard probability is still valid in the calculation of probability in Monty Hall problem, but using simple conditional probability ignores the cognitive factors in the problem situation; In the original problem, the Changing selection decision is reasonably in the expected utility maximization sense, but his reasoning and argument exists logic loop, and the explanation about the transfer probability is wrong. Analysis shows that there is incoherence between cognitive reasoning and probability computation in Monty Hall problem. This paradox illustrates that decision rationality and corresponding cognitive reasoning logic are inequitable, and the differences is that the result of probability calculation and uncertainty reasoning depends on cognitive encoding, which implies improvability of knowledge about randomness.
Key words:Monte Hall Problem; cognitive computation; logical validity; decision rationality
文章編號(hào):1674-8425(2016)01-0005-07
中圖分類號(hào):B81
文獻(xiàn)標(biāo)識(shí)碼:A
doi:10.3969/j.issn.1674-8425(s).2016.01.002
作者簡(jiǎn)介:谷飆(1967—),男,四川營(yíng)山人,教授,哲學(xué)博士,研究方向:認(rèn)知邏輯、博弈方法論。
基金項(xiàng)目:國(guó)家社會(huì)科學(xué)基金重大項(xiàng)目“現(xiàn)代歸納邏輯的新發(fā)展、理論前沿與應(yīng)用研究”(15ZDB018)
收稿日期:2015-12-14
引用格式:谷飆.從蒙提·霍爾問(wèn)題看認(rèn)知計(jì)算[J].重慶理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)),2016(1):5-11.
Citation format:GU Biao.Cognition and Computation in Monte Hall Problem[J].Journal of Chongqing University of Technology(Social Science),2016(1):5-11.
悖論專題主持人語(yǔ):
北京大學(xué)陳波 教授
2015年11月28日,在北京大學(xué)哲學(xué)系舉辦了“悖論:研究與教學(xué)”小型研討會(huì),來(lái)自國(guó)內(nèi)高校從事悖論研究與教學(xué)的30多位學(xué)者參加了會(huì)議,還有近20位對(duì)悖論有興趣者列席了會(huì)議。會(huì)議開(kāi)得很成功,共有17位學(xué)者各做了25分鐘左右的發(fā)言和回答問(wèn)題,其中既有比較資深的教授和博士生導(dǎo)師,也有近些年國(guó)內(nèi)新培養(yǎng)出來(lái)的哲學(xué)博士,還有兩位民間悖論研究者,他們大都在發(fā)言中表現(xiàn)出很高的學(xué)術(shù)水準(zhǔn):在悖論研究方面既有比較扎實(shí)的知識(shí)基礎(chǔ),又有一些自己的獨(dú)立研究成果,并且都對(duì)推進(jìn)國(guó)內(nèi)高校的悖論教學(xué)表現(xiàn)出比較濃厚的興趣。與會(huì)者初步達(dá)成共識(shí):以后國(guó)內(nèi)的悖論研究者每年聚會(huì)一次,大家在一起交流新信息和新的研究成果,由此推動(dòng)國(guó)內(nèi)悖論研究和教學(xué)的深化。
我認(rèn)為,悖論具有很大的認(rèn)知價(jià)值,能夠開(kāi)拓視野,引發(fā)思考,啟迪智慧,值得推向大學(xué)通識(shí)教育課堂和社會(huì)普羅大眾。這是因?yàn)椋恒U撜n能夠給學(xué)生打開(kāi)一片理智天空;激發(fā)學(xué)生的理智好奇心;引導(dǎo)學(xué)生對(duì)問(wèn)題做獨(dú)立思考;引導(dǎo)學(xué)生去思考別人對(duì)問(wèn)題的思考;引導(dǎo)學(xué)生去分辨什么樣的思考是好的思考,什么樣的思考是不好的思考;培養(yǎng)一種健康、溫和的懷疑主義態(tài)度,羅素將其視為有良好教養(yǎng)的知識(shí)分子的基本品質(zhì);培養(yǎng)一種寬容和接納的文明態(tài)度,不要輕易地下關(guān)于對(duì)錯(cuò)的絕對(duì)判斷:走著瞧,等著看,看從某種觀點(diǎn)或方案中能夠發(fā)展出什么,衍生出什么,最后能夠做成什么。簡(jiǎn)而言之,悖論課能夠培養(yǎng)陳寅恪所熱情倡導(dǎo)的“獨(dú)立之精神,自由之思想”。有人談到:“自由精神是什么?我無(wú)法給它下定義,只能告訴你我自己的信念……自由的精神就是,對(duì)什么是正確的不那么確定的精神。”
這里選刊北大悖論會(huì)議的4篇論文。谷飚教授的論文從概率論和認(rèn)知邏輯的角度討論蒙提·霍爾問(wèn)題,后者出現(xiàn)在美國(guó)的一個(gè)熱門(mén)電視節(jié)目中,曾引起公眾參與度極高的大討論。劉靖賢博士和王永峰合寫(xiě)的論文回顧了羅素悖論、克里悖論、莫紹揆悖論和吉爾莫爾悖論與布勞威爾固定點(diǎn)定理和塔斯基固定點(diǎn)定理之間的內(nèi)在關(guān)聯(lián),進(jìn)而探討了無(wú)類型限制方案在二階羅素悖論中的應(yīng)用,并證明一系列相關(guān)結(jié)果。王晶博士和李小五教授合寫(xiě)的論文試圖證明:可知性悖論產(chǎn)生于Fitch-系統(tǒng)FS,其解決方案是通過(guò)弱化KP為RKP,建立推不出全知原則OMN的系統(tǒng)RKP。趙震博士的論文闡明了說(shuō)謊者悖論的產(chǎn)生與自指和否定的密切關(guān)系。