林 穎,張曉君
(1.寧德師范學院經濟管理系,福建 寧德352100;2.四川師范大學政治教育學院,成都610066)
信念-愿望-意圖理論及其形式化研究
林 穎1,張曉君2
(1.寧德師范學院經濟管理系,福建 寧德352100;2.四川師范大學政治教育學院,成都610066)
從Bratman(1987)的信念-愿望-意圖理論出發,考察了該理論在邏輯中的形式化,比如Cohen和Levesque(1990)的BDI邏輯。Bratman認為:信念、愿望和意圖在人的行為中扮演著重要的作用;意圖不僅僅是一個愿望,而且是主體不會輕易放棄的承諾;意圖具有慣性,而且是進一步實際推理的一個輸入;為了對信念、愿望和意圖加以區分,他引入了“前態度”的概念。Cohen和Levesque(1990)的BDI邏輯給出了Bratman(1987)的信念-愿望-意圖理論的形式語義,行動、時間、信念和偏好在此邏輯中占據著重要地位。
信念;愿望;意圖;偏好;BDI邏輯
做知識級分析的系統稱為主體(Agent),比如:人、具有智能的高級動物和仿人機器人均可視為A-gent)[1]。主體強調理性作用,是描述人類智能、動物智能和機器智能的統一模型[2]。在理性主體的設計過程中,信念(Belief)、愿望(Desire,或目標)和意圖(Intention①)所扮演的作用,哲學界和人工智能界的學者已經有了深刻的認識。大多數哲學理論認為,意圖可以化歸成信念和愿望。而 Bratman(1987)堅信,在實際推理的過程中,意圖扮演著重要而不同的作用,并提出了意圖規劃理論(planning theory of intention),把意圖看作是行為的部分規劃;認為在社會生產實際中,這些規劃支持我們的日常活動隨著時間的推移進行動態推理[3]。這為BDI(Belief-Desire-Intention,簡稱BDI)邏輯的形成和發展奠定了堅實的哲學基礎,并對人工智能產生了廣泛的影響。在經濟學方法論領域,與信念-愿望-意圖(BDI)理論十分相似的有A.羅森伯格提出的信念-行動-愿望(簡稱BAD)理論。該理論認為:經濟預測與主體的信念、行動和愿望的意向性解釋有關[4]。如果任一主體x的愿望是d,并且x相信“在當時情況下,如果采取行動a就能夠實現愿望d”,那么x就會采取行動a。
Bratman(1987)從民俗心理學理論的角度,解釋了信念、愿望和意圖是如何影響人類的行為決策和推理。當人工智能領域的學者把他的理論實際應用到人工主體時,就導致了面向主體的新的計算范例的程序設計技術的誕生。
信念和愿望在影響人類行為決策和推理的過程中起著重要的作用。Dennett(1987)[5]認為,作為理性主體的實體的行為選擇,似乎受其信念和愿望的操控。為了更為全面地理解人類實際行為推理,Bratman認為有必要引入意圖這一概念。意圖不僅僅是一個單純的愿望,而且還包含了主體不會很快放棄的承諾(commitment)。例如,一個主體的愿望是:能夠在北京大學做報告,這僅僅是一個單純的愿望,她不一定為了這個愿望而采取實際的措施,可能她受限于自身的條件(比如她連大學都沒有上過)。但如果一個主體有了明天要在北京大學做報告的意圖,這就不僅僅是個單純的愿望,她會采取實際的措施,并制定計劃來實現這個意圖(比如:取消其他計劃,或者確保筆記本已經裝在包里),除非特殊或意外情況發生,導致她取消這個意圖,不然她明天將在北京大學做報告。
Bratman把注意力集中在面向未來的意圖,這類意圖有別于面向當前的意圖。面向未來的意圖伴隨著主體的行動,更確切地說,伴隨主體的意圖行動(intentional actions)。為了對信念、愿望和意圖加以區分,Bratman引入了前態度(pre-attitude)的概念。前態度就是對主體行動起激勵作用的心智態度。愿望和意圖都是前態度,而信念則常常不是。意圖是對行為進行控制的前態度,而通常的愿望僅僅對行動有著潛在的影響。涉及未來導向意圖的承諾意愿大小,則是由意圖的行為控制特性決定的,作為行為控制的一個前態度,意圖常常涉及到對行動的一個特別承諾,而通常的愿望則沒有[6]。
除了把意圖等同于行為控制的前態度外,Bratman認為意圖還具有別的性質:意圖具有慣性(inertia),而且是進一步實際推理的一個輸入。意圖的慣性是指,意圖抵制對其進行再思考,一旦一個意圖形成(而且對行動的承諾也已經形成),意圖通常會保持其完整性直到行動時間到來。即:意圖具有穩定性或慣性。意圖會對進一步的行動決策和推理產生影響,意圖的精煉(對更具體行動的意圖)也會起作用[6]。例如,一個主體有了明天到北京大學做報告的意圖后,可以形成開車去北京大學做報告這樣更為具體的意圖。有了這第二個意圖后,考慮去北京大學的火車時刻表就不再合理,但在第一個意圖之后,這么考慮則是合理的。這就導致我們把意圖看成是,不同于信念和愿望的獨特的心智狀態。先前的意圖和計劃決定了待選項是否通過。意圖的這一特性就要求意圖和信念具有一致性:意圖是相對主體相信為真的世界而言的。
Bratman認為,意圖與計劃(plans)具有內在聯系:計劃就是意圖。它們都具有意圖的特性:它們抵制對其進行再思考、具有慣性;它們都是行為的操控者,而不僅僅是行為的影響者;它們都為進一步的實際推理和規劃(planning)提供關鍵輸入。但與簡單意圖相比,它們顯得更為復雜:從不完全的意義看,簡單意圖僅僅是意圖和計劃的典型部分。典型情況是,主體有做某件事情的部分計劃,之后再考慮計劃的細節。意圖和計劃具有等級結構:關于目的的計劃嵌套了關于手段的計劃和初始步驟,更一般的意圖則嵌套了更具體的意圖[6]。
總之,Bratman認為,面向未來的意圖具有如下特點:(1)意圖是更高級別的計劃;(2)意圖引起深思并激發計劃,意圖常常會導致對更高級別的計劃的精煉,從而得到更加具體的計劃;(3)意圖伴隨著為實現該意圖的承諾;(4)僅僅在如下幾種情況下,主體才會放棄其意圖:意圖已經實現,她相信該意圖不可能實現,為了有利于另一個意圖[5]41-43。
Bratman的信念-愿望-意圖理論僅僅是個半形式化系統,此理論給出了信念、愿望和意圖這些基本概念,并說明了它們之間的關系,但并沒有給出它們的形式語義。之后有多位學者在對其進行形式化的基礎上,得到了相應的信念-愿望-意圖邏輯。其中,代表性的主要有:基于線性時態邏輯的Cohen和Levesque(1990)[7]的BDI邏輯、基于分支時間時態邏輯的Rao和 Georgeff(1991)[8]473-484的 BDI邏輯、基于動態邏輯的KARO邏輯框架[9]103-146以及基于務必做到(seeing to it that)邏輯的 BDI邏輯[10][11]。Cohen和Levesque以及Rao和Georgeff這兩篇論文因為其極高的引用率,分別于2006年和2007年獲得了IPAAMAS獎——自主(autonomous)主體和多主體系統的影響文章獎。限于篇幅,本文只討論Cohen和Levesque(1990)的BDI邏輯,并重點論述其對時間和行動的處理。
Cohen和 Levesque(1990)試圖實現 Bratman(1987)的哲學分析模型,他們以線性時態邏輯和可能世界語義學為基礎,研究了信念、目標、持續目標、意圖以及理性的邏輯表達和演算。
在Bratman的意圖理論中,信念、愿望、時間和行動都扮演著重要的作用,因此,該理論的邏輯分析就會涉及到對信念邏輯、愿望邏輯、時間邏輯和行動邏輯的融合。信念、時間和行動在 Cohen和Levesque(1990)的邏輯中占據著基礎地位,但對愿望的概念有所忽視[6]:他們的邏輯是基于現實偏好(realistic preference)這一概念之上的。現實偏好是指,主體根據其信念對其可實現性進行了過濾的愿望。因此,信念蘊涵現實偏好:如果主體相信φ為真,那么她也必須偏好φ為真。雖然在未來某個時刻,主體可能偏好φ為假。這樣,就使得意圖的概念可以化歸成信念、現實偏好、時間和行動的概念。即,可以根據后面四個概念來定義意圖的概念[6]。
Cohen和Levesque(1990)的邏輯是命題動態邏輯(Propositional Dynamic Logic)的線性版本。線性命題動態邏輯的語義允許解釋線性時態邏輯(Linear-time Temporal Logic)。
1.標準的命題動態邏輯
標準的命題動態邏輯不是關于行動而是關于事件(event)的邏輯,它有一個原子事件名稱的集合E。Cohen和Levesque把主體添加其中,并提供了Agent版本的命題動態邏輯。令T是主體的集合,i、j等表示主體,且i、j∈T。那么,原子行動就是E×T的元素。原子行動記作:i:e,其中,原子事件e∈E,且i∈T。通過使用模態算子Possα(其中α是一個行動)、原子公式、原子行動,就可以表示命題動態邏輯語言中的公式。Possαφ的意思是“存在行動α的一個可能執行,且執行行動α之后φ為真”。這一意思的確立,就允許標準的命題動態邏輯存在行動α的幾個可能執行,從而可對不確定性行動進行表示和推理[6]。
而存在量詞Possα是作用在行動α的執行上,其對偶模態算子是全稱量詞Afterα。而且Afterαφ≡def?Possɑ?φ。當φ為真(用“┬”表示)時,Possα的意思是“α是可以執行的”;而當φ為假(用“⊥”表示)時,Afterα⊥的意思是“α是不可以執行的”。
命題動態邏輯的語義是建立在轉換系統(transition systems)之上的,其中原子行動i:e被解釋成“邊(edges)”的集合[6]。這種轉換系統是一個偶對(couple)〈W,R〉,其中W是一個非空的可能世界的集合,R把每個行動α映射到相對于可能世界的一個可及關系Rα?W×W上。從可能世界w到被行動α標記的可能世界u的“邊”的意思是:在w中執行行動α,u是當行動α被執行后的一個可能輸出結果的世界。所有這些α“邊”組成的集合就是解釋行動α的可及關系Rα。
把命題變元的集合Φ中的原子公式p,映射到它們的執行V(p)?W(即映射到p在其中為真的世界V(p)的集合中)的一個賦值V,與一個轉換系統一起,就構成了一個命題動態邏輯模型〈W,R,V〉。此模型可以對公式指派真值。特別地,如果存在Rα中的一個偶對〈w,w′〉,使得φ在世界w′中為真:
M,w?Possαφ,當且僅當存在 u∈W,使得wRαu且M,u?φ
那么我們就說,Possα在世界w中為真。因此,公式Possαφ是表示能力(ability)的弱概念,即:行動α可能出現,之后φ可以為真。
2.線性的命題動態邏輯
或許是Cohen和Levesque(1990)首次采用命題動態邏輯,對實際主體進行建模,其模態詞是在線性(linear)命題動態邏輯中解釋的。在這種模型中,對每個可能世界w而言,最多存在一個與w時間相關的后繼世界u。連接w與u的可及關系可能被幾個原子行動標記。更形式化地說,如果對每個可能世界w∈W而言,〈w,u1〉∈Rα1且〈w,u2〉∈Rα2,而且有u1=u2,那么我們就說,轉換系統〈W,R,V〉是線性的。從可能世界w到被行動α標記的可能世界u的“邊”的意思是:在w中執行行動α,u是當行動α被執行后的輸出結果的世界。這就允許我們可以同時執行兩個不同的行動,但它們必須導致相同的結果世界。線性命題動態邏輯的模型屬于線性轉換系統類[6]。
我們用Happαφ表示實際行動模態算子,意思是:行動α將要被執行,之后φ為真。而前面的弱概念Possαφ則是表示可能行動的模態算子。正如Afterα是Possα的對偶一樣,我們把IfHappα定義成模態算子 Happα的對偶,并規定:IfHappαφ≡def ?Happα?φ。Happαφ表示行動α是可執行的,之后φ為真;IfHappαφ表示,如果行動α是可執行的,那么之后φ為真,因此,前者蘊涵后者。Happα的真值條件是:
M,w?Happαφ,當且僅當存在 u∈W,使得wRαu且M,u?φ。
這與Possα的真值條件幾乎一樣。只不過為了更好地適應這種模型的線性,我們改變了模態算子的名稱而已。線性命題動態邏輯模型具有這樣的公理模式:
(Happi:e┬∧Happj:e′φ)→Happi:eφ
除了原子事件,命題也有諸如序列和非確定性復合(sequential and nondeterministic composition)、測試和迭代等復合事件。
Cohen和Levesque邏輯有時間算子:“eventually”(最終、終于,用◇表示)、“henceforth”(從今以后,用▽表示)、“until”(直到……才,用∪表示)。這些算子可以在線性命題動態邏輯的模型中作各種解釋[6]5。例如,我們可以給出算子“eventually”這樣的真值條件:
M,w?◇φ,當且僅當存在一個整數n,并存在w1,…,wn∈W,使得w1=w,對某個αk,〈wk,wk+1〉∈Rαk且M,wn?φ。
把事件e上的算子存在?與動態算子Happi:e進行融合,可以表示行動上的存在量詞,其真值條件為:
M,w??eHappi:eφ,當且僅當存在 e∈E,u∈W,使得〈w,u〉∈ Ri:e且M,u?φ。
Cohen和Levesque(1990)對信念的定義的論述遵循了通常的標準,而對偏好的論述則利用了強現實偏好這一有些特別的概念。
1.信念
對每個主體i而言,可以用B表示信念模態算子;這些算子的邏輯就是標準的信念KD45模態邏輯。如果把可及關系Beli添加到線性命題動態邏輯中,就可以解釋這些算子[6]。 世界Beli(w)={u:〈w,u〉∈Beli}的集合是指,在世界w中對主體i而言可能的世界集合,這些世界與主體在w中的信念一致。
KD45中的可及關系滿足持續性(seriality)、傳遞性和歐幾里得性(Euclideanity):
(1)持續性:對每個w∈W,至少存在一個u∈W,使得〈w,u〉∈Beli。
(2)傳遞性:如果〈w,u〉∈Beli且〈u,v〉∈Beli,那么〈w,v〉∈Beli。
(3)歐幾里得性:如果〈w,u〉∈Beli且〈w,v〉∈Beli,那么〈u,v〉∈Beli。
這些約束條件使得公理D、公理4和公理5有效:
(4)信念的一致性公理D:Bφ→?B?φ
(5)正內省(positive introspection)公理4:Bφ→BBφ
(6)負內省(negative introspection)公理5:?Bφ→B?Bφ
2.偏好
Cohen和Levesque認為,意圖就是特別強烈的現實偏好。強現實偏好是指,對一個主體而言的可能的世界中,存在主體偏好的一個子集。對每個主體i而言,可以用Pi表示偏好模態算子,公式Piφ的意思是主體i選擇φ為真。從信念邏輯蘊涵偏好這一意義來看,這一偏好概念具有強現實性。從語義上講,可以用可及關系Prefi使得Prefi?Beli來表示強現實偏好。即:一個與主體i的偏好一致的世界,不能夠與主體的信念相沖突[6]。換句話說,在世界w中,主體只能夠在其可能認知到的世界中選擇其偏好世界。
行動、時間、信念和偏好邏輯語義框架是一個四元組M=〈W,R,Bel,Pref〉,其中:W是一個非空的可能世界的集合;R:(T×E)→W×W把行動α映射到可及關系Rα上;Bel:T→W×W把主體i映射到可及關系Beli上;Pref:T→W×W把主體i映射到可及關系Prefi上。這一框架滿足這樣的約束條件:Beli具有持續性、傳遞性和歐幾里得性;對每個i∈T而言,Prefi?Beli。與通常一樣,在框架中添加把原子公式p映射到它們的執行V(p)?W中的賦值V:Φ→2w,就得到框架 M=〈W,R,Bel,Pref〉對應的模型,此框架的有效性和可滿足性的定義如常[6]。
1.意圖的定義
Cohen和 Levesque(1990)通過定義級聯(cascade)的方式定義了一個意圖模態算子[6]:
(1)如果主體i偏好φ將最終為真,并相信 φ目前為假,那么 φ就是主體 i的達成性目標(achievement goal),記作 AGi,即有定義:AGiφ≡defPiFφ∧B?α。
(2)如果主體i有一個要達成的目標φ,并且將堅持這一目標直到φ要么被實現,要么被相信成不能實現,那么φ就是主體i的持續性目標(persistent goal),記作 PGi,即有定義:PGiφ≡defAGiφ∧(AGiφ)∪(Bφ∨B(▽(?φ)))。
(3)如果主體i有一個持續性目標φ,并且相信通過她的行動能夠達到φ,那么我們就說,主體i有意圖φ(記作Iφ)。這就要求通過融合算子(fused operator)對事件進行量化的方式對i的行動進行量化,即:Iφ≡defPGiφ∧B◇?eHappi:eφ。
2.意圖的一些有效原則和無效原則
Cohen和Levesque(1990)的結果保證了幾個我們想要的性質,并避免了不想要的性質[6]。比如:(1)主體i意圖φ,邏輯蘊涵主體i相信φ,即:Iφ→Bφ;(2)公式模式 B(φ→ψ)→(Iφ→ Iψ)無效,即:主體i意圖φ,并且i相信φ蘊涵ψ,并不能邏輯蘊涵i意圖ψ。這一性質很重要。例如:主體i想去拔牙,并相信拔牙會引起牙疼,但主體i肯定不想去挨疼。
3.持續性目標的簡化定義
Cohen和Levesque最初的定義,允許主體為了某些更重要的目標,而放棄一個持續性目標。其簡化定義[6]是:PGiφ=defAGiφ∧(AGiφ)∪(Bφ∨BG ?φ∨ψ)。其中ψ表示其他原因的未指定條件。
綜上所述,BDI邏輯的基本概念來源于Bratman的信念-意圖-愿望理論。該理論認為信念、愿望和意圖在影響人類行為決策和推理的過程中起著重要的作用;并把注意力集中在伴隨著主體行動的面向未來的意圖。其特點是:意圖是更高級別的計劃;意圖引起深思并激發規劃;意圖伴隨著為實現該意圖的承諾;引入對主體行動起激勵作用的前態度,可以對信念、愿望和意圖加以區分;意圖具有慣性,而且是進一步實際推理的一個輸入。Cohen和Levesque(1990)試圖實現Bratman(1987)的哲學分析模型:以線性時序邏輯和可能世界語義學為基礎,使用信念、現實偏好、時間和行動的概念,通過定義級聯的方式定義了意圖模態算子,研究了信念、目標、持續目標、意圖以及理性的邏輯表達和演算;其邏輯是命題動態邏輯的線性版本。他們的工作為后續BDI邏輯及其擴展邏輯的發展奠定了堅實的基礎。
注釋:
①這里需要說明的是:雖然在心靈哲學和語言哲學等領域中,intention多譯為“意向”,但在人工智能領域,intention多譯為“意圖”。
[1]張曉君,郝一江.基于行動邏輯的智能主體行為表征研究[J].重慶理工大學學報(社會科學版),2013,(1):13-18.
[2]張曉君.等級BDI邏輯:關于行為表征的柔性邏輯[J].哲學動態,2013,(1):102-107.
[3]BRATMAN M E.Intentions,Plans,and Practical Reason[M].Harvard University Press,1987.
[4]陳群,桂起權.經濟學究竟是嚴密自然科學還是行為科學——A.羅森伯格經濟學哲學思想解讀[J].經濟評論,2011,(5):5-11.
[5]DENNETT D C.The Intentional Stance[M].Cambridge,Mass.:MIT Press,1987.
[6]MEYER J J.Ch et al.BDI logics[EB/OL].[2013-02-18].http://www.cs.uu.nl/docs/vakken/iag/jj.BDI.
[7]COHEN P R,LEVESQUE H.Intention is choice with commitment[J].Artificial Intelligence,1990,(3):213-261.
[8]RAO A S,GEORGEFF M P.Modeling rational agents within a BDI-architecture[C]//Proceedings of the2nd International Conference on Principles of Knowledge Representation and Reasoning.1991.
[9]VAN LINDER B,et al.Actions that make you change your mind[C]//LAUX A,WANSING H(eds.).Knowledge and Belief in Philosophy and Artificial Intelligence.1995.
[10]CHELLAS B F.On bring it about[J].Journal of Philosophical Logic,1995,24:563-571.
[11]HORTY J F.Agency and Deontic Logic[M].Oxford University Press,2001.
[責任編輯:張 卉 ]
B815.3
A
1000-5315(2015)01-0005-05
2014-10-08
教育部人文社會科學研究規劃項目“基于 BDI(信念、愿望和意圖)邏輯的慎思 Agent的行為決策研究”(13YJA72040001)。
林穎(1963—),女,福建福清人,寧德師范學院經濟管理系教授,主要研究現代邏輯等;
張曉君(1970—),女,四川南充人,邏輯學博士,四川師范大學政治教育學院副研究員,主要研究現代邏輯。