信念-愿望-意圖理論及其形式化研究

2015-04-11 03:34:05張曉君

四川師范大學學報(社會科學版) 2015年1期

關鍵詞：主體

林穎，張曉君

（1.寧德師范學院經濟管理系，福建寧德352100；2.四川師范大學政治教育學院，成都610066）

信念-愿望-意圖理論及其形式化研究

林穎1，張曉君2

（1.寧德師范學院經濟管理系，福建寧德352100；2.四川師范大學政治教育學院，成都610066）

從Bratman（1987）的信念-愿望-意圖理論出發，考察了該理論在邏輯中的形式化，比如Cohen和Levesque（1990）的BDI邏輯。Bratman認為：信念、愿望和意圖在人的行為中扮演著重要的作用；意圖不僅僅是一個愿望，而且是主體不會輕易放棄的承諾；意圖具有慣性，而且是進一步實際推理的一個輸入；為了對信念、愿望和意圖加以區分，他引入了“前態度”的概念。Cohen和Levesque（1990）的BDI邏輯給出了Bratman（1987）的信念-愿望-意圖理論的形式語義，行動、時間、信念和偏好在此邏輯中占據著重要地位。

信念；愿望；意圖；偏好；BDI邏輯

做知識級分析的系統稱為主體（Agent），比如：人、具有智能的高級動物和仿人機器人均可視為A-gent）［1］。主體強調理性作用，是描述人類智能、動物智能和機器智能的統一模型［2］。在理性主體的設計過程中，信念（Belief）、愿望（Desire，或目標）和意圖（Intention①）所扮演的作用，哲學界和人工智能界的學者已經有了深刻的認識。大多數哲學理論認為，意圖可以化歸成信念和愿望。而 Bratman（1987）堅信，在實際推理的過程中，意圖扮演著重要而不同的作用，并提出了意圖規劃理論（planning theory of intention），把意圖看作是行為的部分規劃；認為在社會生產實際中，這些規劃支持我們的日常活動隨著時間的推移進行動態推理［3］。這為BDI（Belief-Desire-Intention，簡稱BDI）邏輯的形成和發展奠定了堅實的哲學基礎，并對人工智能產生了廣泛的影響。在經濟學方法論領域，與信念-愿望-意圖（BDI）理論十分相似的有A.羅森伯格提出的信念-行動-愿望（簡稱BAD）理論。該理論認為：經濟預測與主體的信念、行動和愿望的意向性解釋有關［4］。如果任一主體x的愿望是d，并且x相信“在當時情況下，如果采取行動a就能夠實現愿望d”，那么x就會采取行動a。

一 Bratman的信念-愿望-意圖理論

Bratman（1987）從民俗心理學理論的角度，解釋了信念、愿望和意圖是如何影響人類的行為決策和推理。當人工智能領域的學者把他的理論實際應用到人工主體時，就導致了面向主體的新的計算范例的程序設計技術的誕生。

信念和愿望在影響人類行為決策和推理的過程中起著重要的作用。Dennett（1987）［5］認為，作為理性主體的實體的行為選擇，似乎受其信念和愿望的操控。為了更為全面地理解人類實際行為推理，Bratman認為有必要引入意圖這一概念。意圖不僅僅是一個單純的愿望，而且還包含了主體不會很快放棄的承諾（commitment）。例如，一個主體的愿望是：能夠在北京大學做報告，這僅僅是一個單純的愿望，她不一定為了這個愿望而采取實際的措施，可能她受限于自身的條件（比如她連大學都沒有上過）。但如果一個主體有了明天要在北京大學做報告的意圖，這就不僅僅是個單純的愿望，她會采取實際的措施，并制定計劃來實現這個意圖（比如：取消其他計劃，或者確保筆記本已經裝在包里），除非特殊或意外情況發生，導致她取消這個意圖，不然她明天將在北京大學做報告。

Bratman把注意力集中在面向未來的意圖，這類意圖有別于面向當前的意圖。面向未來的意圖伴隨著主體的行動，更確切地說，伴隨主體的意圖行動（intentional actions）。為了對信念、愿望和意圖加以區分，Bratman引入了前態度（pre-attitude）的概念。前態度就是對主體行動起激勵作用的心智態度。愿望和意圖都是前態度，而信念則常常不是。意圖是對行為進行控制的前態度，而通常的愿望僅僅對行動有著潛在的影響。涉及未來導向意圖的承諾意愿大小，則是由意圖的行為控制特性決定的，作為行為控制的一個前態度，意圖常常涉及到對行動的一個特別承諾，而通常的愿望則沒有［6］。

除了把意圖等同于行為控制的前態度外，Bratman認為意圖還具有別的性質：意圖具有慣性（inertia），而且是進一步實際推理的一個輸入。意圖的慣性是指，意圖抵制對其進行再思考，一旦一個意圖形成（而且對行動的承諾也已經形成），意圖通常會保持其完整性直到行動時間到來。即：意圖具有穩定性或慣性。意圖會對進一步的行動決策和推理產生影響，意圖的精煉（對更具體行動的意圖）也會起作用［6］。例如，一個主體有了明天到北京大學做報告的意圖后，可以形成開車去北京大學做報告這樣更為具體的意圖。有了這第二個意圖后，考慮去北京大學的火車時刻表就不再合理，但在第一個意圖之后，這么考慮則是合理的。這就導致我們把意圖看成是，不同于信念和愿望的獨特的心智狀態。先前的意圖和計劃決定了待選項是否通過。意圖的這一特性就要求意圖和信念具有一致性：意圖是相對主體相信為真的世界而言的。

Bratman認為，意圖與計劃（plans）具有內在聯系：計劃就是意圖。它們都具有意圖的特性：它們抵制對其進行再思考、具有慣性；它們都是行為的操控者，而不僅僅是行為的影響者；它們都為進一步的實際推理和規劃（planning）提供關鍵輸入。但與簡單意圖相比，它們顯得更為復雜：從不完全的意義看，簡單意圖僅僅是意圖和計劃的典型部分。典型情況是，主體有做某件事情的部分計劃，之后再考慮計劃的細節。意圖和計劃具有等級結構：關于目的的計劃嵌套了關于手段的計劃和初始步驟，更一般的意圖則嵌套了更具體的意圖［6］。

總之，Bratman認為，面向未來的意圖具有如下特點：（1）意圖是更高級別的計劃；（2）意圖引起深思并激發計劃，意圖常常會導致對更高級別的計劃的精煉，從而得到更加具體的計劃；（3）意圖伴隨著為實現該意圖的承諾；（4）僅僅在如下幾種情況下，主體才會放棄其意圖：意圖已經實現，她相信該意圖不可能實現，為了有利于另一個意圖［5］41-43。

Bratman的信念-愿望-意圖理論僅僅是個半形式化系統，此理論給出了信念、愿望和意圖這些基本概念，并說明了它們之間的關系，但并沒有給出它們的形式語義。之后有多位學者在對其進行形式化的基礎上，得到了相應的信念-愿望-意圖邏輯。其中，代表性的主要有：基于線性時態邏輯的Cohen和Levesque（1990）［7］的BDI邏輯、基于分支時間時態邏輯的Rao和 Georgeff（1991）［8］473-484的 BDI邏輯、基于動態邏輯的KARO邏輯框架［9］103-146以及基于務必做到（seeing to it that）邏輯的 BDI邏輯［10］［11］。Cohen和Levesque以及Rao和Georgeff這兩篇論文因為其極高的引用率，分別于2006年和2007年獲得了IPAAMAS獎——自主（autonomous）主體和多主體系統的影響文章獎。限于篇幅，本文只討論Cohen和Levesque（1990）的BDI邏輯，并重點論述其對時間和行動的處理。

二 Cohen和Levesque對時間和行動的處理

Cohen和 Levesque（1990）試圖實現 Bratman（1987）的哲學分析模型，他們以線性時態邏輯和可能世界語義學為基礎，研究了信念、目標、持續目標、意圖以及理性的邏輯表達和演算。

在Bratman的意圖理論中，信念、愿望、時間和行動都扮演著重要的作用，因此，該理論的邏輯分析就會涉及到對信念邏輯、愿望邏輯、時間邏輯和行動邏輯的融合。信念、時間和行動在 Cohen和Levesque（1990）的邏輯中占據著基礎地位，但對愿望的概念有所忽視［6］：他們的邏輯是基于現實偏好（realistic preference）這一概念之上的。現實偏好是指，主體根據其信念對其可實現性進行了過濾的愿望。因此，信念蘊涵現實偏好：如果主體相信φ為真，那么她也必須偏好φ為真。雖然在未來某個時刻，主體可能偏好φ為假。這樣，就使得意圖的概念可以化歸成信念、現實偏好、時間和行動的概念。即，可以根據后面四個概念來定義意圖的概念［6］。

Cohen和Levesque（1990）的邏輯是命題動態邏輯（Propositional Dynamic Logic）的線性版本。線性命題動態邏輯的語義允許解釋線性時態邏輯（Linear-time Temporal Logic）。

1.標準的命題動態邏輯

標準的命題動態邏輯不是關于行動而是關于事件（event）的邏輯，它有一個原子事件名稱的集合E。Cohen和Levesque把主體添加其中，并提供了Agent版本的命題動態邏輯。令T是主體的集合，i、j等表示主體，且i、j∈T。那么，原子行動就是E×T的元素。原子行動記作：i：e，其中，原子事件e∈E，且i∈T。通過使用模態算子Possα（其中α是一個行動）、原子公式、原子行動，就可以表示命題動態邏輯語言中的公式。Possαφ的意思是“存在行動α的一個可能執行，且執行行動α之后φ為真”。這一意思的確立，就允許標準的命題動態邏輯存在行動α的幾個可能執行，從而可對不確定性行動進行表示和推理［6］。

而存在量詞Possα是作用在行動α的執行上，其對偶模態算子是全稱量詞Afterα。而且Afterαφ≡def?Possɑ?φ。當φ為真（用“┬”表示）時，Possα的意思是“α是可以執行的”；而當φ為假（用“⊥”表示）時，Afterα⊥的意思是“α是不可以執行的”。

命題動態邏輯的語義是建立在轉換系統（transition systems）之上的，其中原子行動i：e被解釋成“邊（edges）”的集合［6］。這種轉換系統是一個偶對（couple）〈W，R〉，其中W是一個非空的可能世界的集合，R把每個行動α映射到相對于可能世界的一個可及關系Rα?W×W上。從可能世界w到被行動α標記的可能世界u的“邊”的意思是：在w中執行行動α，u是當行動α被執行后的一個可能輸出結果的世界。所有這些α“邊”組成的集合就是解釋行動α的可及關系Rα。

把命題變元的集合Φ中的原子公式p，映射到它們的執行V（p）?W（即映射到p在其中為真的世界V（p）的集合中）的一個賦值V，與一個轉換系統一起，就構成了一個命題動態邏輯模型〈W，R，V〉。此模型可以對公式指派真值。特別地，如果存在Rα中的一個偶對〈w，w′〉，使得φ在世界w′中為真：

M，w?Possαφ，當且僅當存在 u∈W，使得wRαu且M，u?φ

那么我們就說，Possα在世界w中為真。因此，公式Possαφ是表示能力（ability）的弱概念，即：行動α可能出現，之后φ可以為真。

2.線性的命題動態邏輯

或許是Cohen和Levesque（1990）首次采用命題動態邏輯，對實際主體進行建模，其模態詞是在線性（linear）命題動態邏輯中解釋的。在這種模型中，對每個可能世界w而言，最多存在一個與w時間相關的后繼世界u。連接w與u的可及關系可能被幾個原子行動標記。更形式化地說，如果對每個可能世界w∈W而言，〈w，u1〉∈Rα1且〈w，u2〉∈Rα2，而且有u1＝u2，那么我們就說，轉換系統〈W，R，V〉是線性的。從可能世界w到被行動α標記的可能世界u的“邊”的意思是：在w中執行行動α，u是當行動α被執行后的輸出結果的世界。這就允許我們可以同時執行兩個不同的行動，但它們必須導致相同的結果世界。線性命題動態邏輯的模型屬于線性轉換系統類［6］。

我們用Happαφ表示實際行動模態算子，意思是：行動α將要被執行，之后φ為真。而前面的弱概念Possαφ則是表示可能行動的模態算子。正如Afterα是Possα的對偶一樣，我們把IfHappα定義成模態算子 Happα的對偶，并規定：IfHappαφ≡def ?Happα?φ。Happαφ表示行動α是可執行的，之后φ為真；IfHappαφ表示，如果行動α是可執行的，那么之后φ為真，因此，前者蘊涵后者。Happα的真值條件是：

M，w?Happαφ，當且僅當存在 u∈W，使得wRαu且M，u?φ。

這與Possα的真值條件幾乎一樣。只不過為了更好地適應這種模型的線性，我們改變了模態算子的名稱而已。線性命題動態邏輯模型具有這樣的公理模式：

（Happi：e┬∧Happj：e′φ）→Happi：eφ

除了原子事件，命題也有諸如序列和非確定性復合（sequential and nondeterministic composition）、測試和迭代等復合事件。

Cohen和Levesque邏輯有時間算子：“eventually”（最終、終于，用◇表示）、“henceforth”（從今以后，用▽表示）、“until”（直到……才，用∪表示）。這些算子可以在線性命題動態邏輯的模型中作各種解釋［6］5。例如，我們可以給出算子“eventually”這樣的真值條件：

M，w?◇φ，當且僅當存在一個整數n，并存在w1，…，wn∈W，使得w1＝w，對某個αk，〈wk，wk＋1〉∈Rαk且M，wn?φ。

把事件e上的算子存在?與動態算子Happi：e進行融合，可以表示行動上的存在量詞，其真值條件為：

M，w??eHappi：eφ，當且僅當存在 e∈E，u∈W，使得〈w，u〉∈ Ri：e且M，u?φ。

三 Cohen和Levesque對信念和偏好的處理

Cohen和Levesque（1990）對信念的定義的論述遵循了通常的標準，而對偏好的論述則利用了強現實偏好這一有些特別的概念。

1.信念

對每個主體i而言，可以用B表示信念模態算子；這些算子的邏輯就是標準的信念KD45模態邏輯。如果把可及關系Beli添加到線性命題動態邏輯中，就可以解釋這些算子［6］。世界Beli（w）＝｛u：〈w，u〉∈Beli｝的集合是指，在世界w中對主體i而言可能的世界集合，這些世界與主體在w中的信念一致。

KD45中的可及關系滿足持續性（seriality）、傳遞性和歐幾里得性（Euclideanity）：

（1）持續性：對每個w∈W，至少存在一個u∈W，使得〈w，u〉∈Beli。

（2）傳遞性：如果〈w，u〉∈Beli且〈u，v〉∈Beli，那么〈w，v〉∈Beli。

（3）歐幾里得性：如果〈w，u〉∈Beli且〈w，v〉∈Beli，那么〈u，v〉∈Beli。

這些約束條件使得公理D、公理4和公理5有效：

（4）信念的一致性公理D：Bφ→?B?φ

（5）正內省（positive introspection）公理4：Bφ→BBφ

（6）負內省（negative introspection）公理5：?Bφ→B?Bφ

2.偏好

Cohen和Levesque認為，意圖就是特別強烈的現實偏好。強現實偏好是指，對一個主體而言的可能的世界中，存在主體偏好的一個子集。對每個主體i而言，可以用Pi表示偏好模態算子，公式Piφ的意思是主體i選擇φ為真。從信念邏輯蘊涵偏好這一意義來看，這一偏好概念具有強現實性。從語義上講，可以用可及關系Prefi使得Prefi?Beli來表示強現實偏好。即：一個與主體i的偏好一致的世界，不能夠與主體的信念相沖突［6］。換句話說，在世界w中，主體只能夠在其可能認知到的世界中選擇其偏好世界。

四 Cohen和Levesque的行動、時間、信念和偏好邏輯

行動、時間、信念和偏好邏輯語義框架是一個四元組M＝〈W，R，Bel，Pref〉，其中：W是一個非空的可能世界的集合；R：（T×E）→W×W把行動α映射到可及關系Rα上；Bel：T→W×W把主體i映射到可及關系Beli上；Pref：T→W×W把主體i映射到可及關系Prefi上。這一框架滿足這樣的約束條件：Beli具有持續性、傳遞性和歐幾里得性；對每個i∈T而言，Prefi?Beli。與通常一樣，在框架中添加把原子公式p映射到它們的執行V（p）?W中的賦值V：Φ→2w，就得到框架 M＝〈W，R，Bel，Pref〉對應的模型，此框架的有效性和可滿足性的定義如常［6］。

1.意圖的定義

Cohen和 Levesque（1990）通過定義級聯（cascade）的方式定義了一個意圖模態算子［6］：

（1）如果主體i偏好φ將最終為真，并相信 φ目前為假，那么 φ就是主體 i的達成性目標（achievement goal），記作 AGi，即有定義：AGiφ≡defPiFφ∧B?α。

（2）如果主體i有一個要達成的目標φ，并且將堅持這一目標直到φ要么被實現，要么被相信成不能實現，那么φ就是主體i的持續性目標（persistent goal），記作 PGi，即有定義：PGiφ≡defAGiφ∧（AGiφ）∪（Bφ∨B（▽（?φ）））。

（3）如果主體i有一個持續性目標φ，并且相信通過她的行動能夠達到φ，那么我們就說，主體i有意圖φ（記作Iφ）。這就要求通過融合算子（fused operator）對事件進行量化的方式對i的行動進行量化，即：Iφ≡defPGiφ∧B◇?eHappi：eφ。

2.意圖的一些有效原則和無效原則

Cohen和Levesque（1990）的結果保證了幾個我們想要的性質，并避免了不想要的性質［6］。比如：（1）主體i意圖φ，邏輯蘊涵主體i相信φ，即：Iφ→Bφ；（2）公式模式 B（φ→ψ）→（Iφ→ Iψ）無效，即：主體i意圖φ，并且i相信φ蘊涵ψ，并不能邏輯蘊涵i意圖ψ。這一性質很重要。例如：主體i想去拔牙，并相信拔牙會引起牙疼，但主體i肯定不想去挨疼。

3.持續性目標的簡化定義

Cohen和Levesque最初的定義，允許主體為了某些更重要的目標，而放棄一個持續性目標。其簡化定義［6］是：PGiφ＝defAGiφ∧（AGiφ）∪（Bφ∨BG ?φ∨ψ）。其中ψ表示其他原因的未指定條件。

綜上所述，BDI邏輯的基本概念來源于Bratman的信念-意圖-愿望理論。該理論認為信念、愿望和意圖在影響人類行為決策和推理的過程中起著重要的作用；并把注意力集中在伴隨著主體行動的面向未來的意圖。其特點是：意圖是更高級別的計劃；意圖引起深思并激發規劃；意圖伴隨著為實現該意圖的承諾；引入對主體行動起激勵作用的前態度，可以對信念、愿望和意圖加以區分；意圖具有慣性，而且是進一步實際推理的一個輸入。Cohen和Levesque（1990）試圖實現Bratman（1987）的哲學分析模型：以線性時序邏輯和可能世界語義學為基礎，使用信念、現實偏好、時間和行動的概念，通過定義級聯的方式定義了意圖模態算子，研究了信念、目標、持續目標、意圖以及理性的邏輯表達和演算；其邏輯是命題動態邏輯的線性版本。他們的工作為后續BDI邏輯及其擴展邏輯的發展奠定了堅實的基礎。

注釋：

①這里需要說明的是：雖然在心靈哲學和語言哲學等領域中，intention多譯為“意向”，但在人工智能領域，intention多譯為“意圖”。

［1］張曉君，郝一江.基于行動邏輯的智能主體行為表征研究［J］.重慶理工大學學報（社會科學版），2013，（1）：13-18.

［2］張曉君.等級BDI邏輯：關于行為表征的柔性邏輯［J］.哲學動態，2013，（1）：102-107.

［3］BRATMAN M E.Intentions，Plans，and Practical Reason［M］.Harvard University Press，1987.

［4］陳群，桂起權.經濟學究竟是嚴密自然科學還是行為科學——A.羅森伯格經濟學哲學思想解讀［J］.經濟評論，2011，（5）：5-11.

［5］DENNETT D C.The Intentional Stance［M］.Cambridge，Mass.：MIT Press，1987.

［6］MEYER J J.Ch et al.BDI logics［EB/OL］.［2013-02-18］.http：//www.cs.uu.nl/docs/vakken/iag/jj.BDI.

［7］COHEN P R，LEVESQUE H.Intention is choice with commitment［J］.Artificial Intelligence，1990，（3）：213-261.

［8］RAO A S，GEORGEFF M P.Modeling rational agents within a BDI-architecture［C］//Proceedings of the2nd International Conference on Principles of Knowledge Representation and Reasoning．1991.

［9］VAN LINDER B，et al.Actions that make you change your mind［C］//LAUX A，WANSING H（eds.）.Knowledge and Belief in Philosophy and Artificial Intelligence．1995.

［10］CHELLAS B F.On bring it about［J］.Journal of Philosophical Logic，1995，24：563-571.

［11］HORTY J F.Agency and Deontic Logic［M］.Oxford University Press，2001.

［責任編輯：張卉］

B815.3

1000-5315（2015）01-0005-05

2014-10-08

教育部人文社會科學研究規劃項目“基于 BDI（信念、愿望和意圖）邏輯的慎思 Agent的行為決策研究”（13YJA72040001）。

林穎（1963—），女，福建福清人，寧德師范學院經濟管理系教授，主要研究現代邏輯等；

張曉君（1970—），女，四川南充人，邏輯學博士，四川師范大學政治教育學院副研究員，主要研究現代邏輯。