999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Agent信念修正推理機制

2022-07-14 03:31:14郝一江
關鍵詞:定義主體能力

林 穎,郝一江

(1.寧德師范學院 馬克思主義學院, 福建 寧德 352100;2.中國社會科學院 哲學研究所, 北京 100732)

一、引言

Agent(主體或智能體)是人類智能、動物智能和機器智能的統一模型(1)參見張曉君、郝一江所著《基于行動邏輯的智能主體行為表征研究》,原載于參考文獻[1],后被人大復印資料《邏輯》2013年第2期全文轉載。。行動或行為(包括言語行為)可以改變世界,進而改變主體的信念、愿望、意圖和情感等心智態度,簡言之:行動改變心智。每當某個可靠的新信息與主體已經擁有的信息相矛盾時,如果主體想整合這一新信息,并保持其信念集一致,主體就必須改變其信念(belief),這時就會執行信念更新行動。Agent常見的三種信念更新行動是:信念擴展(expansion)、信念收縮(contraction)和信念修正(revision)。信念擴展會導致某個公式被相信;信念收縮會導致某個公式不再被相信;信念修正會導致之前被相信的公式不再被相信。本文試圖用形式化的方法表征這三種動態信念更新行動。

基于意圖的主體結構在人工智能和系統工程等領域有著廣泛的應用。意圖系統描述的實體行動可以通過歸因于某些心智態度的方法來預測,這些心智態度包括知識、信念、愿望、意圖、義務和承諾等[2]。最為著名的意圖形式化系統是Rao與Georgeff[3]提出的信念、愿望和意圖(Belief-Desire-Intention,簡稱BDI)邏輯。信念用來表示環境狀態,愿望用來表示主體動機,意圖用來表示主體目的。BDI體系結構隨著時間的推移而不斷發展,并已應用于迄今為止開發的幾個最重要的多主體系統中。

國內外關于信念、愿望和意圖等心智狀態與Agent行動之間的關系的文獻較為豐碩。例如: Bratman等[4]、G?rdenfors[5]、Casali等[6]、 林穎等[7-8]、張曉君[9]等。本文將在Meyer等[10]、Linder等[11]成果的基礎上,利用命題動態邏輯,對主體的動態信念更新行動的推理機制進行形式化的表征,其基本思路是:(1)定義“執行信念更新行動的結果事件狀態”;(2)定義“為使主體有機會執行信念更新行動所需要滿足的條件”;(3)定義“主體為了能夠執行信念更新行動需要具備的能力”;(4)在定義信念收縮行動的結果時,引入選擇函數的概念,這些函數可以選擇狀態集的子集,并將其添加到主體的信念選項集中,從而收縮主體的信念集;(5)信念修正被定義為:信念收縮行動和信念擴展行動的序列組合行動;(6)根據主體的知識和信念可以定義主體采取信念更新行動的能力。這些定義是基于這樣的理念:即執行能行行動可以得到主體所意圖的事件狀態。通過證明G?rdenfors信念更新公設的有效性,可以證明這些信念更新行動的定義是直覺上可接受的、合理的[11]103-104。

二、知識、信念、能力、機會及其結果

在表示知識和信念時,遵循認知和信念邏輯的通用方法,從句法和語義雙重視角來加以表征。公式Kiφ表示主體 i知道φ,公式Biφ表示主體i相信φ。在語義方面,采用克里普克式的可能世界模型。

執行行動的結果被定義為“行動的執行所導致的事件狀態”[12]。表征行動就需要弄清執行行動能力與執行行動的機會之間的關系。命題動態邏輯[13]不僅可以很好地對這些概念進行形式化,而且在語義方面還可以使得認知邏輯和動態邏輯兼容:因為可能世界語義可同時給出認知概念和動態概念的意義[11]104-105。

在本文中,主體的能力通過Ai算子加以形式化,公式Aiα表示主體 i有能力執行行動α;事件doi(α)表示主體i執行行動α后的表現;〈doi(α)〉φ表示主體i有機會執行α,而且執行α后會導致公式φ成立;公式[doi(α)]φ表示:只有當主體i的事件狀態滿足公式φ時,機會才會出現。現在給出主體執行行動所導致的信念更新的語義框架,其中p表示命題變元,a表示原子行動,α表示行動,φ和ψ表示公式。由于每個狀態對應于一個可能世界,所以,本文對狀態和可能世界不加區分,都用w表示。

(1)L是Δ的最小超集(superset),并且滿足:

(2)Π0是Π的最小超集,并且滿足:

① 如果φ∈L,那么confirm φ∈Π;

② 如果α1∈Π且α2∈Π,那么α1; α2∈Π;

③ 如果φ∈L且α1, α2∈Π,那么if φ then α1else α2fi∈Π;

④ 如果φ∈L且α1∈Π,那么while φ do α1od∈Π。

注記:語言L的純粹命題片段記為L0。邏輯符號∧, →,?, tt, ff, Miφ與[doi(α)]φ的定義與往常一樣。其他附加結構可以是由定義縮寫引入:skip表示confirm tt,fail表示confirm ff,α0表示skip,αn+1表示(α;αn)。執行confirm φ就是確認φ成立,α1; α2∈Π是序列組合行動,if φ then α1else α2fi∈Π是條件組合行動,while φ do α1od∈Π是重復組合行動。skip表示空行動,fail表示從未成功的行動。

(1) W是一個可能世界或狀態的集合。

(2) f:Δ×W→{0, 1}是一個全函數,為可能世界中的命題變元指派真值。

定義2在定義可及關系生成函數g和信念選項集生成函數h時,分別使用了滿足S5公理的知識概念和滿足K45公理的信念概念。

其中狀態轉換函數j和能力函數c定義如下:

② j(i, a)(M, w)=M, j(i, a)(w);

③ j(i, confirm φ)(M, w) = {(M, w)},當M, wφ時;

= ?,否則;

④ j(i, α1; α2)(M, w) = j(i, α2)(j(i, α1)(M, w));

⑤ j(i, if φ then α1else α2fi)(M, w) = j(i, α1)(M, w),當M, wφ時;

=j(i, α2)(M, w),否則;

⑥ j(i, while φ do α1od)(M, w)= {(M′, w′)|?k∈N?M0, w0… ?Mt, ws

[M0, w0=M, w & Mt, wt=M′, w′& ?s

[Ms+1, ws+1=j(i, confirm φ; α1)(Ms, ws)]& M′, w′φ]}

其中s和t是自然數,j(i, ?)=?且:

2) c(i, a)(M, w) = c(i, a)(w)

3) c(i, confirm φ)(M, w) = 1,當M, wφ時;

= 0,否則;

4) c(i, α1; α2)(M, w) = c(i, α1)(M, w) ( c(i, α2)(r(i, α1)(M, w))

5) c(i, if φ then α1else α1fi)(M, w) = c(i, confirm φ; α1)(M, w)或

6) c(i, while φ do α1od)(M, w) = 1,當?t∈N[c(i, (confirm φ; α1)t;

= 0,否則。

其中N是自然數集, c(i, α)(?)= 1。

可滿足性和有效性定義與往常一樣。其中,c(i, confirm φ)(w)表示:一個主體i能夠確認公式φ,當且僅當,公式φ成立。j(i, confirm φ)與c(i, confirm φ)蘊含了:在φ成立的環境下,主體i既有機會又有能力確認φ。一個主體有能力執行一個序列組合行動α1; α2,當且僅當:主體有能力執行α1,且在它執行完α1之后有能力執行α2。一個主體有能力執行一個條件組合行動,其意思是:或者主體能夠確認該條件,然后執行then之后的行動;或者它能夠確認該條件的否定命題,然后執行else之后的行動。一個主體有能力執行一個重復組合行動while φ do α1od,當且僅當:對于某個t∈N,主體能夠執行行動(confirm φ ; α1)t; confirmφ[11]107-108。

本文所采用的知識與信念概念的區別與往常一樣[14],即信念不滿足D公理(Biφ∧Biφ),而且假設存在不一致的信念集,信念擴展可能導致主體有不一致或者荒謬的信念。

三、行動改變心智

通過執行信念更新行動,主體可以擴展、收縮和修正其信念。這些信念更新行動受到主體知識邊界集(boundary set)的影響,即,在一個給定模型狀態下可以確定知識的范圍,并假定知識不會因為信念更新行動而改變,這樣,知識被看作是篤定的信念[11]110-111。

從句法的角度來看,使用3個新的信念更新行動可以對行動集Π加以擴展。

定義4:對定義1的行動集Π(進而語言L)可以進行如下擴展:

如果φ∈L0,那么expand φ, contract φ, revise φ∈Π。

在一個模型的狀態下的命題公式的真值,僅僅取決于對該狀態的賦值。

命題1:令M=〈W, f, g, h, j, c〉是某個克里普克模型,且w∈W,令M′=〈W′, f′, g′, h′, j′, c′〉是某個克里普克模型,且w′∈W′,那么以下結論成立:

?p∈Δ[f(p, w)=f′(p, w′)]??ψ∈L0[M, wψ?M′, w′ψ]

施歸納于ψ的結構即可證明命題1,詳細證明可以參見Linder等[11]128。

(一)信念擴展行動

信念擴展是一種行動,執行該行動可以導致進入“某個公式被相信的”事件狀態。對主體的信念集的擴展建模,是通過限制主體的信念選項集來完成的。在模型M的世界w中,如果某個主體 i用公式φ對信念進行了擴展,那么主體i將限制其信念選項集滿足φ。

信念擴展具有如下性質:

命題2:對于所有主體 i以及所有命題公式φ, ψ,有:

證明可以參見Linder等[11]128。式(1)表示用某個公式φ對信念進行擴展后的結果就是主體相信該公式α。式(2)表示用某個公式ψ對信念進行擴展后,主體將一直相信該公式ψ。式(3)表示在主體已經相信某個公式的情況下,再用該公式對主體信念進行擴展,不會改變任何結果。

信念擴展行動具有可實現性、確定性和冪等性。可實現性是指在任何情況下,主體都有機會執行行動。確定性是指執行行動導致的事件狀態是唯一的。冪等性是指執行行動兩次或任意多次,與執行一次的效果是一樣的[11]111-112。

命題3(信念擴展的性質):對于所有的主體 i以及所有命題公式φ和ψ,有:[doi(expand φ)]Biψ?( Bi(φ→ψ)。

證明可以參見Linder等[11]129-130。命題3表示用某個命題公式φ對信念進行擴展后,主體相信ψ,當且僅當,在進行信念擴展之前,主體就相信φ蘊涵ψ。可以證明命題3的如下特例:用某個公式對主體進行信念擴展后,導致主體具有荒謬的信念,當且僅當,在進行信念擴展之前,主體就相信該公式的否定,即:

推論1:對于所有的主體 i以及所有命題公式φ和ψ,有:

證明:根據觀察可以發現:φ和φ→ff是等價公式,再結合命題3即可得證。證畢。

(二)信念收縮行動

信念收縮通常是指一些之前被相信的公式在之后就不再被相信了。主體相信的內容由于信念收縮而變成了懷疑。為了至少包含“一個不滿足被收縮的公式的狀態”,就需要對主體的信念選項集進行擴展。為此,需要引入選擇函數,盡可能以合理的且直覺上可接受的方式,來選擇認知選項集的子集,從而達到信念收縮行動的目的。

∑0:σ(i, w, φ)=σ(i, w′, φ),其中w′∈[w]g(i);

∑5:σ(i, w, φ∧ψ)?σ(i, w, φ)∪σ(i, w, ψ);

這一信念收縮行動的定義基于選擇函數的使用,即通過把選擇函數所選擇的世界精確地添加到主體的信念選項集,從而完成信念收縮行動。

定義7(收縮行動的語義):令某個模型M=〈W, f, g, h, j, c〉,w∈W,且給定主體i和命題公式φ,并令σ是對于M的任意且固定的選擇函數,可以定義:j(i, contract φ)(M, w)=M′, w,其中M′=〈W, f, g, h′, j, c〉且:

(1) 如果i′≠i或w′?[w]g(i),那么h′(i′, w′)=h(i′, w′);

(2) 對于所有w′∈[w]g(i), h((i, w′)=h(i, w′)∪σ(i, w, φ)。

使用選擇函數定義收縮行動的語義,可得到如下可接受的形式化信念收縮行動:

命題4:對于所有主體 i,命題公式φ, ψ和θ,有:

其證明請參見Linder等[11]130-131。式(1)表明信念收縮后的信念集包含在收縮前的信念集中。式(2)表明在φ不被相信的情況下,信念收縮φ不會改變什么。式(3)表明帶有可收縮公式的信念收縮的結果是:將導致主體不再相信該收縮公式,而且可收縮公式是主體愿意放棄相信的公式。式(4)表明在用一個公式進行信念收縮,然后用該公式進行信念擴展時,將恢復初始信念集中的所有信念。式(5)表明用等價的公式進行信念收縮,會得到相同的信念集。式(6)表明先用φ進行信念收縮,然后用ψ進行信念收縮后,那么被相信的所有公式等價于:同時用φ∧ψ進行信念收縮后被相信的所有公式。式(7)表明如果用φ∧ψ進行信念收縮導致φ不被相信,那么為了收縮而被移除的公式,不會多于為了收縮φ∧ψ而被移除的公式[11]115-116。

與信念擴展一樣,信念收縮具有可實現性、確定性和冪等性,即:

命題5:對于所有主體 i和命題公式φ, ψ,有:

證明:根據定義7即可得證。證畢。

選擇函數可以是給定模型的信念集的某些極大子集。因為:假設M是帶有狀態w的某個克里普克模型,給定某個主體 i,并且假設對于某個命題公式φ,M, wBiφ∧Kiφ。在模型M中,把[w]g(i)∩φ中的世界添加到主體i的信念選項集,可得到“主體不再相信φ”的一個模型。

選擇函數的目標是得到“給定公式失效”的一組世界。選擇函數僅僅從認知等價類中添加所有可能世界,而這些世界不支持被收縮的公式,即使這些世界之前相信該公式。如果之前不相信該公式,就不必添加新的可能世界。信念收縮行動實施后的信念狀態也可以用主體的知識和信念來描述[11]120-121。

(三)信念修正行動

信念修正是一種信念改變,即某個公式的信念狀態被顛覆,即:主體之前相信φ,信念修正的結果是主體相信φ;或者主體之前相信φ,信念修正的結果是主體相信φ。信念修正可以用信念收縮和信念擴展來定義,使用某個公式φ的信念修正相當于用φ進行信念收縮之后,再用φ進行信念擴展[15]。行動集Π在序列組合下是封閉的,因此可以把信念修正定義為:信念收縮行動和信念擴展行動的序列組合行動。

定義8(信念修正):令某個模型M=〈W, f, g, h, j, c〉,w∈W,給定某個主體i和命題公式φ,可以定義:j(i, revise φ)(M, w) = j(i, contractφ; expand φ)(M, w)。

命題6:對于所有主體 i,所有命題公式φ, ψ, θ,有:

其證明請參見Linder等[11]138。式(1)表明主體相信φ是用φ修正其信念而得到的結果。式(2)表明用φ進行信念修正后得到的信念集,包含在用φ進行信念擴展而得到的信念集中;即用φ進行信念修正,就是用一致的方式得到包含φ的信念集,這一信念集是“直接用φ進行信念擴展而得到的信念集”的子集。式(3)表明信念擴展是一種特殊的信念修正:在φ不被相信的情況下,用φ進行信念擴展和用φ進行信念修正,實際上是相同的行動。式(4)從左到右方向的蘊涵表明:如果主體相信φ,即,φ是主體永遠堅信的一個公式,那么用φ進行信念修正會得到荒謬的信念集,即,主體相信ff是用φ進行信念修正的結果;式(4)從右到左方向的蘊涵表明:荒謬的信念集只有在使用不可修正的公式進行修正時才會產生。式(5)表明用主體已經相信的公式進行信念修正,其結果不變。式(6)表明:用合取式φ∧ψ進行信念修正得到的信念集,是“用φ進行信念修正再用ψ進行信念擴展而得到的信念集”的子集。式(7)表明:如果用φ進行信念修正并不導致ψ被相信,那么用φ∧ψ進行修正得到的信念集,就是“用φ進行信念修正再用ψ進行信念擴展而得到的信念集”的一個超集。式(6)和式(7)給出的是信念修正的最小更新條件[11]121-122。

與信念擴展和信念收縮一樣,信念修正具有可實現性、確定性和冪等性,即:

命題7:對于所有主體 i,所有命題公式φ, ψ,有:

證明:根據定義8即可得證。證畢。

命題8(信念修正的特征):對于所有主體 i,所有命題公式φ和ψ,有:

(3) 如果信念收縮行動的狀態轉換函數j的定義是相對于“AiG函數”[11]119的所有模型,那么Kiφ∧Biφ→([doi(revise φ)]Biψ?Ki(φ→ψ))。

其證明請參見Linder等[11]138。式(1)表明如果主體知道某一公式的否定是正確的,則對該公式的修正將導致荒謬的信念。式(2)表明在某個公式的否定不被相信的情況下,用該公式進行信念修正就等于用該公式進行信念擴展。式(3)表明如果主體事先知道φ蘊涵ψ,那么用φ進行信念修正之后,ψ就被相信。即用φ修正后的主體信念集,包含由φ所蘊涵的所有公式。

(四)改變心智的能力

對于諸如測試、觀察、交流等心智行動,雖然主體的能力與其擁有或缺乏的知識和(或)信念密切相關,但是信念的改變是一種嚴格意義上的主體內部的心智活動。因此,主體改變信念的能力僅由其心智狀態決定,而且該能力可以用來說明主體信念所經歷的變化。如果一個主體能夠以某種方式改變自己的信念,那么這種信念的改變既不應該得到荒謬的信念集,也不能什么都沒有改變。一個主體能夠用公式φ修正其信念,當且僅當,它能用φ收縮其信念,然后用φ擴展其信念[11]124-125。

定義9:令M是某個帶有狀態s的克里普克模型,i是某個主體,φ是某個命題公式。信念擴展、信念收縮和信念修正行動的能力函數c可以分別定義如下:

(1) c(i, expand φ)(M, w)=1 ? M, wBiφ;

(2) c(i, contract φ)(M, w)=1 ? M, wKiφ;

(3) c(i, revise φ)(M, w) = c(i, contractφ; expand φ)(M, w)。

定義(1)表明主體能夠用一個公式擴展其信念集,當且僅當,該主體不相信該公式的否定。定義(2)表明主體能夠從其信念集中移除某個公式,當且僅當,該主體不再認可該公式。定義(3)中的信念修正行動的能力是根據Levi等式[15]加以定義的。

命題9:對于所有主體 i和所有命題公式φ,有:

其證明請參見Linder等[11]141-142。式(1)和式(3)表明主體知道自己具有擴展和收縮其信念的能力。式(5)表明主體知道自己具有修正其信念的能力。式(2)、式(4)和式(6)分別表明主體有能力以其應有的方式改變其信念:擴展不會得到荒謬的信念集;信念收縮會導致不相信被收縮的公式;信念修正則需要先進行信念收縮,然后進行信念擴展[11]125。

Can謂詞和Cannot謂詞[16]可以對主體為了實現特定目標,所采取的規劃的(不)正確性和(不)可行性的知識和推理進行形式化描述。Can謂詞表示:主體知道執行行動α是達成φ的正確規劃,當且僅當,該主體知道〈doi(α)〉φ成立;主體i知道執行α是達成φ的一個可行規劃,當且僅當,該主體知道它能夠執行α,即,KiAiα成立。Cannot謂詞表示:主體知道它不能通過執行某個行動α來達到某個目標φ,因為它知道執行該行動不會達到所意圖的目標,或者它不能執行該行動,即,主體知道執行該行動是錯誤的規劃或是不可行的規劃。

定義10:對于所有主體i,行動α和公式φ,Can謂詞和Cannot謂詞定義如下:

(1) Cani(α,φ)≡Ki(〈doi(α)〉φ∧Aiα);

(2) Cannoti(α, φ)≡ Ki(〈doi(α)〉φ∨Aiα)。

下面的命題表征了信念更新行動在其結果、執行機會和能力方面的性質[11]126。

命題10:對于所有主體i,且對于所有命題公式φ,有:

證明請參見Linder等[11]142-143。命題10表明:“任何有能力執行某個改變其信念的行動的”主體都知道該行動是可行的,并且知道該以怎樣的方式執行行動,即,主體知道該行動是“以所意圖的方式改變其信念的”一個正確且可行的規劃。

四、結論與未來的工作

本文定義了三種常見的信念更新模型:信念擴展、信念收縮和信念修正,并形式化地表征了:(1)執行這些行動所導致的事件狀態;(2)決定主體“是否有機會執行這些行動的”條件;(3)主體為了完成這些行動所應具備的能力。同時,使用選擇函數定義了信念收縮行動模型,這些函數選擇主體認知選項集的一個子集,并將該子集添加到其信念選項集,從而達到收縮其信念集的目的。

未來研究可以考慮:(1)從多個來源獲取信息的主體,如何對改變其心智的行動進行形式化?這時信息和來源的可靠性決定了主體是否改變其信念以及如何改變其信念。(2)如何對主體的行為動機進行形式化處理?

猜你喜歡
定義主體能力
消防安全四個能力
論自然人破產法的適用主體
南大法學(2021年3期)2021-08-13 09:22:32
大興學習之風 提升履職能力
人大建設(2018年6期)2018-08-16 07:23:10
你的換位思考能力如何
關于遺產保護主體的思考
成功的定義
山東青年(2016年1期)2016-02-28 14:25:25
抄能力
論多元主體的生成
修辭學的重大定義
當代修辭學(2014年3期)2014-01-21 02:30:44
山的定義
公務員文萃(2013年5期)2013-03-11 16:08:37
主站蜘蛛池模板: 9久久伊人精品综合| 国产91麻豆视频| 亚洲天堂网站在线| 一级毛片在线免费视频| 香蕉精品在线| 国产一区二区在线视频观看| 91久久精品日日躁夜夜躁欧美| 91成人在线观看视频| 日本午夜影院| 国内精品91| 亚洲an第二区国产精品| 婷婷亚洲最大| 中文毛片无遮挡播放免费| 成人在线天堂| 毛片在线看网站| 亚洲人成色77777在线观看| 欧美日本在线观看| 92精品国产自产在线观看| 情侣午夜国产在线一区无码| 91久久夜色精品| 国产人碰人摸人爱免费视频| 亚洲天堂在线免费| 亚洲三级色| 国产高清毛片| 国产精品一区在线观看你懂的| 国产欧美日韩专区发布| 中文字幕无码中文字幕有码在线| 日本高清有码人妻| 国产精品区视频中文字幕| 播五月综合| 久久青草免费91线频观看不卡| 2020国产精品视频| 久久一色本道亚洲| yjizz国产在线视频网| 青草免费在线观看| 18禁黄无遮挡网站| 国产永久在线观看| 亚洲综合在线最大成人| 欧美成人h精品网站| 蝴蝶伊人久久中文娱乐网| 国产午夜一级毛片| 国产成人高精品免费视频| 免费人成网站在线观看欧美| 国产乱子伦视频三区| 国产欧美日韩另类精彩视频| 婷婷综合色| 毛片网站观看| 日本人又色又爽的视频| 国产欧美亚洲精品第3页在线| 91精品人妻一区二区| 国产精品页| 日韩高清一区 | 欧美日一级片| 中文字幕永久在线观看| 永久成人无码激情视频免费| 婷婷综合亚洲| 国产精品主播| 免费看美女自慰的网站| 亚洲永久免费网站| 在线精品亚洲国产| 久草视频中文| 欧美成人影院亚洲综合图| 亚洲手机在线| 色噜噜狠狠狠综合曰曰曰| 亚洲欧洲天堂色AV| 久久精品无码专区免费| 在线观看免费人成视频色快速| 国产丝袜无码一区二区视频| 日韩成人在线网站| 1769国产精品免费视频| 性色生活片在线观看| 女高中生自慰污污网站| 欧洲一区二区三区无码| 成人在线观看不卡| 国产黄在线观看| 日本爱爱精品一区二区| 欧美成人区| 在线高清亚洲精品二区| 免费AV在线播放观看18禁强制| 网久久综合| 热久久这里是精品6免费观看| 91精品啪在线观看国产91|