張 順
(南京大學 哲學系,南京 210023)
?
科學確證的貝葉斯網絡模型
張順
(南京大學 哲學系,南京210023)
摘要:科學確證的假說演繹模型與貝葉斯確證模型分別體現了定性確證與定量確證的內涵,然而科學確證是一個在縱橫方向都具備復雜內涵的問題,兩種模型均沒克服因確證本身的復雜性與非單調性所帶來的一些難題。為此,將貝葉斯網絡方法運用到確證理論的建構中,通過圖論與貝葉斯確證理論的結合開拓確證理論研究的新進路,并構建貝葉斯確證網絡的簡單模型。同時,從模型的定義、結構建模、推理等方面闡述貝葉斯確證網絡的基本內容。
關鍵詞:科學確證;貝葉斯確證;貝葉斯確證網絡
一、前言


觀察證據E確證假說H,當且僅當,(1) E為偶然真;(2) H├E。

這些重構方案各自存在著不同程度的缺陷,這些缺陷在H-D的現有框架內是無法克服的,因為這個簡潔模型無法完全表現確證的本質。這一模型基本成功地刻畫了確證的第一層含義,它表明證據為理論提供了某種確定性的支持,這是確證的定性層面。然而,就科學檢驗的定性層面而言,不存在完全證實,只有弱證實性確證。我們可以做的只能是越來越逼近那不可能達到的證實,不斷提高理論的確證程度。這就涉及到科學檢驗的定量層面,需要引進邏輯概率進行定量刻畫。
貝葉斯確證理論的要義在于用概率來定量地測度證據對假說的支持程度。凱恩斯認為概率關系應當表示為P(a/h),即a與h之間的相對概率,對于不同的前提h,a/h的值可能不同。對于互為前提的兩個命題集,它們的條件概率將滿足一定的運算定理。18世紀的英國數學家托馬斯·貝葉斯提出了計算條件概率的公式:
(1)
用以描述兩個條件概率的關系,由此可以從舊的概率條件性考查新信息的概率條件性,從而提供了一種知識更新或信念修正的方法。這樣一來,條件概率正好可以說明確證中假說與證據的二元關系,假說或證據的命題本身的真假不是確證的主要內容,確證只能以條件概率的形式對假說與證據的相對關系進行量化描述,從而表達證據對假說的支持,而貝葉斯定理恰好提供了用條件概率刻畫確證度的方法。
在運用貝葉斯方法來構造科學確證模型時,由于對概率解釋的不同,分為邏輯貝葉斯派和主觀貝葉斯派。同樣是運用貝葉斯定理,邏輯主義者強調了其中精確而優雅的形式性與定量分析功能,主觀主義者則關注整個公式體現出來的動態感與人文性。以主觀貝葉斯確證模型為例,要建立科學確證的貝葉斯確證模型,就要將概率的公理化系統改造為命題的概率邏輯系統Pr,在這個系統中的貝葉斯定理可以表達為:
(2)
其中,Pr(e)﹥0,Pr(hi) ﹥0且h1,h2,…,hn是互斥且窮舉的。
如果將這里的h1,h2,…,hn看作n個競爭假說,e代表經驗證據,那么Pr(h)就表示假說的驗前概率,用以表達認知主體對假說相對于背景知識所具備的合理信念度;條件概率Pr(e/h)表示的是假說h相對于證據e的似然度;而Pr(h/e)就表示h相對于e的條件概率,在這里就表示假說的驗后概率,即給定事實e后假說h的概率,也就是我們關注的證據e對于假說h的確證度。在上述解釋下,我們就可以把貝葉斯定理應用于科學假說的檢驗。在這里面,貝葉斯定理充當了從先驗概率向后驗概率過渡的橋梁,這其實就把證據與假說更直接地聯系了起來,體現了證據對假說確證的動態過程[6]。

在人工智能領域,人們很早就注意到不確定性推理與歸納邏輯的關系,在20世紀60年代初將貝葉斯定理引入人工智能研究,這些可謂是早期的貝葉斯系統,這一系統的思路與卡爾納普對概率的邏輯解釋和他的可能世界語義類似。一方面,系統獲取巨大的概率數據表,進行存儲運算;另一方面,用原子事件和全聯合分布的概率來描述世界,用若干原子事件的析取來表示各種命題或事件,而有了全聯合分布概率表,就可以通過對命題中的原子事件的概率求和得到命題的概率。然而,正如卡爾納普所遇到的困難一樣,這種全聯合分布面臨著計算復雜的困難。對于二值隨機變量,假設邏輯域中有n個隨機變量,那么概率表中的原子事件為2n個,更別說要對這些原子事件進行聯合運算,要計算的數目將達到一種驚人的程度,類似于“指數爆炸”。
有沒有一種方法或者說找到某種獨立性原則來將全聯合分布分解為較小的聯合分布呢?1986年,Pearl提出了作為專家系統的貝葉斯網絡[7],這一網絡將概率論中的貝葉斯定理與運籌學中的圖論相結合,通過概率模型中的條件獨立性原則和圖論中的d-separation標準將概率聯合分布處理成更加簡潔的形式。模型表達的復雜度得以降低,人們可以提高推理效率,用概率方法來解決大型問題??茖W確證的問題同樣是不確定性知識推理和復雜度較高的問題,可以嘗試用貝葉斯網絡來構建確證理論的新模型。
二、貝葉斯網絡與貝葉斯確證
簡單來說,貝葉斯網絡就是一個具有因果語義的有向無環圖(Directed acyclic graph,簡稱DAG),它是貝葉斯方法與圖論的有機結合。
(一)從圖論到貝葉斯網絡
圖論是廣泛應用于物理學、化學、控制論、計算機等多個領域的運籌學分支,一般一個圖由一些點及點之間的連線組成。其中帶箭頭的連線稱作弧,不帶箭頭的線稱作邊,根據圖中的連線性質不同,可以分為有向圖和無向圖。貝葉斯網絡的基本結構就是一個有向無環圖(DAG)。在一個DAG中,結點通過有向弧建立起關聯關系,被一條弧連接起來的結點稱為鄰居結點,若是由x指向y,則稱x為y的父結點,y為x的子結點。有些結點沒有父結點,則被稱為根結點;有些結點沒有子結點,則被稱為葉結點。一個結點的父結點及父結點的祖先結點構成它的祖先結點;一個結點的子結點及子結點的后代結點構成它的后代結點。另一方面,這里的“無環”意味著圖中不包含任何回路,也就是從x無法通過其他結點及有向弧的連接回到x。
在一個圖模型中,可以用結點來表示問題域中的變量,用連線來表示變量之間的關系。這樣圖論也就為表達相互影響變量間的關系提供了直觀的描述方法,符合人的自然理解和語義關系。同時,圖論還可以運用知識表示不確定性建模及處理的方法,來直觀描述變量間影響的定量化程度,從而通過參數模塊的設置將整個復雜系統整體作為一個模塊來研究。這是解決不確定性問題和復雜性問題的一種自然直觀的方法[8]。
進一步講,在有向無環圖中,我們用結點來對應問題域中的屬性描述,用有向邊來表示屬性之間的相互依賴關系,子結點的取值依賴于其父結點的值。如果我們將這種依賴關系在語義上解釋為因果關系,或者說“當我們將因果解釋賦予DAG中的有向邊集合時,這個DAG圖就變成一個因果網絡”[9]。在因果解釋下,每一個從父結點x到子結點y的過程都被解釋為y因果依賴于x,而這時候就會引入概率來對這種因果支持語義進行具體的量化描述。因果網絡使用的概率一般是主觀概率,反映個體的知識狀態和主觀信念,能夠很好地說明條件概率和條件獨立。
(二)條件獨立原則與d-separation標準
那么一個概率表示的因果網絡又如何成為貝葉斯網絡呢?
貝葉斯網絡不僅是帶有概率信息的有向無環圖,而且在概率和圖形方面都有相應的獨立性規范。在這里,要同時運用概率論中的條件獨立性與圖論中的d-separation兩條原則來對帶有概率信息的因果網絡進行規范。條件獨立性也稱之為馬爾可夫條件,針對的是問題域中的變量,它要求在給定父結點變量的條件下,每個變量都獨立于它的非后代結點。d-separation標準是定義有向無環圖中結點關系的一條原則,簡單說來就是結點集A的父結點集Pa(A) d-separation A和A的其他祖先結點集B。在直觀的有向無環圖中,d-separation就表現為Pa(A)“阻斷”了所有從B到A的通路。
馬爾可夫條件說明的是概率分布中變量間的條件獨立關系,而d-separation則說明的是有向無環圖中結點間的“幕隔”性。在一個概率因果網絡中,d-separation恰恰是對結點所對應的變量間的條件獨立關系的直觀表達,我們很容易通過對結點在有向弧連接下的關系就判斷它們所表示的變量是條件依賴關系還是條件獨立關系。當然,在一個完整的因果網絡中,還可能包含邊緣獨立等關系。如果用這兩條標準來說明貝葉斯網絡的定義,就可以作如下表述:如果有向無環圖G是概率分布P的“獨立性地圖”,即G中的所有結點的d-separation性都對應著相應變量的概率條件獨立性;并且G是P的最小“獨立性地圖”,即刪除任何一條弧G都不再是P的“獨立性地圖”,那么就稱G是P的貝葉斯網絡[10]。
從確證理論模型的發展脈絡來看,我們將貝葉斯確證模型當作是當前確證理論的代表模型,是對確證過程邏輯與非邏輯因素刻畫的經典模型。貝葉斯網絡模型是一個包括定性知識(結構關系、因果關系)和定量知識(概率、條件概率)的系統模型;它的推理原理基本是依據貝葉斯概率理論,貝葉斯方法是其計算的核心方法;它在結構上、數據上都能夠表達因果性或概率支持語義。因此,理論上可以將貝葉斯確證與貝葉斯網絡結合,構建出新的科學確證模型,以完整貼切地刻畫科學理論的確證過程。如此構造的確證模型,本文稱之為貝葉斯確證網絡模型。
從貝葉斯確證的角度看,該模型的主要任務是將確證理論的傳統表述用有向無環圖重新構建出來,在貝葉斯網絡中用結點間的關聯來表達確證理論中假說與證據的關系,用條件概率分布表給出初始主觀概率及相應的條件概率;從貝葉斯網絡的角度看,就是將有向無環圖的因果解釋改變為科學確證解釋,表明網絡結構所表達的不是變量間的因果關系,而是假說與證據間的解釋、支持或確證關系。
這樣的網絡是圖論與確證理論的結合,由網絡結構與網絡參數兩部分組成。有向無環圖的結構表征確證域中相關假說與證據之間的關聯信息,體現它們之間的條件依賴關系或獨立關系;相關結點的參數設置則表征該變量的先驗概率或者變量之間的條件概率,體現變量之間的相互影響程度。
三、結構與推理
貝葉斯網絡是定性與定量方法的有機結合,其網絡結構表達了定性知識,即變量間的因果聯系;網絡參數則表達了定量知識,即變量間影響的程度。整個網絡構成了一種可視化、技術化的知識表達與推理模型,十分貼切地表示了結點間的因果關系。要建構貝葉斯確證網絡,我們必須先對應貝葉斯網絡的結構與推理機制。
(一)貝葉斯網絡的結構與推理
我們可以將貝葉斯網絡分為兩部分來研究:網絡結構與網絡參數。其中,網絡結構就是指有向無環圖(DAG),在貝葉斯網絡中,結點同樣表示隨機變量,結點間的有向弧則表示了變量間可能的因果關系。結點與有向弧共同構成了貝葉斯網絡的定性知識部分。在這樣的結構中,結點與有向弧的圖形化描述方法不僅直觀體現了變量間的依賴關系,形成一個整體的可視的聯合分布;同時也直接鮮明地表達了條件獨立性的語義,可以看作是變量間條件獨立性的一個自然的可視的“聲明”。
對于變量間概率依賴強度的條件概率值的刻畫是貝葉斯網絡的參數部分,即條件概率分布表(Conditional probability distribution,簡稱CPD)。在貝葉斯網絡中,每一結點都有一個該結點的邊緣概率表(根結點對應的是邊緣概率)或在給定父結點狀態時的條件概率分布表。這些對于條件概率的具體刻畫就形成了貝葉斯網絡的定量知識層面。如此一來,就達到了對變量間依賴的程度的具體刻畫,同時將復雜的知識系統分解成了若干較簡易的概率表,從而降低了整個系統的復雜度。基于網絡結構所聲明的條件依賴性和獨立性信息,就可以運用鏈式規則從條件概率表的參數得到整個網絡的全聯合分布。
圖1就是一個簡單的貝葉斯網絡的例子,這其中有C(cloudy)、R(rain)、S(sprinkle)、W(wet pavement)四個變量或結點,結點間的影響關系通過有向線段表示出來;而每個結點旁邊都有一個對應的概率分布表,分別說明每個結點在給定其父結點不同狀態下成立或不成立的條件概率。其中Cloudy是沒有父結點的根結點,故它的概率表是邊緣概率表。

圖1 一個貝葉斯網絡的例子
在上述結構與參數描述下,變量間因果關系的條件依賴性與獨立性都用圖形的形式直觀體現了出來,并且用概率分布表達了這種關系的具體程度,所以運用鏈式規則與貝葉斯定理的不確定性推理就可以進行。貝葉斯網絡中的推理主要分為兩種:因果推理與診斷推理。
因果推理即是網絡中自上而下的推理,又稱正向推理。它可以從有向弧的父結點信息運用因果推理算法得到子結點的相關狀態信息,在風險系統中也可以根據初始信息來預測其它信息。在圖1中,如P(W/S)的計算:
診斷推理是自下而上的推理,又稱反向推理。這種推理可以用來根據觀察到的結果查找相關的原因,診斷系統問題。在圖1中,對P(S/W)的計算就是一種診斷推理:P(S/W)=P(W/S)P(S)/P(W)。
對于一個特定問題域而言,只要能明確理清該問題的語義系統,就可以運用專家知識根據因果關系進行結構建模(包括結點與變量的定義、結構的定義、結點狀態的定義等)、參數建模(即是對整個網絡的賦值),表達出問題知識的基本形式和完整分布。而后再利用貝葉斯方法進行網絡推理,根據研究目標得到需要的結果。
(二)貝葉斯確認網絡的結構與推理
對貝葉斯確證網絡模型的構建過程就是對貝葉斯網絡模型進行重新建模的過程。對于科學確證問題而言,最重要的就是這一模型所呈現的結構、參數、推理是否表達了對應的語義,并且有助于相關問題的解決。相對來說,確證理論的貝葉斯網絡模型是一個比較簡單的貝葉斯網絡,只涉及假說和證據兩類變量。假說之間是相互競爭而獨立的,證據之間也不會構成關聯,而且它們之間的關系基本只有從假說到證據這一級。因此,貝葉斯確證網絡模型的結構一般是拓撲結構,結點之間一般只有如圖2所示的3種基本連接模式:順連、分連、匯連。

圖2 貝葉斯確證網絡結點之間的關系
順連表示假說H對證據E的直接影響,分連則表示同一假說既能解釋證據E1又能解釋證據E2,匯連則表示假說H1與H2共同影響E,或者說同一證據E既能說明假說H1又能說明假說H2。對于貝葉斯確證網絡模型中的參數設置,基本是按照貝葉斯確證模型的思路,給出符合主觀信念的條件概率即可。
在這3種連接模式及主觀概率參數的基礎上,就可以根據假說與證據的邏輯關系構建出一個完整的貝葉斯確證網絡模型。
在貝葉斯因果網絡中,它的推理主要有正向和反向兩種(圖3)?;谪惾~斯網絡所蘊涵的因果關系解釋,正向推理其實也就是從原因推導結果的因果推理,反向推理則是從結果追溯原因的診斷推理。推理的結構在圖中是不會直接揭示的,而是根據整個系統的語義設置和研究的需要而形成某種特定的形式與內容。

圖3 確證網絡中的兩種推理
對于貝葉斯確證網絡而言,由于它所承擔的語義解釋是科學檢驗的解釋,所以假說與證據間的相互關系也就表現為假說對證據的解釋、推斷以及證據對假說的確證、支持,因而網絡中的推理也就不再是因果性質的。具體而言,在貝葉斯確證網絡中的正向推理體現的是從假說到證據的解釋、推斷過程,反向推理體現的是從證據到假說的確證、支持過程,也有一定的概率依賴語義,但其實質是考察證據的觀察結果在多大程度上支持假說,給予它多高的確證度。
就本文的研究目的而言,我們主要關注這個網絡中的反向推理,即在給定初始值和相關條件概率的情況下計算假說的后驗概率,這與貝葉斯確證模型的確證思路是一樣的。而正向推理的結構說明的是科學解釋的邏輯。



圖4 基于假說演繹模型的簡單貝葉斯網絡

這樣一來,我們就得到了一個單假說、單證據條件下簡潔但卻完整的貝葉斯確證網絡模型。如此,不僅具備合理的網絡結構與概率參數,而且可以進行相應的確證推理與邏輯運算。
五、 基于貝葉斯確證理論的復雜貝葉斯網絡
對于多個假說,甚至多個證據,依據同樣的原理也可以構造假說確證的貝葉斯網絡。以歷史上對于光的本質的兩種假說即波動說(H1)和微粒說(H2)為例,我們選擇一些與兩種假說相關聯的證據。波動說可以用來解釋光的衍射E1、雙縫干涉實驗E2以及光的反射E3,它們三者之間彼此無關;而微粒說則可以解釋光的反射E3、影子E4、光粒子E5和光的直線傳播E6,它們彼此之間也無關聯。這其中兩個假說是相互競爭獨立的關系,證據之間是相容且獨立的關系,假說與證據間可以用有向弧表示出條件依賴關系。根據聯合概率的鏈式規則以及條件獨立性,用全聯合概率分布來表達它們的關系也就是:Pr(H1,H2,E1,E2,E3,E4,E5,E6)=Pr(H1)Pr(H2)Pr(E1/H1)Pr(E2/H1)Pr(E3/H1,H2)Pr(E4/H2)Pr(E5/H2)Pr(E6/H2)。
根據前文描述的方法,構造的相關貝葉斯網絡,如圖5。

圖5 光的本質的兩種假說及其相關證據的

六、結語
作為概率論、因果推理、圖論相結合的科學成果,貝葉斯網絡確有其獨特的魅力與包容性。本文的結構建模只是初步性的嘗試,是基于確證理論知識的兩種基本結構形式,對于更加復雜多元的確證問題,可能還需要構建更加有效的網絡結構。但通過這樣的工作已經不難看出,將貝葉斯網絡注入到科學確證理論的新鮮血液給確證理論帶來深遠蓬勃的生命力,給確證理論的表示方式和推理模型都帶來極大的更新。相比于之前的確證理論模型,貝葉斯確證網絡模型有不少優點和潛力。
首先是圖形表達方式帶來的可視化、模型化效果。確證理論中的知識與變量本身是多元且互動的,數據結構也有一定的復雜度,在文字語言中很難被簡單化處理。確證網絡通過有向無環圖的形式把這些知識、數據統一在網絡模型中,自然而貼切地蘊涵了結點變量之間的確證關系。
其次,確證網絡還解決了不確定性知識處理與復雜性的問題。使得確證理論的模型不僅具有確證推理的能力,還揭示了科學解釋、推斷的邏輯;同時可以利用獨立性原則分解全聯合分布,根據網絡參數進行局部模塊處理,降低了系統的復雜度,使得網絡可以處理諸如多假說多證據之類的較復雜問題。
再次,確證網絡不僅具有科學檢驗的語義,也具有一定的因果和信念度語義,使得網絡可以基于專家知識和新增信息對網絡的結構和參數進行學習,也保障了確證的結構和數據隨著科學檢驗的實踐而不斷修正。
最后,確證網絡的構建使得確證理論的形式化進入一個新階段。它在圖論和貝葉斯定理框架下具有規范的建模方法和推理算法,可以通過計算機技術實現程序化。這也就意味著我們可以用更精確的形式化方法來刻畫確證知識的表達和推理,并借此處理大型確證問題,同時也為確證網絡的應用提供了可能。
參考文獻:
[1]張大松.科學確證的邏輯與方法論[M].武漢:武漢出版社,1999.
[2]GLYMOUR C.Theory and evidence[M].Princeton:Princeton university press,1980:12.
[3]艾耶爾A J.語言、真理與邏輯[M].尹大貽,譯.上海:上海譯文出版社,2006:8.
[4]HEMPEL C G. Studies in the logic of confirmation,aspects of scientific explanation[M].New York:The Free Press,1965:26.
[6]陳曉平.貝葉斯方法與科學合理性——對休謨問題的思考[M].北京:人民出版社,2010:100.
[7]PEARL J.Fusion,propagation,and structuring in belief networks[J].Artificial intelligence,1986(29):241-288.
[8]姜江,陳英武,常雷雷.證據網絡推理學習理論及應用[M].北京:科學出版社,2013:29-31.
[9]SPOHN W.Bayesian nets are all there is to causal dependence[M]//Stochastic causality.stanford:CSLI publications,2001:157-172.
[10]PEARL J.Probabilistic reasoning in intelligent systems:networks of plausible inference[M].San Mateo,California:Morgan Kaufmann,1988:116-122.
(責任編輯張佑法)
Bayesian Network Model of Scientific Confirmation
ZHANG Shun
(Department of Philosophy, Nanjing University. Nanjing 210023, China)
Abstract:The two classical confirmation theories-hypothetico-deductivism and Bayesian confirmation model respectively embody the connotation of qualitative confirmation and quantitative confirmation. However, scientific confirmation is an issue with complex content in its all directions. The two models fail to conquer the complexity and nonmonotonicity of the theory itself. This paper attempts to apply the Bayesian network method to the construction of confirmation theory. The combination of graph theory and Bayesian confirmation theory opens up a new research pathway of confirmation theory. Meanwhile, this paper tries to construct simple models of Bayesian confirmation network and elaborates this network’s basic content in terms of its definition, structure modeling, reasoning etc.
Key words:scientific confirmation; Bayesian confirmation; Bayesian confirmation network
收稿日期:2016-01-08
基金項目:國家社會科學基金項目“歸納悖論與確證邏輯新探”(11BZX061);江蘇省社會科學基金項目“形式知識論研究”(10ZXC009)
作者簡介:張順(1992—),男(苗族),重慶黔江人,碩士研究生,研究方向:現代邏輯與邏輯哲學。
doi:10.3969/j.issn.1674-8425(s).2016.06.003
中圖分類號:B81
文獻標識碼:A
文章編號:1674-8425(2016)06-0014-07
引用格式:張順.科學確證的貝葉斯網絡模型[J].重慶理工大學學報(社會科學),2016(6):14-20.
Citation format:ZHANG Shun.Bayesian Network Model of Scientific Confirmation[J].Journal of Chongqing University of Technology(Social Science),2016(6):14-20.