999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于因果關系的人工智能

2022-11-15 07:54:28張勤
軍事運籌與系統工程 2022年2期
關鍵詞:模塊化定義人工智能

張勤

(1.清華大學 核能與新能源技術研究院,北京102202;2.清華大學 計算機系,北京100084)

1 引言

中國科協在2022 年6 月27 日召開的科協年會上發布了“2022 十大前沿科學問題”,其中第2個問題是:“如何實現可信可靠可解釋人工智能技術路線和方案”[1]。科技部在“科技創新2030——‘新一代人工智能’重大項目2021 年度項目申報指南”中的第一章“新一代人工智能理論基礎”中,將“因果推理與決策理論模型研究”列為第1.1 節的標題,要求“突破模型泛化瓶頸問題,提升模型系統的安全性、魯棒性及可解釋性”,“降低對數據獨立同分布的依賴,提升泛化能力和可解釋性”[2]。顯然,當前流行的深度學習模型存在的泛化和不可解釋等問題,導致了不可信、不可靠和魯棒性等問題。科技部指南提出了“因果推理與決策”的技術路線,是對第一代基于知識的人工智能技術路線的某種回歸,因為知識主要就是對事物間因果關系的描述。

但細觀內容,科技部的指南仍然在數據驅動的框架內,因為指南中1.1 節的內容要求構建“數據驅動的因果網絡結構學習理論”。網絡的參數學習當然也是應有之義,但不是重點。這反映了科技部指南希望新一代人工智能既吸收第一代知識驅動的人工智能的優點,又保留第二代大數據深度學習優點的樸素想法。

2 因果貝葉斯網絡

當前,最流行的因果網絡結構學習模型是圖靈獎獲得者美國加利福亞尼大學洛杉磯分校的朱迪亞·珀爾教授創立的因果貝葉斯網絡(Causal Bayesian Network,CBN)[3],即將貝葉斯網絡(Bayesian Network,BN)[4]具體化為CBN。

BN 也是珀爾為主創立的,其定義為:

式(1)中,Pr{}是求概率的算符,Xi是網絡節點變量,xi是Xi的一個取值或實例,pai是Xi的父變量取值的組合。實際上,是Xi的一個條件概率。在變量狀態離散情況下,由Xi =xi和pai的各種取值構成的條件概率構成一個條件概率表(Conditional Probability Table,CPT),用以表達子變量Xi與其父變量(準確地說應該是條件變量)之間的條件概率關系。

在變量狀態離散情況下,我們可以將Xi =xi簡記為Xi,ji或Xiji,即Xi處于ji狀態或取值。這樣,式(1)可改寫為式(2):

根據式(1)或式(2)對BN 的定義,BN/CBN 的結構必然是有向無環圖(Directed Acyclic Graph,DAG),也就是說,BN/CBN 的結構不能出現有向有環圖(Directed Cyclic Graph,DCG)。例如,圖1 是基于DAG 的BN 示例圖,圖2 是DCG 示例圖,是不被允許的(沒有定義)。

圖1 基于DAG 的BN 示例

圖2 DCG 示例

式(1)或式(2)表達了BN 中的節點變量的聯合概率分布(Joint Probability Distribution,JPD),但節點的排序可以是任意的。例如:

式(3)中的第一個等式可用圖1a)表達,第二個等式可用圖1b)表達。在不指定變量狀態的情況下,圖1a)成為圖1c),圖1b)成為圖1d)。箭頭指向為父變量→子變量。父變量與子變量之間的不確定性由CPT 表達。也就是說,同一個JPD 可以有不同但等價的BN。這說明BN 只是JPD 的因式分解表達,并不必然表達變量間的因果關系,從而難以表達知識、難以可解釋。僅當BN 中的父節點是子節點的真正直接原因變量而非僅僅是條件變量時,BN 才成為CBN,才能表達變量間的因果關系,才具有可解釋性。

要獲得CBN,需要從反映JPD 的統計數據中學習CBN 的結構和參數[1]。這一過程通常被稱為因果發現,其中需要通過存在于數據中的獨立性和相關性并通過do 干預算子來確定變量間的因果關系。在有多個可能CBN 的情況下,用奧卡姆剃刀(最簡化)原則和穩定性原則來選擇最可能的CBN,且根據BN 的定義,CBN 不能有DCG。

3 因果貝葉斯網絡的不足

盡管CBN 具有數學理論嚴謹等優點,但CBN也存在如下缺點,導致其難以普遍應用:

(1)對數據質量要求高(要體現各種獨立性和相關性),數據獲取難。

(2)從數據學出的因果結構未必符合領域專家的認知,從而難以被接受。

(3)用來選擇候選結構的奧卡姆剃刀(最簡化)和穩定性原則是經驗原則,科學性不夠。

(4)不適用于存在靜態邏輯循環DCG 的情況,這是BN/CBN 的定義所決定的。

(5)因不允許DCG,無法通過模塊化的方式構建CBN,導致構建模型困難和構建了也難以理解。

(6)父變量之間的邏輯關系隱藏在CPT 中(Implicit 表達)[5],可解釋性不足,父變量間以及概率參數相互耦合(CPT 表達的是父變量的狀態組合與子變量狀態之間的條件概率)。

(7)難以利用領域專家已有的因果知識。

(8)計算復雜度高,計算效率低,難以用于大型復雜系統。

此外,其是否避免了數據獨立同分布假設從而避免了泛化問題存疑。

一般來說,大型復雜系統的建模是一項艱巨的任務。理想的方法是模塊化建模,即分別構建多個小的模塊(局部),然后合成為完整模型(全局),這樣可以以指數規模減少收集樣本數據[4]。但這種方法很可能導致全局模型中出現DCG,這是BN/CBN 的定義所不允許的。例如,在不考慮氣候因素的情況下,環境學者研究地表水X1減少的原因,發現植被覆蓋率低X2和人類浪費水X5是主要原因(如圖3a)所示),并進行了統計,得到了三者之間的CPT(X2、X5是X1的父變量);植物學者研究植被覆蓋率低X2、土壤沙化X3和人類砍伐森林X4之間的關系(如圖3b)所示),得到了三者之間的CPT;土壤學者研究土壤沙化X3、地表水缺乏X1和植被覆蓋率低X2之間的關系(如圖3c)所示),統計出了三者之間的CPT。將三個模塊合成(相同變量合并),可得圖3d),但其中存在DCG(X2→X3→X2;X1→X3→X2→X1)。根據BN/CBN 的定義,圖3d)是無定義的。也就是說,BN/CBN 難以采用模塊化的方式構建。

圖3 模塊化合成全局模型示例

4 動態不確定因果圖

為克服BN/CBN 的不足,筆者及其團隊創立了DUCG 理論[5~17],其基本思想是從因果關系的底層而非表象層表達和處理不確定因果關系。

所謂表象層,就是數據統計層面。例如BN/CBN 就是用統計得來的CPT 表達變量之間基于DAG 結構的因果關系的不確定性,既無法顯式(Explicit)表達父變量之間的邏輯關系,也不允許DCG,各變量和參數相互耦合,難以模塊化建模、難以動態和局部增刪修改模型、難以高效推理計算。

所謂底層,就是父子間因果作用機理層。DUCG 用獨立的虛擬因果作用隨機事件變量P(用于單賦值DUCG:S-DUCG)或A(用于多賦值DUCG:M-DUCG)表達每個父變量對子變量的不確定因果作用機理,多個父變量對子變量的關系為簡單邏輯或(S-DUCG)或者權重邏輯或(M-DUCG),復雜的關系由邏輯門變量G顯式表達,并將G作為一個父變量對待。獨立的P或A事件的發生概率表達因果關系的不確定性,這些獨立事件及其概率的組合構成DUCG 的JPD 和CPT,從而將統計意義上耦合在一起的各個變量和參數解耦,進而在推理計算中引入邏輯化簡(去掉與當前問題無關部分),引入由獨立事件組成的因果鏈展開和邏輯運算,用矛盾律(結果不能同時是自己的原因)在因果鏈展開中解環,引入不確定證據算法、遞歸算法等,大幅提高計算效率和精準度,既可溯源,又可預測,也可反事實(Counterfactual)推理。其自動歸一化定理保證了DUCG 可在不完備表達情況下精確推理。

所謂單賦值S-DUCG,是指子變量的一個狀態(狀態1)的原因被表達,另一個狀態(狀態0)只能是狀態1 的補集,其原因不能被單獨表達;所謂多賦值M-DUCG,是指子變量的任何一個狀態的原因可以被單獨表達。從數學上看,S-DUCG 完全滿足概率論(集合論);M-DUCG 則有所突破,需要建立一個新的數學模型——權重集合論,來處理同一變量不同狀態互斥(相關)和各狀態原因獨立表達之間的矛盾。兩者可以混合,統稱為DUCG(詳見文獻[7]和[8])。

圖4 是與圖3 對應的M-DUCG,其中根原因變量用字母B表達,獨立的虛擬因果作用隨機事件變量用加粗有向弧表達,以區別于BN/CBN。注意,DUCG 允許DCG,使得模塊化構建DUCG 成為可能。如何用圖3a)、b)和c)的局部統計數據構建圖4d)那樣的全局DUCG、JPD 和CPT,進而定義和計算圖3d)的帶DCG 的BN/CBN,參見文獻[6]和[17]。

圖4 模塊化合成全局M-DUCG 的示例

模塊化建模的優勢明顯:除每個局部(模塊)可解釋性強、可隨時通過修改局部而重構全局模型外,還可顯著降低統計數據的收集量和難度。例如一個包含20 個模塊的系統,每個模塊有10 個變量,去重后共計100 個變量,每個變量有2 個狀態。按照100 個變量狀態的每個組合收集10 個樣本計,共需收集2100×10 =1.267×1031個樣本。如果采用模塊化方式建模和收集樣本,按照相同的標準,僅需收集20×210×10 =2.048×105個樣本。

圖5 是M-DUCG 的數學模型(S-DUCG 類似,參見文獻[7])。

圖5 M-DUCG 模型

其中,D是缺省原因(或未知原因)事件,SX是特異性(金標準)子事件變量,BX是集成或受風險因素影響后的B變量;Ank;iji是父事件Viji導致子事件Xnk發生(即Xnk;iji發生)的獨立的虛擬因果作用隨機事件,其發生概率ank;iji =Pr{Ank;iji}表達Viji導致Xnk發生的不確定性;rn;i表達Vi與Xn之間是否存在因果關系的不確定性。“+”是權重邏輯或算符,其作用與互斥或EOR 相似,但含義不同。Fnk;iji是權重虛擬因果作用隨機事件,Pr{Xnk;iji}=Pr{Fnk;ijiViji} 是Viji對Xnk發生的概率的貢獻。

用公式表達M-DUCG,就是式(4):

如果V =X,可重復使用式(4),直到V∈{B,D} 。

作為一個原創的理論體系,DUCG 還有很多內容,不在此一一介紹。有興趣的讀者可參閱文獻[15]~[17]。

目前DUCG 已在大型復雜工業系統故障監測、預報、診斷、發展預測、決策支持、安全評價、臨床輔助診斷等領域投入實際應用。以全科臨床診斷為例,已覆蓋發熱、腹痛等43 個主訴癥狀、每個主訴含跨科室的數十到上百個疾病,去重后覆蓋1 400多個疾病、10 000 多個ICD-10 疾病代碼,在基層醫院實際診病已逾30 萬例,只在早期出現過8 例診斷錯誤(已糾正無再錯),具有天然的可解釋性,算法透明,無泛化問題,安全可靠魯棒,還能精確推薦下一步該做的檢查,動態生成患者個體優化臨床路徑,顯著節省檢查費用。

5 結束語

如珀爾所述[18],因果關系是打開可信人工智能的鑰匙。當然,筆者認為基于因果關系的可信人工智能未必是全能的。只要能夠可信地解決應用領域的實際問題,包括可解釋性和泛化問題,就實現了新一代人工智能的初衷。

猜你喜歡
模塊化定義人工智能
模塊化自主水下機器人開發與應用
模塊化住宅
現代裝飾(2020年5期)2020-05-30 13:01:56
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
ACP100模塊化小型堆研發進展
中國核電(2017年2期)2017-08-11 08:00:56
模塊化VS大型工廠
流程工業(2017年4期)2017-06-21 06:29:50
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
下一幕,人工智能!
南風窗(2016年19期)2016-09-21 16:51:29
成功的定義
山東青年(2016年1期)2016-02-28 14:25:25
修辭學的重大定義
當代修辭學(2014年3期)2014-01-21 02:30:44
主站蜘蛛池模板: 亚洲精品第一在线观看视频| 国产无码制服丝袜| 99在线观看国产| 萌白酱国产一区二区| 国产欧美视频在线| 欧类av怡春院| 婷婷丁香在线观看| 高清精品美女在线播放| 国内精品一区二区在线观看| 99九九成人免费视频精品 | 久久视精品| 69国产精品视频免费| 天堂亚洲网| 91丝袜在线观看| 成人午夜久久| 色综合成人| 亚洲黄色激情网站| 四虎国产永久在线观看| 色妞www精品视频一级下载| 高清亚洲欧美在线看| 另类综合视频| 欧美日韩北条麻妃一区二区| 好吊妞欧美视频免费| 久久久久久国产精品mv| 国产香蕉在线| 亚洲综合网在线观看| 99久久精品免费视频| 成人午夜亚洲影视在线观看| 中文成人在线| 自拍偷拍欧美日韩| 超碰aⅴ人人做人人爽欧美 | 亚洲欧美日韩动漫| 国产欧美日韩精品第二区| 久久a级片| 蜜桃视频一区| 91久久天天躁狠狠躁夜夜| 日韩欧美国产成人| 成人一级黄色毛片| 波多野结衣无码视频在线观看| 伊人激情综合| 91久久偷偷做嫩草影院电| 欧美综合成人| 国产一区二区视频在线| 精品福利国产| www.youjizz.com久久| 人妻少妇乱子伦精品无码专区毛片| 亚洲一区网站| 久久综合成人| 色国产视频| 久久婷婷人人澡人人爱91| 午夜小视频在线| 国产精品永久久久久| 欧美中文字幕一区| 久久中文电影| 爆乳熟妇一区二区三区| 精品国产香蕉伊思人在线| 亚洲精品无码av中文字幕| 精品一區二區久久久久久久網站 | 日本不卡在线| 人妻精品久久无码区| 五月天久久婷婷| 亚洲欧洲综合| 99re在线观看视频| 国产va欧美va在线观看| 国产激情在线视频| 亚洲欧美h| 久久精品免费看一| 国产成人91精品免费网址在线| 久久亚洲中文字幕精品一区| 久久综合色天堂av| 国产91九色在线播放| 国产91色| 欧美日韩一区二区三区四区在线观看| av在线无码浏览| 亚洲精品无码AV电影在线播放| 国产不卡网| 国产成人精品一区二区| av手机版在线播放| 亚洲精品欧美重口| 国产精品视频999| 国产jizz| 亚洲成人精品久久|