融合機(jī)器學(xué)習(xí)與知識(shí)推理的可解釋性框架①

2021-08-02 11:08:16李迪媛康達(dá)周

計(jì)算機(jī)系統(tǒng)應(yīng)用 2021年7期

李迪媛,康達(dá)周

1(南京航空航天大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院/人工智能學(xué)院,南京 211106)

2(南京航空航天大學(xué) 高安全系統(tǒng)的軟件開發(fā)與驗(yàn)證技術(shù)工信部重點(diǎn)實(shí)驗(yàn)室,南京 211106)

3(軟件新技術(shù)與產(chǎn)業(yè)化協(xié)同創(chuàng)新中心,南京 210023)

機(jī)器學(xué)習(xí)[1]是計(jì)算機(jī)基于數(shù)據(jù)進(jìn)行和改進(jìn)預(yù)測(cè)或行為的一組方法[2],在效率、規(guī)模、可重復(fù)性等方面相較人類更加出色.因此,利用機(jī)器學(xué)習(xí)技術(shù)可以解決現(xiàn)實(shí)中很多領(lǐng)域的問(wèn)題,如自動(dòng)駕駛[3,4]、醫(yī)療診斷[5,6]、自然語(yǔ)言處理[7]等.

在很多重要領(lǐng)域,機(jī)器學(xué)習(xí)結(jié)果對(duì)最終決策具有重大影響.例如,使用機(jī)器學(xué)習(xí)技術(shù)實(shí)現(xiàn)的宮頸癌細(xì)胞圖像自動(dòng)識(shí)別系統(tǒng),其識(shí)別結(jié)果能夠輔助醫(yī)師診斷宮頸癌,這不僅大幅度降低了人工成本,還提高了識(shí)別效率.然而,機(jī)器學(xué)習(xí)模型作為缺少可解釋性的黑盒,人們不理解它為什么會(huì)做出某種特定的決策,其輸出結(jié)果不能讓人完全信任.比如說(shuō),醫(yī)師很難信任缺少可解釋性的宮頸癌細(xì)胞圖像自動(dòng)識(shí)別系統(tǒng)的結(jié)果.因此,賦予機(jī)器學(xué)習(xí)系統(tǒng)可解釋性非常重要.

可解釋性是人們能夠理解決策的方法[8].在機(jī)器學(xué)習(xí)系統(tǒng)的上下文中,它是向人類解釋或以可理解的術(shù)語(yǔ)呈現(xiàn)的能力[9].從本質(zhì)上講,可解釋性是人類和決策模型之間的接口,它既是模型的準(zhǔn)確代理,又是人類可以理解的[10].可解釋性能夠讓人類明白系統(tǒng)做出決策的邏輯,還可以幫助人們更好地了解結(jié)果可能失敗的原因.

機(jī)器學(xué)習(xí)可解釋性分為本質(zhì)可解釋性和事后可解釋性兩類.本質(zhì)可解釋性意味著機(jī)器學(xué)習(xí)模型自身具有可解釋性,一般在模型較為簡(jiǎn)單時(shí)實(shí)現(xiàn),例如線性回歸模型,它將目標(biāo)預(yù)測(cè)為特征輸入的加權(quán)和,所學(xué)到的線性關(guān)系使解釋變得容易[11];決策樹模型通過(guò)遍歷決策樹的節(jié)點(diǎn)(類別和屬性)、根節(jié)點(diǎn)到葉子節(jié)點(diǎn)的路徑(決策規(guī)則),提供對(duì)簡(jiǎn)單模型決策過(guò)程的模擬實(shí)現(xiàn)[12].事后可解釋性是利用可解釋性技術(shù)來(lái)解釋復(fù)雜機(jī)器學(xué)習(xí)模型,例如基于個(gè)體條件圖的可解釋性模型,它為每個(gè)實(shí)例顯示一條線,該線顯示了特征更改時(shí)實(shí)例的預(yù)測(cè)如何改變[13];基于規(guī)則的可解釋性模型通過(guò)從受訓(xùn)模型中提取解釋規(guī)則的方式,提供對(duì)復(fù)雜模型尤其是黑盒模型的整體決策的邏輯的理解[14].該模型旨在以人類可理解的規(guī)則對(duì)模型做出特定決策的邏輯進(jìn)行解釋,但是當(dāng)它的規(guī)則或決策出現(xiàn)錯(cuò)誤時(shí),可解釋性將無(wú)法反映模型的真實(shí)決策情況.為了解決這個(gè)問(wèn)題,可以思考一下人類是如何進(jìn)行決策以及對(duì)決策結(jié)果進(jìn)行解釋的.

很多情況下,人類利用感知和推理共同完成決策[15].比如說(shuō),醫(yī)師在判斷一個(gè)宮頸細(xì)胞是否發(fā)生病變時(shí),他首先能夠根據(jù)自己的篩查經(jīng)驗(yàn),對(duì)細(xì)胞圖像展現(xiàn)出來(lái)的細(xì)胞整體特征進(jìn)行感知,得出一個(gè)大致的結(jié)論.然后,醫(yī)師基于宮頸細(xì)胞病變相關(guān)的醫(yī)學(xué)知識(shí),對(duì)細(xì)胞的每個(gè)細(xì)胞形態(tài)學(xué)特征(例如細(xì)胞核大小、核質(zhì)比高低等)進(jìn)行觀察,并結(jié)合這些特征和知識(shí)推理出另一個(gè)結(jié)論.醫(yī)師會(huì)結(jié)合、對(duì)比兩個(gè)結(jié)論,得出最終的診斷結(jié)果,并使用相關(guān)的醫(yī)學(xué)知識(shí)來(lái)解釋得出此診斷結(jié)果的原因.整個(gè)過(guò)程如圖1所示.

圖1 醫(yī)師判斷宮頸細(xì)胞是否病變

基于上述思路,本文提出了一種融合機(jī)器學(xué)習(xí)和知識(shí)推理兩種途徑的可解釋性框架.它包含兩個(gè)結(jié)果,一個(gè)是由機(jī)器學(xué)習(xí)模型感知整體特征得到的目標(biāo)特征結(jié)果,另一個(gè)是通過(guò)結(jié)合多個(gè)子特征結(jié)果和規(guī)則進(jìn)行知識(shí)推理得到的推理結(jié)果.框架結(jié)合兩個(gè)結(jié)果,根據(jù)它們是否相同、分別是否可靠的不同情況,來(lái)做出相應(yīng)不同的演進(jìn)決策.這使得框架在訓(xùn)練和測(cè)試過(guò)程中不斷提高結(jié)果的分類準(zhǔn)確率,同時(shí)賦予真實(shí)決策結(jié)果以可解釋性,在很大程度上解決了機(jī)器學(xué)習(xí)模型缺少可解釋性的問(wèn)題.本文為衡量推理結(jié)果是否可靠,提出了一種評(píng)估方法,它融合了多個(gè)機(jī)器學(xué)習(xí)結(jié)果和規(guī)則的參數(shù).

本文使用面向液基細(xì)胞學(xué)檢查圖像的融合學(xué)習(xí)與推理的某類宮頸癌細(xì)胞識(shí)別這一案例,對(duì)融合機(jī)器學(xué)習(xí)和知識(shí)推理兩種途徑的可解釋性框架進(jìn)行了說(shuō)明和驗(yàn)證.

1 融合機(jī)器學(xué)習(xí)與知識(shí)推理的可解釋性框架

本文提出的融合機(jī)器學(xué)習(xí)與知識(shí)推理的可解釋框架,包含知識(shí)推理模塊、機(jī)器學(xué)習(xí)模塊、知識(shí)推理融合機(jī)器學(xué)習(xí)模塊,如表1所示.該框架的示意圖如圖2所示.

圖2 融合機(jī)器學(xué)習(xí)與知識(shí)推理的可解釋性框架示意圖

表1 框架模塊表

其中,決策目標(biāo)是指一個(gè)系統(tǒng)預(yù)期達(dá)到的目的,目標(biāo)特征是指決策目標(biāo)的整體特征,目標(biāo)特征具有多個(gè)子特征,它們是專家知識(shí)和數(shù)據(jù)之間的關(guān)聯(lián)特征.例如,對(duì)于上文提到的診斷宮頸細(xì)胞是否病變的例子,決策目標(biāo)是識(shí)別宮頸細(xì)胞圖像是否展現(xiàn)出癌變細(xì)胞的特征,目標(biāo)特征是宮頸細(xì)胞的整體特征,而子特征是細(xì)胞形態(tài)學(xué)特征(細(xì)胞核大小、核質(zhì)比高低等).

1.1 知識(shí)推理模塊

知識(shí)推理模塊提供了用于推理決策的領(lǐng)域知識(shí)和業(yè)務(wù)規(guī)則,即決策目標(biāo)相關(guān)的本體庫(kù)O和規(guī)則庫(kù)K.根據(jù)決策目標(biāo)相關(guān)的領(lǐng)域知識(shí),通過(guò)知識(shí)抽取、融合、加工的步驟,構(gòu)建用于決策目標(biāo)的本體庫(kù)O,它表達(dá)了與決策目標(biāo)有關(guān)的類和類之間的關(guān)系.本體庫(kù)O支持網(wǎng)絡(luò)本體語(yǔ)言(Ontology Web Language,OWL),其中目標(biāo)特征類包含子特征類.將獲取到的有關(guān)決策目標(biāo)的專家知識(shí)轉(zhuǎn)化為業(yè)務(wù)規(guī)則,組成規(guī)則庫(kù)K,它支持語(yǔ)義網(wǎng)規(guī)則語(yǔ)言(Semantic Web Rule Language,SWRL).知識(shí)推理模塊的示意圖如圖3所示.

圖3 知識(shí)推理模塊示意圖

1.2 機(jī)器學(xué)習(xí)模塊

機(jī)器學(xué)習(xí)模塊提供了包含一個(gè)目標(biāo)特征分類器C和多個(gè)子特征分類器C1～Cn的分類器組,其結(jié)果用于推理決策和結(jié)果演進(jìn).分類器組通過(guò)神經(jīng)網(wǎng)絡(luò)組結(jié)合數(shù)據(jù)集D、D1～Dn訓(xùn)練得到.神經(jīng)網(wǎng)絡(luò)組由一個(gè)目標(biāo)特征分類神經(jīng)網(wǎng)絡(luò)N和n個(gè)子特征分類神經(jīng)網(wǎng)絡(luò)N1～Nn組成.數(shù)據(jù)集D用于訓(xùn)練N,D的數(shù)據(jù)標(biāo)注以決策目標(biāo)為分類標(biāo)準(zhǔn);數(shù)據(jù)集D1～Dn分別用于訓(xùn)練N1～Nn,D1～Dn的數(shù)據(jù)標(biāo)注分別以它們對(duì)應(yīng)的子特征為分類標(biāo)準(zhǔn).機(jī)器學(xué)習(xí)模塊的示意圖如圖4所示.

圖4 機(jī)器學(xué)習(xí)模塊示意圖

1.3 知識(shí)推理融合機(jī)器學(xué)習(xí)模塊

(1)提取子特征

基于提取的子特征,知識(shí)推理模塊中本體庫(kù)O構(gòu)建子特征類,機(jī)器學(xué)習(xí)模塊構(gòu)建子特征分類器.子特征是與決策目標(biāo)有關(guān)的專家知識(shí)和數(shù)據(jù)之間的關(guān)聯(lián)特征.其中,專家知識(shí)中高頻提及的概念為知識(shí)特征,數(shù)據(jù)本身的特征為數(shù)據(jù)特征,將知識(shí)特征與數(shù)據(jù)特征進(jìn)行關(guān)聯(lián)和對(duì)應(yīng),所重合的特征為子特征.根據(jù)決策目標(biāo)相關(guān)的知識(shí)特征和數(shù)據(jù)特征,框架提取出n個(gè)子特征f1～fn.那么,第1.1 節(jié)的本體庫(kù)O的子特征類依據(jù)f1～fn構(gòu)建;第1.2 節(jié)的數(shù)據(jù)集D1～Dn,其標(biāo)注類別分別以f1～fn為分類標(biāo)準(zhǔn),所構(gòu)建的n個(gè)子特征分類器C1～Cn也分別以f1～fn為標(biāo)準(zhǔn)來(lái)分類待分類數(shù)據(jù).

(2)支持機(jī)器學(xué)習(xí)結(jié)果的知識(shí)推理

一個(gè)待分類數(shù)據(jù)t經(jīng)過(guò)分類器組,得到目標(biāo)特征分類器C的分類結(jié)果Rc、子特征分類器C1～Cn的分類結(jié)果R1～Rn.將R1～Rn分別映射為本體庫(kù)O中其對(duì)應(yīng)的子特征類的實(shí)體數(shù)據(jù),并基于本體庫(kù)O和規(guī)則庫(kù)K進(jìn)行知識(shí)推理,得到推理結(jié)果Rr.結(jié)果Rc、Rr都為目標(biāo)特征結(jié)果,即框架做出數(shù)據(jù)t為Rc、Rr的決策.后續(xù)將對(duì)兩個(gè)目標(biāo)特征結(jié)果Rc和Rr進(jìn)行演進(jìn),實(shí)現(xiàn)結(jié)果的可解釋性.

(3)機(jī)器學(xué)習(xí)結(jié)果結(jié)合推理結(jié)果演進(jìn)

結(jié)合目標(biāo)特征結(jié)果Rc(機(jī)器學(xué)習(xí)結(jié)果)和目標(biāo)特征結(jié)果Rr(推理結(jié)果)進(jìn)行演進(jìn),框架根據(jù)Rc和Rr是否相同、Rc和Rr分別是否可靠的不同情況,做出相應(yīng)不同的決策.為衡量結(jié)果是否可靠,本文引進(jìn)評(píng)估結(jié)果好壞的指標(biāo)——可信度.分別計(jì)算目標(biāo)特征結(jié)果Rc的可信度ARc和目標(biāo)特征結(jié)果Rr的可信度ARr,然后結(jié)合兩個(gè)結(jié)果進(jìn)行演進(jìn),具體情況和每種情況對(duì)應(yīng)的決策如表2所示.

表2 決策表

表2中,a為閾值,它由具體案例所屬領(lǐng)域的專家或多次案例實(shí)驗(yàn)結(jié)果決定,案例對(duì)結(jié)果精度要求越嚴(yán)格則閾值越高.對(duì)于任何案例來(lái)說(shuō),結(jié)果精度要求再低也不能差于在正反類中隨機(jī)選擇一類的情況,精度要求再高也不可能好于類別全部預(yù)測(cè)正確的情況,因此a的取值區(qū)間在(0.5,1).通過(guò)對(duì)比ARc、ARr和a之間的大小關(guān)系,框架判斷Rc和Rr是否可靠.在Rc和Rr相同且兩個(gè)結(jié)果的可信度都較高的情況下,框架實(shí)現(xiàn)可解釋性,即使用子特征分類器C1～Cn的分類結(jié)果R1～Rn、知識(shí)推理使用到的規(guī)則庫(kù)K中的規(guī)則,來(lái)解釋框架做出數(shù)據(jù)t為Rc(Rr)的決策的邏輯.在Rc和Rr相同且其中一個(gè)結(jié)果可信度較低的情況下,框架提升得到低可信度結(jié)果的分類器和規(guī)則庫(kù)的信任:如果低可信度結(jié)果為Rr,則適當(dāng)提高證據(jù)鏈中的參數(shù)值,證據(jù)鏈在下一節(jié)中描述;如果低可信度結(jié)果為Rc,則適當(dāng)降低閾值a.在Rc和Rr不同且其中一個(gè)結(jié)果可信度較低的情況下,框架將優(yōu)化和改進(jìn)得到低可信度結(jié)果過(guò)程中使用到的分類器、規(guī)則庫(kù).

本文規(guī)定可信度ARc為目標(biāo)特征分類器C觀察Rc的概率值P與分類器C在驗(yàn)證集上的準(zhǔn)確率Acc的幾何平均值;ARr是融合了機(jī)器學(xué)習(xí)結(jié)果R1～Rn的參數(shù)值(例如結(jié)果概率值、靈敏度)和規(guī)則庫(kù)K的參數(shù)值的綜合評(píng)估值,具體計(jì)算方法在下一節(jié)描述.ARc考慮了Rc本身的可信程度和得到Rc的分類器C的性能,ARr考慮了推理Rr過(guò)程中使用到的數(shù)據(jù)R1～Rn本身的可信程度、得到R1～Rn的分類器C1～Cn的性能、規(guī)則庫(kù)K的可靠度.因此,使用可信度衡量結(jié)果質(zhì)量是較為充分的.

2 計(jì)算推理結(jié)果可信度

推理結(jié)果Rr是由支持機(jī)器學(xué)習(xí)結(jié)果的知識(shí)推理得到的.知識(shí)推理過(guò)程中規(guī)則使用的實(shí)體數(shù)據(jù),都是由子特征分類器的結(jié)果映射而來(lái),不一定正確.因此,Rr也可能是不正確的.那么,如何對(duì)融合了多個(gè)機(jī)器學(xué)習(xí)結(jié)果和規(guī)則的目標(biāo)特征結(jié)果進(jìn)行評(píng)估呢？本文提出了一個(gè)定義?結(jié)果證據(jù)鏈,它是有向無(wú)環(huán)圖數(shù)據(jù)結(jié)構(gòu).結(jié)果證據(jù)鏈將記錄得到Rr過(guò)程中一些重要的參數(shù)值.本文基于結(jié)果證據(jù)鏈的結(jié)構(gòu),自底向上地計(jì)算Rr的可信度ARr,以評(píng)估Rr是否可靠.

結(jié)果證據(jù)鏈?zhǔn)菍?shí)現(xiàn)可解釋性的另一關(guān)鍵部分,它使得在Rr失敗時(shí)可能追溯到具體的原因.

2.1 結(jié)果證據(jù)鏈

定義1.結(jié)果證據(jù)鏈.結(jié)果證據(jù)鏈?zhǔn)且粋€(gè)有向無(wú)環(huán)圖(Directed Acyclic Graph,DAG),記為三元組G=,其中頂點(diǎn)集V為圖中節(jié)點(diǎn)的非空集合;邊集E?V×V為圖中有向邊的集合,每一條邊用節(jié)點(diǎn)對(duì)表示為(x,y),稱x為起點(diǎn),y為終點(diǎn);F是關(guān)系的集合,每一個(gè)關(guān)系F(x,y)對(duì)應(yīng)一個(gè)節(jié)點(diǎn)對(duì)(x,y)之間的關(guān)系.

結(jié)果證據(jù)鏈的節(jié)點(diǎn),包括推理結(jié)果Rr、子特征分類器結(jié)果R1～Rn、R1～Rn的相關(guān)參數(shù)、基于的規(guī)則庫(kù)K、K的相關(guān)參數(shù),它們是V集合的組成元素.其中,子特征分類器結(jié)果Ri的相關(guān)參數(shù),包括子特征分類器Ci觀察Ri的概率值Pi、其在驗(yàn)證集上的靈敏度(sensitivity)Mi和特異度(specificity)Yi;規(guī)則庫(kù)K的相關(guān)參數(shù),是人為對(duì)K可靠性的評(píng)估值Kr,它的區(qū)間是[0,1].

本文使用知識(shí)圖譜KG來(lái)表示結(jié)果證據(jù)鏈G.知識(shí)圖譜通常用于表示和管理知識(shí)庫(kù)[16],采用三元組描述事實(shí)[17].本文采用自頂向下的方法建立KG:

(1)將推理結(jié)果Rr與子特征分類器結(jié)果R1～Rn之間分別建立三元組,i=1,···,n;

(2)將Rr與基于的規(guī)則庫(kù)K之間建立三元組;

(3)將子特征分類器結(jié)果Ri與它的相關(guān)參數(shù)之間分別建立三元組,,;

(4)將規(guī)則庫(kù)K與它的可靠性評(píng)估值Kr之間建立三元組.

表示結(jié)果證據(jù)鏈G的知識(shí)圖譜KG結(jié)構(gòu)如圖5所示.那么,G中存儲(chǔ)了得到Rr過(guò)程中一些重要的參數(shù)值.

圖5 結(jié)果證據(jù)鏈G 結(jié)構(gòu)圖

2.2 推理結(jié)果評(píng)估

計(jì)算ARr的方法使用了DS 證據(jù)理論的思想,它是一種不精確推理理論,被廣泛應(yīng)用于證據(jù)(數(shù)據(jù))合成方面.DS 證據(jù)理論首先設(shè)辨識(shí)框架θ,它包含了所有假設(shè);然后為每一個(gè)假設(shè)分配概率,分配函數(shù)稱為Mass函數(shù);最后基于Dempster 規(guī)則融合結(jié)果,即:

本文首先計(jì)算每個(gè)結(jié)果的靈敏度和特異度參數(shù)值.假設(shè)真陽(yáng)性數(shù)量為TP,假陽(yáng)性數(shù)量為FP,真陰性數(shù)量為TN,假陰性數(shù)量為FN,靈敏度M和特異度Y的計(jì)算公式如下:

即靈敏度為正確判斷陽(yáng)性的概率,而特異度為正確判斷陰性的概率.然后,對(duì)ARr進(jìn)行計(jì)算:

(1)定義Map 函數(shù)來(lái)表示每個(gè)Ri與Ri相關(guān)參數(shù)之間的映射關(guān)系,即Pi=m1(Ri)、Mi=m2(Ri)、Yi=m3(Ri);

(2)求歸一化系數(shù)S:

其中,n為Ri的個(gè)數(shù);

(3)融合子特征分類結(jié)果R1～Rn的參數(shù),計(jì)算機(jī)器學(xué)習(xí)部分的可信度Ae:

其中,Wfi為Ri對(duì)應(yīng)子特征fi的權(quán)重,視具體案例而定;

(4)融合機(jī)器學(xué)習(xí)部分的可信度Ae、規(guī)則庫(kù)K的評(píng)估值Kr,計(jì)算可信度ARr:

后續(xù)將通過(guò)面向液基細(xì)胞學(xué)檢查圖像的融合學(xué)習(xí)與推理的某類宮頸癌細(xì)胞識(shí)別這一例子,對(duì)可解釋框架進(jìn)行具體地說(shuō)明.

3 面向液基細(xì)胞學(xué)檢查圖像的融合學(xué)習(xí)與推理的某類宮頸癌細(xì)胞識(shí)別

宮頸癌是一個(gè)嚴(yán)重的健康問(wèn)題,全世界每年有近50 萬(wàn)婦女患此病[19].宮頸癌篩查對(duì)于早期預(yù)防有著非常重要的作用,而宮頸鱗狀上皮異常對(duì)于宮頸癌的診斷有重大意義[20].

3.1 子特征提取

根據(jù)宮頸鱗狀上皮細(xì)胞圖像和ASC-H 細(xì)胞形態(tài)學(xué)的專家知識(shí),本文提取出了4個(gè)子特征f1～f4,如表3所示.

表3 ASC-H 細(xì)胞子特征表

本文選擇對(duì)宮頸鱗狀上皮異常中的非典型鱗狀細(xì)胞-不除外高度鱗狀上皮內(nèi)病變(Atypical Squamous Cells:cannot exclude High-grade squamous intraepithelial lesion,ASC-H)細(xì)胞進(jìn)行識(shí)別,以驗(yàn)證可解釋框架的可行性.ASC-H 細(xì)胞識(shí)別框架在識(shí)別精度上有所提升,同時(shí)實(shí)現(xiàn)了識(shí)別結(jié)果的可解釋性,在醫(yī)師使用該識(shí)別框架時(shí),能夠根據(jù)框架給出的解釋選擇是否信任結(jié)果.值得一提的是,宮頸癌篩查的過(guò)程中應(yīng)該避免假陰性,即避免本來(lái)病變的細(xì)胞被認(rèn)為是沒(méi)有病變的情況.因此,ASC-H 細(xì)胞識(shí)別框架將疑似ASC-H 也作為識(shí)別的一類,以避免漏掉病變細(xì)胞.

3.2 本體庫(kù)和規(guī)則庫(kù)構(gòu)建

(1)本體庫(kù)O

本文從有關(guān)ASC-H 細(xì)胞形態(tài)方面的醫(yī)學(xué)知識(shí)中抽取出識(shí)別ASC-H 細(xì)胞的類和類之間的關(guān)系,并使用OWL 語(yǔ)言構(gòu)建ASC-H 細(xì)胞識(shí)別本體庫(kù)O,構(gòu)建平臺(tái)為Protégé.該本體的類信息如表4所示.

表4中Cell_size、N/C、Nucleus_size、Hyperchromatic為子特征類;ASC-H、Sus-ASC-H、Non-ASC-H為目標(biāo)特征類.ASC-H 細(xì)胞識(shí)別本體的屬性信息如表5所示.

表4 ASC-H 細(xì)胞識(shí)別本體庫(kù)的類信息表

表5 ASC-H 細(xì)胞識(shí)別本體庫(kù)的屬性信息表

在Protégé中為4個(gè)子特征類添加實(shí)例,實(shí)例為每個(gè)子特征的類別.為Cell_size 添加實(shí)體:中等細(xì)胞(c_l)、小細(xì)胞(c_s),為N/C 添加實(shí)體:核質(zhì)比高(nc_l)、核質(zhì)比低(nc_s),為Nucleus_size 添加實(shí)體:細(xì)胞核增大(nu_l)、細(xì)胞核正常(nu_s),為Hyperchromatic 添加實(shí)體:細(xì)胞核重度深染(h_l)、細(xì)胞核輕度深染(h_s).通過(guò)上述步驟,ASC-H 細(xì)胞識(shí)別本體創(chuàng)建完成.

(2)規(guī)則庫(kù)K

規(guī)則庫(kù)K包括4個(gè)規(guī)則,由ASC-H的細(xì)胞形態(tài)醫(yī)學(xué)專家知識(shí)轉(zhuǎn)化而來(lái).

1)規(guī)則1.細(xì)胞組成部分的性質(zhì)也是細(xì)胞的性質(zhì).SWRL 規(guī)則如rule1 所示:

rule1:is_part_of(?a,?b) ^ hasProperty(?a,?c) ->hasProperty(?b,?c)

對(duì)規(guī)則1的解析如下:is_part_of(?a,?b)表示a是b的組成部分;hasProperty(?a,?c)表示a 具有c 性質(zhì);hasProperty(?b,?c)表示b 具有c 性質(zhì).

2)規(guī)則2.細(xì)胞形態(tài)中,小細(xì)胞、核質(zhì)比高、細(xì)胞核增大、細(xì)胞核輕度深染全部符合,則認(rèn)為細(xì)胞是ASC-H.SWRL 規(guī)則如rule2 所示:

rule2:Squamous_epithelial_cell(?t) ^ hasProperty(?t,c_s) ^ hasProperty(?t,nc_l) ^ hasProperty(?t,nu_l) ^hasProperty(?t,h_s) ->ASC-H(?t)

對(duì)規(guī)則2的解析如下:Squamous_epithelial_cell(?t)表示t是Squamous_epithelial_cell 類的一個(gè)實(shí)例;hasProperty(?t,c_s) 表示t 具有小細(xì)胞的性質(zhì);hasProperty(?t,nc_l) 表示t 具有核質(zhì)比高的性質(zhì);hasProperty(?t,nu_l)表示t 具有細(xì)胞核增大的性質(zhì);hasProperty(?t,h_s)表示t 具有輕度深染的性質(zhì);ASCH(?t)表示t為ASC-H 細(xì)胞.文章后面的SWRL 規(guī)則都與規(guī)則2 類似,因此不再做詳細(xì)解析.

3)規(guī)則3.細(xì)胞形態(tài)中,核質(zhì)比高、細(xì)胞核增大有任意一項(xiàng)符合,則認(rèn)為細(xì)胞是疑似ASC-H.SWRL 規(guī)則如rule3a、3b 所示:

rule3a:Squamous_epithelial_cell(?t) ^ hasProperty(?t,nc_l) ->Sus-ASC-H(?t)

rule3b:Squamous_epithelial_cell(?t) ^ hasProperty(?t,nu_l) ->Sus-ASC-H(?t)

4)規(guī)則4.細(xì)胞形態(tài)中,小細(xì)胞、核質(zhì)比高、細(xì)胞核增大、細(xì)胞核輕度深染全部不符合,則認(rèn)為細(xì)胞不是ASC-H.SWRL 規(guī)則如rule4 所示:

rule4:Squamous_epithelial_cell(?t) ^ donot-hasPro perty(?t,c_s) ^ donot-hasProperty(?t,nc_l) ^ donot-has Property(?t,nu_l) ^ donot-hasProperty(?t,h_s) ->Non-ASC-H(?t)

3.3 數(shù)據(jù)集和分類器組構(gòu)建

(1)數(shù)據(jù)集

數(shù)據(jù)集D和D1～D4都由數(shù)個(gè)大小為128×128的宮頸鱗狀上皮細(xì)胞圖像組成.D的標(biāo)注類別為細(xì)胞類型,D1～D4的標(biāo)注類別依據(jù)子特征f1～f4,如表6所示.

表6 數(shù)據(jù)集標(biāo)注類別表

(2)分類器組

目標(biāo)特征分類神經(jīng)網(wǎng)絡(luò)N的架構(gòu)是任意用于分類的神經(jīng)網(wǎng)絡(luò)模型,本文選取了自己搭建的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)、變分自編碼器(Variational Auto-Encoder,VAE)、CNN 經(jīng)典模型——VGG19 這3 種模型分別實(shí)現(xiàn)3 種目標(biāo)特征分類器.例如,在使用VAE 作為N的架構(gòu)時(shí),其損失函數(shù)為VAE 理論上的損失函數(shù):

其中,j是隱變量的維度,μ、σ2是隱變量的變分概率分布的均值和方差.使用數(shù)據(jù)集D對(duì)N進(jìn)行訓(xùn)練:當(dāng)經(jīng)過(guò)30000 步訓(xùn)練或 L達(dá)到目標(biāo)值時(shí),停止訓(xùn)練并保存當(dāng)前模型.該模型為目標(biāo)特征分類器C,它將按照ASC-H細(xì)胞形態(tài)的整體特征的標(biāo)準(zhǔn)來(lái)分類細(xì)胞.

子特征分類神經(jīng)網(wǎng)絡(luò)N1～N4的架構(gòu)是任意用于分類的神經(jīng)網(wǎng)絡(luò)模型,本文均選用CNN 實(shí)現(xiàn)4個(gè)子特征分類器.子特征分類神經(jīng)網(wǎng)絡(luò)N1～N4均使用交叉熵作為損失函數(shù):

其中,k是分類的類別數(shù)量,yi為指示變量(0 或1),如果該類別和樣本i的類別相同就是1,否則是0.使用數(shù)據(jù)集D1～D4對(duì)N1～N4進(jìn)行訓(xùn)練:當(dāng)經(jīng)過(guò)10000 步訓(xùn)練或 L達(dá)到目標(biāo)值時(shí),停止訓(xùn)練并保存當(dāng)前模型.這4個(gè)模型為子特征分類器C1～C4,它們分別按照細(xì)胞大小、核質(zhì)比高低、細(xì)胞核大小、細(xì)胞核染色程度的標(biāo)準(zhǔn)來(lái)分類細(xì)胞.

那么,分類器組由1個(gè)目標(biāo)特征分類器C和4個(gè)子特征分類器C1～C4組成.

3.4 支持機(jī)器學(xué)習(xí)結(jié)果的知識(shí)推理

假設(shè)將一個(gè)待識(shí)別細(xì)胞圖像t輸入到ASC-H 細(xì)胞識(shí)別框架,它經(jīng)過(guò)分類器組后,目標(biāo)特征分類器C得到目標(biāo)特征結(jié)果Rc;子特征分類器C1～C4得到4個(gè)子特征結(jié)果R1～R4,將R1～R4映射為ASC-H 細(xì)胞識(shí)別本體庫(kù)O中對(duì)應(yīng)的子特征類(Cell_size、N/C、Nucleus_size、Hyperchromatic)的實(shí)體數(shù)據(jù),并基于本體庫(kù)O和規(guī)則庫(kù)K進(jìn)行知識(shí)推理,得到推理結(jié)果Rr.后續(xù)將對(duì)兩個(gè)結(jié)果Rc和Rr進(jìn)行演進(jìn),實(shí)現(xiàn)結(jié)果的可解釋性.

3.5 機(jī)器學(xué)習(xí)結(jié)果結(jié)合推理結(jié)果演進(jìn)

(1)計(jì)算可信度

計(jì)算目標(biāo)特征結(jié)果Rc的可信度ARc,它為分類器C觀察Rc的概率值P與C 在驗(yàn)證集上的準(zhǔn)確率Acc的幾何平均值.

計(jì)算目標(biāo)特征結(jié)果Rr的可信度ARr,首先要根據(jù)2.1 節(jié)的方法構(gòu)建目標(biāo)特征結(jié)果Rr的結(jié)果證據(jù)鏈G.然后,根據(jù)2.2 節(jié)的計(jì)算方法,基于結(jié)果證據(jù)鏈G的結(jié)構(gòu),自底向上地計(jì)算目標(biāo)特征結(jié)果Rr的可信度ARr.對(duì)于本ASC-H 細(xì)胞識(shí)別案例,核質(zhì)比高低、細(xì)胞核大小這兩個(gè)子特征在提取的細(xì)胞特征中相對(duì)更為重要.因此,本文設(shè)置f1～f4的子特征權(quán)重值分別為:Wf1=0.2,Wf2=0.4,Wf3=0.3,Wf4=0.1.

(2)分析處理結(jié)果

根據(jù)Rc、Rr、ARc、ARr的情況,框架如1.5 節(jié)所述的方法做出不同的演進(jìn)決策.多次實(shí)驗(yàn)表明,將ASC-H細(xì)胞識(shí)別案例的閾值a取值為0.8 最合適.

4 驗(yàn)證ASC-H 細(xì)胞識(shí)別框架

驗(yàn)證集由400個(gè)大小為128×128的宮頸鱗狀上皮細(xì)胞圖像組成.本文實(shí)現(xiàn)了3.3 節(jié)中3 種目標(biāo)特征分類器.為方便計(jì)算每種分類器的評(píng)估值,將正類設(shè)為Non-ASC-H,負(fù)類設(shè)為Sus-ASC-H和ASC-H的總合.在經(jīng)過(guò)不同大小的數(shù)據(jù)集訓(xùn)練后,每種分類器在驗(yàn)證集上的準(zhǔn)確率、F1 值如表7所示.

表7 每種分類器的評(píng)估值表

通過(guò)框架中支持機(jī)器學(xué)習(xí)結(jié)果的知識(shí)推理方法,得到驗(yàn)證集里每個(gè)樣本的推理結(jié)果,并使用文中提出的方法,將每個(gè)樣本的目標(biāo)特征分類器結(jié)果結(jié)合其推理結(jié)果進(jìn)行演進(jìn).每種目標(biāo)特征分類器在結(jié)合了支持機(jī)器學(xué)習(xí)結(jié)果的知識(shí)推理方法進(jìn)行演進(jìn)后,準(zhǔn)確率和F1 值均有所提升,如表8所示.每種分類器在不同數(shù)據(jù)集大小下演進(jìn)前后的準(zhǔn)確率比較如圖6、圖7、圖8所示.

圖6 數(shù)據(jù)集大小為1000 時(shí)演進(jìn)前后準(zhǔn)確率對(duì)比圖

圖7 數(shù)據(jù)集大小為2000 時(shí)演進(jìn)前后準(zhǔn)確率對(duì)比圖

圖8 數(shù)據(jù)集大小為3000 時(shí)演進(jìn)前后準(zhǔn)確率對(duì)比圖

表8 每種分類器實(shí)現(xiàn)演進(jìn)后的評(píng)估值表

實(shí)驗(yàn)表明,文中提出的機(jī)器學(xué)習(xí)結(jié)果結(jié)合推理結(jié)果演進(jìn)方法總會(huì)提升目標(biāo)特征分類器的性能,并且在分類器自身精度較低時(shí),提升的效果更加明顯.當(dāng)分類器在訓(xùn)練過(guò)程中使用的數(shù)據(jù)量和自身精度都達(dá)到了比較飽和的程度時(shí),演進(jìn)方法對(duì)于提升分類器性能方面的作用會(huì)較小.通過(guò)結(jié)合推理結(jié)果,演進(jìn)方法總能將目標(biāo)特征分類器的一部分錯(cuò)誤結(jié)果剔除,并且在不斷地使用框架對(duì)細(xì)胞分類時(shí),演進(jìn)過(guò)程也在進(jìn)行迭代,目標(biāo)特征分類器將被持續(xù)優(yōu)化.

本文使用3個(gè)具體的實(shí)例來(lái)驗(yàn)證ASC-H 細(xì)胞識(shí)別框架.該框架在應(yīng)用于醫(yī)學(xué)領(lǐng)域時(shí),VAE為最合適的目標(biāo)特征分類器,因?yàn)樗诜诸惣?xì)胞的同時(shí)將細(xì)胞樣本映射為空間分布,便于醫(yī)師在近似分布的細(xì)胞圖像群中劃分細(xì)胞類型.因此,選擇數(shù)據(jù)集大小為3000的VAE 分類器,它在驗(yàn)證集上的準(zhǔn)確率Acc=0.7925.

實(shí)例a.將一個(gè)待識(shí)別細(xì)胞圖像輸入到ASC-H 細(xì)胞識(shí)別框架,細(xì)胞圖像如圖9(a)所示.它經(jīng)過(guò)分類器組后,分類器C得到目標(biāo)特征結(jié)果Rc為Non-ASC-H;分類器C1～C4得到的4個(gè)子特征結(jié)果R1～R4分別為中等細(xì)胞、核質(zhì)比低、細(xì)胞核正常、細(xì)胞核重度深染,結(jié)合R1～R4、ASC-H 細(xì)胞識(shí)別本體庫(kù)O、規(guī)則庫(kù)K的rule4規(guī)則進(jìn)行知識(shí)推理,得到推理結(jié)果Rr為Non-ASC-H.

圖9 待分類細(xì)胞圖像

Rc的可信度ARc=0.84.Rr的結(jié)果證據(jù)鏈G的節(jié)點(diǎn)值如表9所示.

表9 實(shí)例a中Rr 結(jié)果證據(jù)鏈G的節(jié)點(diǎn)值表

如第2.1 節(jié)所述,規(guī)則庫(kù)K的參數(shù)Kr是人為對(duì)K的評(píng)估值.在本實(shí)例中,Kr=0.75.根據(jù)第2.2 節(jié)的計(jì)算方法,計(jì)算Rr的可信度ARr:

1)使用式(1)求歸一化系數(shù)S=2.43;

2)使用式(2)求機(jī)器學(xué)習(xí)部分的可信度Ae=0.77;

3)使用式(3)得到Rr的可信度ARr=0.76.

Rc和Rr相同,Rc的可信度ARc高于0.8,Rr的可信度ARr低于0.8.如1.5 節(jié)所述,框架做出細(xì)胞為Non-ASC-H的決策,并更加信任得到Rr過(guò)程中的分類器C1～C4和規(guī)則庫(kù)K,因此人工適當(dāng)?shù)靥岣呓Y(jié)果證據(jù)鏈G中較低的參數(shù)值,例如Y1、Y4和Kr.

實(shí)例b.將一個(gè)待識(shí)別細(xì)胞圖像輸入到ASC-H 細(xì)胞識(shí)別框架,細(xì)胞圖像如圖9(b)所示.框架得到Rc為Sus-ASC-H;Rr為Non-ASC-H.

Rc的可信度ARc=0.87.除Pi外,Rr的結(jié)果證據(jù)鏈G的節(jié)點(diǎn)值因?qū)嵗齛人工修改Y1、Y4和Kr而產(chǎn)生變化,如表10所示.

表10 實(shí)例b中Rr 結(jié)果證據(jù)鏈G的節(jié)點(diǎn)值表

在本實(shí)例中,Kr=0.80.根據(jù)相同計(jì)算方法,得到S=2.45、Ae=0.76、ARr=0.78.

Rc和Rr不同,ARc高于0.8,ARr低于0.8.因此,框架做出細(xì)胞為Sus-ASC-H的決策,并優(yōu)化得到Rr的分類器和規(guī)則庫(kù)的規(guī)則.根據(jù)結(jié)果證據(jù)鏈G記錄的參數(shù)值,可以發(fā)現(xiàn)基于的規(guī)則庫(kù)的可靠性評(píng)估值Kr不高,即規(guī)則庫(kù)可能存在錯(cuò)誤;分類器C1的特異度較低,即C1正確判斷中等細(xì)胞的概率偏低.根據(jù)Rr失敗的原因,對(duì)規(guī)則庫(kù)K的規(guī)則進(jìn)行檢查,如有錯(cuò)誤進(jìn)行修正;對(duì)C1進(jìn)行優(yōu)化,以提高框架的分類精度.

實(shí)例c.將一個(gè)待識(shí)別細(xì)胞圖像輸入到ASC-H 細(xì)胞識(shí)別框架,細(xì)胞圖像如圖9(c)所示.框架得到Rc為ASC-H;Rr為ASC-H.

Rc的可信度ARc=0.85.除Pi外,Rr的結(jié)果證據(jù)鏈G的節(jié)點(diǎn)值因?qū)嵗齜對(duì)規(guī)則庫(kù)K和分類器C1優(yōu)化而產(chǎn)生變化,如表11所示.

表11 實(shí)例c中Rr 結(jié)果證據(jù)鏈G的節(jié)點(diǎn)值表

在本實(shí)例中,Kr=0.85.根據(jù)相同計(jì)算方法,得到S=2.54、Ae=0.77、ARr=0.81.

Rc和Rr相同,且兩個(gè)結(jié)果的可信度都高于0.8,框架認(rèn)為Rc和Rr都較為可靠.因此,框架做出細(xì)胞為ASC-H的決策,并使用子特征結(jié)果小細(xì)胞、核質(zhì)比高、細(xì)胞核增大、輕度深染,以及規(guī)則庫(kù)K的rule2 規(guī)則,對(duì)細(xì)胞圖像t為ASC-H 這一決策進(jìn)行解釋說(shuō)明.因此,醫(yī)師可以理解框架將此細(xì)胞識(shí)別為ASC-H的邏輯,并根據(jù)解釋來(lái)決定是否相信該識(shí)別結(jié)果.

可以看出,實(shí)例b 通過(guò)結(jié)果證據(jù)鏈G找到了Rr失敗的原因,基于這些原因?qū)ο鄳?yīng)的部分進(jìn)行優(yōu)化后,實(shí)例c中框架的分類精度有所提升.在兩個(gè)結(jié)果都相同且較為可靠時(shí),框架賦予結(jié)果可解釋性,很大程度上解決了規(guī)則無(wú)法反映模型的真實(shí)決策情況的問(wèn)題.

5 結(jié)論與展望

本文提出了一種融合機(jī)器學(xué)習(xí)和知識(shí)推理的可解釋框架,該框架在提升分類精度的同時(shí),實(shí)現(xiàn)了機(jī)器學(xué)習(xí)結(jié)果的可解釋性.通過(guò)面向液基細(xì)胞學(xué)檢查圖像的融合學(xué)習(xí)與推理的某類宮頸癌細(xì)胞識(shí)別方法對(duì)框架進(jìn)行驗(yàn)證,說(shuō)明該方法可靠可行.所提出的可解釋框架對(duì)實(shí)現(xiàn)機(jī)器學(xué)習(xí)模型的可解釋性具有一定參考意義.