999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于多路鏈接預測推理的中醫臟腑辨證研究

2023-04-17 07:06:44付子軒周鵬汪鑫任海燕羅靜靜郭義王西墨
中國中醫藥信息雜志 2023年4期
關鍵詞:規則

付子軒 ,周鵬, ,汪鑫 ,任海燕 ,羅靜靜 ,郭義 王西墨

1.天津大學醫學工程與轉化醫學研究院,天津 300072; 2.天津大學精密儀器與光電子工程學院,天津 300072;3.北京郵電大學計算機學院,北京 100876; 4.天津中醫藥大學中醫學院,天津 301617;5.天津市天中依脈科技開發有限公司,天津 300384; 6.復旦大學工程與應用技術研究院,上海 200433;7.天津市中西醫結合醫院,天津 300102

中醫辨證論治通過望、聞、問、切收集病情資料,四診合參,以得到準確的病情診斷。使用計算機臨床輔助決策支持可以提高臨床診療的準確性,減輕臨床負擔,促進中醫臨床應用規范化。知識圖譜將多源多領域數據以語義網絡的形式展示其連接關系,從而實現跨領域的建模和查詢[1],并允許按需進一步擴展數據而不影響已有的數據結構。其在中醫臨床、中醫基礎、中醫養生保健方面有著廣泛的應用[2-3],包括語義檢索[4]、智能問答[5]、決策支持[6]等,同時為中醫智能化應用奠定了堅實的基礎。

知識圖譜通常以實體-關系-實體的三元組形式表達知識,通過已知事實可以推理完成新的事實、新的關系、新的規則,完成屬性補全、關系預測、錯誤檢測、問句擴展、語義理解等任務。鏈接預測作為知識推理過程的一個重要環節,是通過網絡中已知節點的信息和連接關系,預測網絡中2個節點之間存在連接的可能性,目前是知識圖譜中重要的研究方向。袁華兵等[7]提出一種基于多路徑的鏈接預測方法,能夠在隱式空間中運用低維表示學習篩選不同路徑的顯式特征。羊艷玲等[8]提出一種新的歸納推理模型,利用知識圖譜中實體之間的語義關系,實現一個關系相關的網絡學習不同模式的歸納鏈接預測。上述的鏈接預測方法是對知識圖譜中語義關系路徑的特征研究,以完成知識圖譜補全任務,但是無法處理多對多的復雜關系路徑的關系預測。

針對這個問題,本研究以中醫臟腑辨證為研究背景,通過構建知識圖譜并使用基于知識圖譜的知識推理算法,提出基于規則+馬爾可夫邏輯網(MLN)的多路數據鏈接預測,以實現輸入癥狀、舌象、面象、脈象等數據推理得到相應證候的功能。通過收集數據完成知識抽取任務,并構建臟腑辨證知識圖譜;實現基于改進規則的知識推理,同時完成基于MLN的權重訓練,從而根據知識圖譜實體連接的權重完成多路鏈接預測推理任務。

1 資料與方法

1.1 知識圖譜構建

1.1.1 知識圖譜架構

知識圖譜是以語義網絡為核心實現圖的知識表示與組織方法[9],其基本架構從邏輯上分為數據層和模式層。模式層是知識圖譜的骨干框架,通常為本體庫等高度抽象概括的知識;數據層是主體內容,海量知識通過實體-關系-實體的三元組形式存儲于圖數據庫,構成實體關系網絡。本研究通過收集中醫臟腑辨證數據完成知識抽取任務,并構建基于Neo4j圖數據庫的知識圖譜,以完成中醫證候與四診數據的多路鏈接預測推理。在中醫臟腑辨證的應用中根據癥狀、舌象、面象、脈象的四診數據推理得到病例所屬的中醫證候,以證候推薦度的數值形式體現,數值越高表示知識圖譜中該證候與該病歷數據的相似度越高。

1.1.2 數據來源

依據《中醫臨床診療指南》[10]、《中醫診斷學》[11]、《方劑學》[12],收集臟腑辨證相關的非結構化文本數據。

1.1.3 知識抽取

數據和知識信息是構建知識圖譜的數據基礎,通過對收集的非結構化文本數據完成實體識別、實體分類、知識去重、實體對齊等知識抽取[13]任務,將處理后的數據存儲在不同的Excel表格中,形成統一標準的知識圖譜數據源。①實體識別:根據收集到的非結構化文本數據,對中醫臟腑辨證相關的實體進行識別,并填充實體的屬性(編碼、名稱、定義、來源等)。②實體分類:實體包括證候、癥狀、面象、舌象、脈象、臟腑、療法、方藥共8類,并分別向所在實體所在類別填充數據,如對“癥狀”實體填充數據“腹痛”“惡心”“潮熱”等。③知識去重和實體對齊:實體抽取過程中對名字重復或釋義相同的實體進行合并去重,如將癥狀“心煩”和“煩躁不寧”合并為“心煩不寧”。④關系抽取:根據不同的實體屬性及實體間的關系,抽取到語義關系包括包含、表現、治療、用于等11類。

1.2 基于知識圖譜的多路鏈接預測推理

1.2.1 基于傳統規則的鏈接預測推理

基于知識圖譜進行鏈接預測知識推理是使用機器學習方法根據現有的知識自動識別錯誤補全知識圖譜,推斷知識圖譜中實體之間存在的關系。知識推理主要包括基于規則的知識推理、基于分布式表示的知識推理、基于神經網絡的知識推理[14]。基于傳統規則的鏈接預測推理是根據知識圖譜實體之間的連接規則或統計特征,實現已有數據的自動識別錯誤知識并補全知識圖譜,完成知識推理任務。

知識圖譜中的規則主要是以r(ei,ej)的形式表示實體之間的關系,其中r表示實體ei和ej的連接關系。基于傳統規則的知識推理在中醫臟腑辨證的推理應用是在式(1)的基礎上根據知識圖譜的實體關系連接,完成中醫證候與疾病、癥狀、舌象、脈象四診數據之間的規則推理預測,以實現多路鏈接預測算法在中醫領域的應用。

1.2.2 基于改進規則的知識推理

根據構建的知識圖譜的連接規則,與廣義貼進度[15]公式完成證候與四診數據之間的鏈接預測推理。將癥狀、面象、舌象、脈象數據相結合,如果證候在知識圖譜中與四診數據全部或部分連接,則根據證候貼進度[16]計算得到該證候的推薦度。

根據式(2)計算的T(M+i,M0)值進行相似性判別。

式中,M+i為知識圖譜中第i個證候的四診數據集合(i=1,2…),M0為當前輸入的四診數據集合,αi為四診數據匹配的權值系數。經過與相關中醫臨床專家的討論,初步設定的權重系數:癥狀α1=0.65,舌象和面象α2=0.20,脈象α3=0.15。知識圖譜對應關系見表1。如果存在同時與四診數據連接的證候,即則該證候的推薦度為1。否則,則

表1 知識圖譜證候與癥狀關系連接示例

1.2.3 馬爾可夫邏輯網訓練權重

一階邏輯知識庫可以定義為一系列建立在一組可能世界的集合上的硬規則,如果一個世界違反了一個規則,那么這個規則在這個世界中存在的概率是0。MLN的基本思想是對于這些硬規則有一定放松,如果一個世界違反了一個規則,世界存在的可能性就會降低,但不是不存在。一個世界違法的規則越少,存在的可能性就越大。為每個規則添加特定的權重,用來反映符合規則的可能世界的約束力。如果規則的權重越大,滿足規則和不滿足規則的兩個世界之間的差異就越大。

MLN中,L由1組二元項(Fi,ωi)組成,Fi表示一階邏輯規則,ωi是表示權重的實數,這組二元項與1組有限常量集C={c1,c2,…,cn}定義了一個馬爾可夫網ML,C[17]。①L中任意閉原子都對應馬爾可夫網中的一個二值節點0或1,如果閉原子為真,對應的二值節點為1,如果為假,對應的二值節點為0。②L中任意閉規則都對應一個特征值,特征值的權重為規則Fi對應的權重ωi。如果閉規則為真,對應的特征值為1,如果閉規則為假,對應的特征值為0。

馬爾可夫網由一個無向圖G和一組定義在G上的勢函數?k組成,表示變量集合X=(X1,X2,…Xn)?x的聯合分布模型。其中G中的每個團都對應1個表示團的狀態的勢函數?k,馬爾科夫網代表的變量集的聯合分布表示為式(3)。

x{k}表示馬爾可夫網中第k個團中所有變量的取值狀態,其中,Z=∑x?X∏k?k(x{k})表示歸一化因子。如果把每個團的勢函數表示為指數函數,指數項為對應團的加權特征量,得到式(4)的概率分布。

式中,ωj表示權重,fj(x)?(0,1)表示特征函數,在馬爾可夫網中,最常用的近似推理算法是馬爾可夫鏈蒙特克洛(MCMC)方法的吉布斯采樣(Gibbs sampling),即在給定的1個變量的馬爾可夫覆蓋條件下,使用概率P(x|MB(x))進行采樣。MB(x)是變量x的馬爾可夫覆蓋,在馬爾可夫網中表示變量x的所有鄰居節點。

在馬爾可夫網的2個節點之間存在1條邊,表示對應的謂詞一起出現在L中1個公式中。例如:包含式(5)的MLN,通過將公式應用到A和B上,產生閉馬爾可夫網。

作為MLN的加權特征捕獲了有效的統計規律,實際上代表了一個標準的社交網絡模型[18],將MLN應用到A和B上得到社交網絡模型,見圖1。

圖1 MLN應用到A和B上的社交網絡模型

對于“燥邪犯肺證”證候,根據知識圖譜證候與癥狀的連接關系構建網絡模型,實現權重系數訓練。權重系數表示癥狀在該證候下的約束力,如果規則的權重越大,證候和癥狀之間存在連接的可能性越大。通過MLN完成模型訓練,使用吉布斯采樣完成權重推理,權重訓練結果見表2。

表2 證候-癥狀權重訓練結果

1.2.4 基于規則+MLN的多路鏈接預測推理模型

根據臟腑辨證知識圖譜中的已知規則,本研究將基于改進規則的知識推理與MLN訓練權重相結合,提出基于規則+MLN的多路鏈接預測推理算法,實現中醫臟腑辨證推理。推理步驟如下。算法流程見圖2。

圖2 基于規則+MLN的多路鏈接預測模型流程

步驟1:輸入病例的四診數據,判斷臟腑辨證知識圖譜中是否存在與癥狀、面象、舌象、脈象等數據連接的證候節點。

步驟2:通過自定義的規則,使用證候推薦度(見式2)計算每個證候的推薦度,將推薦度最大的證候作為該病歷所屬證候。設置權重初始值為癥狀0.65、舌面象0.20、脈象0.15。

步驟3:定義MLN訓練權重的數據data(知識圖譜中證候與癥狀的連接關系)、謂詞命名predicate為Syndrome(entity)、 Symptom(entity)、 Syndrome_Symptom(entity,entity),一階邏輯形式表示的事實formulas為Syndrome_Symptom(x,y)?(Syndrome(x)?Symptom(y))。模型訓練方法的參數選擇為MLN的StandardGrammar、FirstOrderLogic方法。

步驟4:模型訓練完成后,使用Gibbs sampling進行權重推理。

步驟5:將修正后的權重更新到步驟2的權重中,按照證候推薦度算法計算得到證候推理結果。

2 結果

2.1 知識圖譜

通過知識抽取得到的實體和關系構建臟腑辨證知識圖譜本體層(見圖3),向本體層填充數據構建實體層,實體節點個數共1 263個,關系個數共4 105個。

圖3 臟腑辨證知識圖譜本體層

知識圖譜是進行鏈接預測知識推理的核心,根據本體層的實體和關系,將收集的數據導入Neo4j圖數據庫,構建臟腑辨證知識圖譜。實體類型及個數見表3,關系類型及個數見表4。

表3 臟腑辨證知識圖譜實體類型及個數

通過查詢知識圖譜實體之間的語義關系路徑,可以實現數據的知識查詢和可視化顯示。如查詢“燥邪犯肺證”證候對應的癥狀關系,結果見圖4。在Neo4j圖數據庫中完成知識圖譜的可視化及實體和關系的語義查詢,為實現鏈接預測知識推理提供數據支持。

圖4 臟腑辨證知識圖譜“燥邪犯肺證”對應癥狀關系

2.2 多路鏈接預測推理結果

在IntelliJ IDEA 2018環境下進行基于改進規則的知識推理,在PyCharm 2019環境下使用pracmln庫函數進行基于MLN的權重訓練,將訓練得到的權重結果保存到MySQL數據庫中;使用SpringBoot框架開發中醫臟腑辨證應用,layui框架開發前端界面。

采用基于規則+MLN的多路鏈接預測推理模型,輸入任意個數四診數據,輸出證候推薦度最高的前5個證候。如輸入癥狀干咳無痰、痰少而黏、難以咳出、胸痛、痰中帶血、咯血、口唇舌鼻咽干燥、惡寒發熱、少汗、無汗,舌象燥苔、薄苔,脈象浮、數、緊,結果見表5。將燥邪犯肺證作為該病例證候推薦結果。

表5 基于規則+MLN的多路鏈接預測模型證候推理結果舉例

根據四診數據對中醫臟腑辨證的70個證候的相關病例實現證候推理,推薦度最高的證候結果見表6。

表6 臟腑辨證推薦結果

2.3 模型評價

根據證候與四診數據鏈接預測推理結果,計算鏈接預測評價指標受試者工作特征曲線下面積(AUC)、精確度、排序分[19],見表7。

表7 鏈接預測評價指標結果

AUC:預測算法對每個未知節點計算出來代表存在的可能性的值,未知節點包括測試數據中存在和不存在的節點,將兩者分數進行比較。獨立比較n次,結果測試集中的節點分數大于不存在的節點分數有n1次,兩分數相等有n2次。AUC=(n1+0.5n2)/n。AUC在整體上衡量鏈接預測算法的準確性,算法經訓練后會在知識圖譜網絡中得到每對節點的相似值,>0.5表示算法優于隨機選擇算法的程度[19]。

精確度:根據節點對之間出現連接的可能性大小排序,在前L個預測節點中預測準確的比例。如果有m個預測準確,排在前L的節點中有m個在測試集中,定義精確度=m/L。

排序分:考慮了測試集中的節點在最終排序中的位置,H為未知節點的集合,re∈Ep表示測試節點e在預測算法之后節點排序中的排名,測試節點的排序分為通過遍歷所有在測試集的節點,計算得到的排序分值越小表明算法的預測效果越好。RS=

基于傳統規則的鏈接預測算法是在知識圖譜上比較實體之間的連接關系,無法根據不同的四診數據輸入完成個性化推薦,基于規則+MLN的多路鏈接預測推理模型可以根據病例的任意多個四診數據推薦最相符的證候,為中醫臨床應用提供輔助決策功能。

通過鏈接預測評價標準比較基于傳統規則的鏈接預測算法和本研究提出的基于規則+MLN的多路鏈接預測推理算法在臟腑辨證中應用的結果,在70個中醫證候推理結果中,多路鏈接預測推理較基于傳統規則的鏈接預測算法精確度高4.3%,具有更準確的推理結果。

3 討論

本研究通過構建知識圖譜,實現基于知識圖譜的鏈接預測推理。首先自定義規則和權重,使用MLN完成模型訓練,通過Gibbs sampling實現癥狀和證候連接關系的權重推理。根據臟腑辨證的70個證候推薦度結果計算基于規則+MLN的鏈接預測的推理結果,AUC值為98.6%,精確度為98.6%,排序分為0.297。

該模型在推理功能上能夠完成中醫臟腑辨證的個性化推薦應用,即根據輸入任意多個癥狀、舌象、面象、脈象等數據,推薦病例所屬的證候,并且推理結果的準確度較基于傳統規則的鏈接預測算法精確度高4.3%。表明該模型在臟腑辨證應用中可以完成較高準確度的鏈接預測任務,能夠實現基于知識圖譜的知識發現和推理功能,同時可以輔助中醫臨床進行臟腑辨證診斷,也為中醫臟腑辨證的標準化應用開發提供幫助。

目前,對于鏈接預測完成知識圖譜推理的研究是通過自定義的規則學習和權重訓練進行知識推理,在之后的研究中,將收集大量的臨床客觀數據,使用圖卷積神經網絡R-GCN[20]的知識推理完成進一步的推理預測,為推理獲得更多的圖結構方面的特征,以完成更準確的證候推理結果。

猜你喜歡
規則
拼寫規則歌
撐竿跳規則的制定
數獨的規則和演變
依據規則的推理
法律方法(2019年3期)2019-09-11 06:26:16
善用首次銷售規則
中國外匯(2019年7期)2019-07-13 05:44:52
規則的正確打開方式
幸福(2018年33期)2018-12-05 05:22:42
顛覆傳統規則
環球飛行(2018年7期)2018-06-27 07:26:14
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
TPP反腐敗規則對我國的啟示
啦啦操2010—2013版與2013—2016版規則的對比分析
運動(2016年6期)2016-12-01 06:33:42
主站蜘蛛池模板: 国产福利影院在线观看| 久久国产精品嫖妓| 国产网站免费看| 制服丝袜一区二区三区在线| 久久亚洲天堂| 性色生活片在线观看| 久久精品亚洲专区| 天天摸天天操免费播放小视频| 成人在线亚洲| 亚洲视频四区| 无码人中文字幕| 日韩无码视频播放| 国产精选自拍| 国产精品视屏| 亚洲无码四虎黄色网站| 国产精品成人免费视频99| 粉嫩国产白浆在线观看| 操美女免费网站| 亚洲AV无码精品无码久久蜜桃| 色丁丁毛片在线观看| 国国产a国产片免费麻豆| 欧美日韩国产在线播放| 亚洲一区二区三区香蕉| 国产免费高清无需播放器| 色婷婷在线影院| 欧美成人在线免费| 97国产精品视频自在拍| 国产成人调教在线视频| 国产成人在线无码免费视频| 久久性视频| 国产三级韩国三级理| 中文字幕欧美日韩| 国产真实自在自线免费精品| 久久亚洲AⅤ无码精品午夜麻豆| 免费va国产在线观看| 日韩高清无码免费| 国产精品漂亮美女在线观看| 国产国产人在线成免费视频狼人色| 亚洲日韩AV无码一区二区三区人| 国产成人精品一区二区不卡| 国产永久在线观看| 全部免费特黄特色大片视频| 天堂网国产| 国产激情第一页| 国产精品视频观看裸模| 国产女人18毛片水真多1| 精品国产自在现线看久久| 91人人妻人人做人人爽男同 | 日本道综合一本久久久88| 国产精品区网红主播在线观看| 69免费在线视频| 亚洲中文精品人人永久免费| 91在线高清视频| 免费国产不卡午夜福在线观看| 国产高清不卡视频| 亚洲制服丝袜第一页| yy6080理论大片一级久久| 国产最爽的乱婬视频国语对白| 亚洲免费毛片| 色AV色 综合网站| 中字无码精油按摩中出视频| 五月婷婷伊人网| 日韩精品毛片| 夜夜爽免费视频| 日韩精品欧美国产在线| 国产精品久久久久久久久久98| 91蜜芽尤物福利在线观看| 九月婷婷亚洲综合在线| 欧美一级在线看| 精品亚洲欧美中文字幕在线看| a级毛片免费网站| 九色国产在线| 性色一区| 久久一级电影| 女同国产精品一区二区| 精品综合久久久久久97超人| 97视频免费在线观看| 园内精品自拍视频在线播放| 午夜精品一区二区蜜桃| 美女无遮挡免费视频网站| 久久精品一品道久久精品| 日本日韩欧美|