,, ,,,
糖尿病是一種嚴重的慢性非傳染性疾病,2010年我國18歲以上的糖尿病患病率達到9.7%,并且患者人數有不斷增加的趨勢,給個人和社會帶來極大的經濟負擔[1]。由于國內基層設備落后,醫務人員水平有限,糖尿病的漏診率與誤診率也較高。
本體作為語義網知識表示的核心,在國內外成為研究的熱點。隨著本體技術不斷成熟,逐漸被用于醫學領域的知識表示。構建相應的知識庫,以此搭建醫療專家系統,實現輔助醫療診斷等功能。如牟冬梅與范軼等構造了心電圖領域本體,并在此基礎上實現了本體的語義推理,用于對心臟病的診斷[2];張巍和張絢等為使用計算機輔助診斷和治療高血壓,提出了基于本體和案例推理的高血壓診療系統模型[3]等。
在糖尿病領域,國外有控制糖尿病食物領域本體的構建并通過推理對糖尿病患者飲食方案提供建議[4],有基于本體構建糖尿病臨床支持系統為醫務工作者提醒患者的相關病情[5],還有結合本體與語義網規則語言(SWRL)以及根據不同患者的不同身體狀況,為糖尿病患者提供個性化服務如提供合適的藥物[6]等。
國外也有應用糖尿病的本體技術為糖尿病患者或醫務工作者提供個性化服務,但是基本沒有為基層全科醫生提供轉診服務。目前國內糖尿病專家系統研究主要在糖尿病診斷和數據挖掘方面,而基于本體,利用糖尿病相關指南以及專家知識對糖尿病進行診斷和治療的研究卻并不多[7]。
本文構建了糖尿病領域本體與診療規則模型并實現了語義推理,為后續基于本體的糖尿病管理系統研究奠定了基礎。以此為基礎開發基于本體的糖尿病管理系統,為基層全科醫生糖尿病患者診療提供科學規范的決策支持,能夠有效提高糖尿病的知曉率和降低各種并發癥的致殘率,對于控制血糖、減輕糖尿病帶來的經濟與社會負擔具有重要意義。
糖尿病領域本體相關的概念、屬性、關系以及診療規則主要來自國內糖尿病領域相關的臨床指南及糖尿病領域專家。其中主要抽取有關糖尿病風險評估、患者癥狀、糖尿病診斷方法、糖尿病診療路徑、相關治療藥物如降糖藥、調脂藥與降壓藥以及糖尿病的生活干預方式等知識,經過反復論證,確保概念以及概念關系的準確性及統一性。并按照格魯伯提出的清晰性、完整性、一致性、最大單調可擴展性以及最小承諾原則構建本體五項原則,保證本體構建的科學性。在語義推理階段,則根據患者健康檔案數據,創建相應的患者實例,實現語義推理。
目前,國內外本體構建方法主要有兩種:一是直接從知識工程的角度出發構建本體,稱為本體工程;二是在現有詞表資源的基礎上直接向本體轉化[8]。
本體工程強調構造本體時要按照一定的規范和標準。目前為止,其主要的方法有TOVE法、七步法、骨架法、IDEF5法以及SENSUS法等,還沒有統一的構造本體的標準。以上方法都是在構建具體項目的本體時總結出來的。相較于其他的本體構建方法,斯坦福大學開發的七步法構建領域本體最為成熟[9],但缺少“檢查和評估以及用戶的反饋”環節[10]。因此本文借鑒骨架法領域本體構建方法,引進本體評價環節,創建了新的糖尿病領域本體構建方法(圖1)。

圖1糖尿病領域本體構建方法
Maja Hadzic和Elizabeth Chang 等學者提出了人類疾病本體模型即疾病類型、表型、治療手段與病因四維模型[11]。本文在此基礎上將其拓展為一種含有疾病類型、臨床表現、治療手段、檢查項目、并發癥以及患者6個維度的糖尿病本體構建模型,使用新的本體構建方法在斯坦福大學Protégé 3.5平臺構建糖尿病領域本體。
糖尿病領域本體的框架主要由疾病類型、臨床表現、治療手段、檢查項目、并發癥以及患者6個核心類組成。在這6個核心類的基礎上,逐層創建子類,增添其屬性與關系以并創建實例,進而逐步完善糖尿病領域本體。
根據臨床指南定義糖尿病領域的概念及它們的關系,確定概念與概念的層次。國內糖尿病領域相關的臨床指南包含了大量術語以及關系,通過較完整的抽取,盡可能保證糖尿病領域概念的完整性,而概念的抽取確保了類屬性的定義以及實例的創建。該研究使用自頂向下與自底向上的方法相結合定義概念,并使用本體描述語言OWL DL描述糖尿病領域本體,對其進行編碼與形式化。
本體中的關系代表了在領域中概念之間的交互作用,主要包含基本關系和自定義關系兩部分。除了系統預設的4種基本關系(即part-of 概念之間部分與整體的關系,kind-of 概念之間的繼承關系、父子類關系,instance-of 概念的實例和概念之間的關系、類對象和類之間的關系),attribute-of 某個概念是另一概念的屬性外,該研究還定義了12種關系,豐富了糖尿病領域本體庫。其中,屬性分為對象屬性和數據類型屬性,對象屬性表示兩個實例之間的關系,數據類型屬性描述類實例與數據類型值的關系。該研究構建了7個數據類型屬性,部分屬性與關系見表1。

表1 糖尿病領域本體部分屬性
實例是概念的具體化,繼承了概念的屬性,當構建大量的實例后,就逐漸形成相關領域的知識庫。實例數據經過處理形成符合格式的實例數據,方便事實庫的形成,從而與規則庫結合,在JESS推理機中實現推理。經過概念、屬性以及實例的構建,最終形成部分糖尿病領域本體庫。
語義網規則語言(SWRL)是萬維網聯盟(W3C)于2004 年提出的,用于描述推理規則。它是以OWL子語言OWL DL/OWL Lite 和RuleML為基礎的規則描述語言,其目的是為了讓規則可與OWL產生結合,從而提高本體的推理能力[12]。糖尿病診療規則庫使用SWRL進行構建。
結合國內糖尿病相關的權威指南、政策文件以及糖尿病專家的建議,形成規范的糖尿病診療路徑(圖2),繼而生成糖尿病診療規則庫,主要包含早期糖尿病篩查規則、糖尿病的診斷規則、糖尿病的分型規則、糖尿病的藥物推薦規則以及轉診規則,共28條規則(圖3)。如早期糖尿病篩查規則:人(?P)∧FPG值(?p,?x)∧swrlb:lessThan(?x,7.0) ∧ swrlb:greaterThanOrEqual(?x,6.1)∧_2HPG值(?p,?y)∧swrlb:lessThan(?y,7.8)→ 風險評估結果(?p,有空腹血糖受損)。表示的是如果一個人,空腹血糖大于等于6.1,且小于7.0,葡萄糖負荷后2小時血糖值小于7.8,那么這個人有空腹血糖受損。

圖2部分糖尿病診療流程

圖3 糖尿病診療規則庫
Jess推理引擎主要由事實庫、規則庫和推理機3部分組成。先根據本體,創建相應的實例。Jess推理機將患者領域本體轉化為Jess事實庫,再將SWRL規則轉化為Jess規則庫,推理機結合Jess事實庫與Jess規則庫,實現本體語義推理,揭示糖尿病領域潛在的知識,實現早期糖尿病的篩查、診斷、糖尿病藥物推薦以及轉診服務。如圖4所示,實例中患者李明(化名),最終診斷為糖尿病,疑似為2型糖尿病,并且合并有高血壓和高血脂,最終推薦使用抗糖藥物有a-糖苷抑制劑、二甲雙胍,降壓藥有血管緊張素受體拮抗劑、血管緊張素轉換酶抑制劑以及降脂藥他汀類藥物。由于收縮壓大于150mmHg,專家建議轉診到上級醫院確診并制定診療方案。

圖4語義推理實現
本文從Maja Hadzic和Elizabeth Chang 提出的四維人類疾病本體模型出發,在此模型基礎上綜合應用七步法與骨架法本體構建方法,構造了較為完整的糖尿病領域本體,并且實現了基于糖尿病領域本體的語義推理,是本體技術在糖尿病領域的有意義的嘗試,為糖尿病管理系統的開發打下基礎。
本研究還存在一定的局限性,主要在于以下幾個方面。構建的糖尿病領域本體可能不夠完整,需要更多的領域專家參與;本體全部由人工創建,工作量大且繁瑣,后續我們將對本體的自動化構建進行有益的探索;采用基于產生規則式的推理,不能很好地將部分知識轉化為結構化的規則存儲于糖尿病知識庫。健康飲食與運動對糖尿病的治療非常重要,因此糖尿病診療規則庫也需要不斷地調整和完善,使之不僅能實現糖尿病高危人群的篩查、糖尿病診斷、抗糖尿病藥物的推薦以及轉診建議,還將實現糖尿病飲食與運動方面的指導功能。