聶曉霞 趙佳
(石家莊理工職業學院,河北 石家莊 050081)
中醫是我國的傳統醫學,隨著中醫技術的發展,其在治療一些疑難雜癥上起到的作用越來越大。隨著互聯網技術的發展,利用機器學習技術開發中藥推薦模型,即根據患者的癥狀表現,快速的推薦出一組中藥組合,能夠幫助臨床中醫快速的對癥治療,提高了治療的效率。目前中藥推薦技術主要以主題模型為主,僅利用患者癥狀和中間藥的共享信息,并不能建立合理的推薦模型。因此,將中醫實體表示學習引入中藥推薦技術中,能夠很好地建模癥狀與中藥之間的關系,從而優化中藥推薦模型的相關性能。
將豐富的中醫領域的知識以知識圖譜的形式進行呈現,可以為中醫醫生提供治療的便利,方便他們進行查詢和利用醫學知識,同時也能為中藥推薦技術提供數據的支持。中醫知識圖譜的建構過程一般為選擇中醫知識—本體建構—實體學習、實體抽取、實體填充—知識圖譜。中醫領域的數據獲取主要以“中藥”“疾病”為中心開展,包含了結構化、半結構化和非結構化類型等幾種。結構化類型數據包含各種形式的草藥、基因、疾病、基因-疾病關聯、基因相互作用、藥物副作用記錄以及毒性記錄等,建立了中藥與疾病之間的關系網絡;半結構化類型數據囊括了動植物的具體類型,每一種中藥都包含了具體的使用方法、性味歸經、化學成分、用法用量以及臨床應用等信息;非結構化類型數據包含了疾病部分、候證部分和治法部分,對于每個癥狀的病因、治療與康復過程等都進行了詳細的說明。只有對中醫知識圖譜中的中醫數據進行充分的了解,才能在數據抽取、統計、查詢中獲取中醫實體的具體表示學習內容,這對于中藥推薦技術的發展有很大的幫助作用。
對于中醫知識圖譜來講,圖是信息的重要載體,是機器學習模型最常用的數據類型之一。但是很多中醫知識圖譜不具有歐式的結構,很難被模型直接利用。在中醫實體表示學習中,可以對異質的節點和邊采用不同的處理方式,讓中醫實體向量表示的質量更高一些;也可以將“癥狀”與“中藥”實體進行直接的相連,在關注實體間淺層關系的同時,也要充分建模他們之間的高階聯通性。比如在中醫異質圖的構建中,可以以癥狀和重要為關聯點,構建中醫異質信息圖,將中醫知識的相關內容與已經構建的知識圖譜進行融合,連接相關的癥狀實體,最終打造具有多個節點和邊的中醫異質圖。在模型目標函數的構建中,中醫推薦的實現依賴于中醫實體關聯的挖掘,比如將癥狀與中藥進行關聯。在構建目標函數的過程中,一定要將不同的節點與邊進行相互關聯,同時構建性能完善的激活函數,設計針對節點的權重數據,將向量逐元素相乘,最終形成中醫實體表示的學習模型。
我們都知道在中藥材推薦任務上,中醫學仍面臨一些挑戰,比如中藥配伍原則很難準確的利用模型刻畫治療的過程;與西醫不同,中醫認為患者的一系列臨床癥狀都是相互依存的,獨立對患者建立某種癥狀與中藥的模型是不恰當的,同時中醫藥方大都篇幅極少,包含的單詞量不多,在信息共享上做得不到位,不利于利用模型挖掘信息。為了解決上述問題,可以將中醫領域知識的主題模型用于中藥推薦中,避免傳統主題模型的缺點。在這種模式下,中醫實體向量表示之間是有彼此關聯的,模型在進行中藥推薦時,不僅僅是依靠共現信息進行建模,在很大程度上提升了模型的性能。也可以將中藥配伍信息引入所構建的模型中,進一步加強對重要的建模,使得中藥的推薦結果更符合配伍的原則,為中醫治療疑難雜癥提供更多途徑和方法,豐富臨床治療的體系。
在這類模型中,主要包含“單次-主題”兩個模型,分別對應了藥方中的“癥狀”和“中藥”兩個部分。在“癥狀部分”,可以將其中一種癥狀當作觀察變量,將其中一種“疾病”當作隱變量,采用一定的參數實現對“疾病”主題的S維“疾病-癥狀”多項分布。同樣,在“中藥部分”,可以將其中一種中藥作為觀察變量,將其中一種“適應癥”當作隱變量,采用另外一種參數實現對“中藥”主題的H維“適應癥-中藥”多項分布。也可以將癥狀與中藥的向量表示融入到各個主題模型中,從而形成疾病模型的多種流程算法,實現對疾病的精準中藥推薦。因此,在利用中醫實體表示學習進行中藥推薦選擇時,要融合中醫藥的多種知識,強調藥物組合之間的注意事項,使得模型邏輯更符合中醫領域的知識要求,推薦結果更符合實際治療的要求。在設計好推薦模型之后,也要驗證所提出模型的有效性,對實驗進行精心的設計,充分考慮各個向量之間的關系,保證模型的實際效果,為中醫發展提供數據的支持。
綜上所述,基于中醫實體表示學習的中藥推薦技術是一種新型的臨床用藥技術,可以根據患者的疾病類型和癥狀幫助他們選擇相關的中藥組合進行治療。在構建推薦模型的過程中,要利用中醫數據,深刻挖掘癥狀與中藥材的潛在關系,以基于知識圖譜的向量表示的方式支撐中藥推薦任務。為了更加貼合中醫理論的需要,也可以將中藥配伍知識融入到推薦模型中,采用多元化的模型提出中藥的推薦算法,從而保證臨床中醫用藥的準確性和安全性。