朱垚,姬承諾,倪海雯,陸明,3
1.南京中醫藥大學,江蘇 南京 210029;2.南京中醫藥大學附屬醫院,江蘇 南京 210029;3.南京醫中科技數據挖掘中心,江蘇 南京 210029
淋巴瘤是由淋巴造血系統病變引起的惡性腫瘤,可發生在身體各部位,癥狀復雜,主要臨床表現為無痛性淋巴結腫大、肝脾腫大等,常伴有發熱、盜汗、消瘦、皮膚瘙癢或皮疹等全身性癥狀,隨病情發展逐漸導致全身各組織器官受累,晚期可轉化為急性淋巴細胞白血病。現代醫學運用靶向藥物、免疫制劑與化療聯合方案能夠延緩病情進展,在一定程度上改善患者預后,但毒副作用較大,且存在耐藥及復發情況。根據臨床表現,淋巴瘤可歸屬中醫學“石疽”“陰疽”“痰核”“惡核”“虛勞”等范疇。中醫藥干預淋巴瘤主要基于辨證論治,不同醫家的辨治經驗各有特點,系統整理研究淋巴瘤的中醫辨證思路及用藥經驗,有助于優化該病的中醫臨床診療方案。本研究通過收集淋巴瘤相關臨床醫案論文,提取病歷信息,建立淋巴瘤臨床醫案數據庫,采用數據挖掘方法對醫案數據進行集外關聯解析,研究淋巴瘤醫案不同子項集之間潛在的辨治規律,尤其關注中醫四診辨證信息、病機證素與治療藥物之間的高關聯特征。
以“淋巴瘤”AND“醫案”OR“驗案”OR“治驗”為核心檢索式,選擇中國知識資源總庫(CNKI)為目標單源數據庫,檢索建庫至2019 年8 月15 日公開發表的中醫治療淋巴瘤醫案類論文,形成論文數據庫,保留Download Index 索引清單,進行雙人復核,確保論文數據庫與索引清單的量值一致。
納入標準:①論文醫案描述中明確“淋巴瘤”診斷;②論文醫案描述中存在中藥內服干預方案;③論文醫案描述中有復診信息,存在可供醫案療效判斷的癥狀。排除標準:在不同論文中記錄了同一主診醫師的相同醫案,排除時序首位記錄外的所有醫案。
在論文數據庫基礎上,采用Medcase V3.8 診籍中醫師工作室-名老中醫經驗傳承輔助平臺進行醫案數據文本提取,建立淋巴瘤專病醫案數據庫。錄入完成后進行二次數據審核。不同研究人員錄入及審核,控制相異率<3%。
針對醫案錄入與數據文本提取過程中發現明顯的癥狀、病機、治法、藥物、理化檢查等數據源錯字、別字、誤字、異字及檢查單位、劑量的錯記、誤記、漏記等非研究性數據噪點,進行溯源性預處理,達到降噪、優化的目的。不同研究人員對溯源數據值與修正數據值進行實時雙備份標記。
預處理后的醫案研究數據庫整體數據,按照不同分析類型進行數據規范化。中醫藥術語分項集進行規范化,癥狀項集、診斷項集、病機項集參照《中醫診斷學》[1],藥物項集參照《中藥學》[2]。數據規范化操作參考《中醫臨床醫案數據挖掘研究數據規范化標準》(QB/GL MCT 102-2019):①癥狀項集規范癥狀原生描述前飾或后飾的時間節律與程度特征;②診斷項集規范相同患者的病種與年齡;③病機項集規范同一患者多診醫案的默認病機;④藥物項集規范藥物異名與特殊煎制等。
Medcase V3.8 診籍中醫師工作室-名老中醫經驗傳承輔助平臺系江蘇省科技創新專項研究成果,由南京中醫藥大學國醫大師周仲瑛工作室、第二臨床醫學院、人工智能與信息技術學院聯合研發[3],已在江蘇地區中醫臨床、教學、科研單位廣泛使用。本研究采用Medcase 系統的XMiner V1.0 中醫藥數據挖掘平臺進行格式化和編碼,并根據文本特征計算數據權重,參考《中醫臨床醫案數據挖掘研究數據分析操作標準》(QB/GL MCT 202-2019)執行系統常規極值處理,實時記錄調參標值,基于FP-Growth 加強關聯分析算法進行挖掘運算,并進行數據可視化表達。
共納入醫案138 則,涉及患者138 人次、354 診次,其中男性176 診次(49.72%),女性178 診次(50.28%),年齡6~86 歲。涉及病機59 條,癥狀215 種,脈象18 種,舌象80 種,藥物451 種。僅記錄初診的單診次醫案54 則;同時記錄復診的多診次醫案84 則,其中臨床癥狀改善醫案81 則(96.43%);超過5 診次的長診次醫案17 則,診療時間超過6 個月的長療程醫案9 則,超過12 個月的長療程醫案9則,長診次及長療程醫案臨床癥狀改善率均為100%。
2.2.1 臨床癥狀與藥物
臨床癥狀與藥物集外關聯規則共29 條(見表1)。支持度>0.08、置信度>0.5 的關聯規則為咳嗽與黃芪、咳嗽與陳皮、咳嗽與茯苓、夜寐不安與茯苓、淋巴結腫大與茯苓、神疲與黃芪、乏力與茯苓、乏力與黃芪。乏力、神疲等與黃芪、茯苓的關聯度較高。黃芪味甘性微溫,歸肺、脾、肝、腎經,可補肺脾腎之氣,臨床用于治療淋巴瘤虛損性證候;茯苓味甘、淡,性平,有滲濕健脾功效,可補益肺脾,治療氣虛等證。

表1 138 則中醫治療淋巴瘤醫案臨床癥狀與藥物集外關聯規則(支持度>0.03,置信度>0.5)
2.2.2 病機與藥物
病機與藥物集外關聯規則共23 條(見表2)。痰與香附、夏枯草、菟絲子等有較高關聯,氣虛、血虛等與黃芪有較高關聯,濕與茯苓有較高關聯,氣滯與柴胡、香附等高關聯,脾虛與人參、山藥高關聯,腎虛與菟絲子、山藥高關聯。提示治療淋巴瘤化痰散結行氣多用香附、夏枯草;出現氣血不足虛性病機常用黃芪、黨參等補虛藥健脾補氣,以氣生血;脾腎兩虛是淋巴瘤常見病機,多用山藥、人參、菟絲子等補腎健脾之品。

表2 138 則中醫治療淋巴瘤醫案病機與藥物集外關聯規則(支持度>0.05,置信度>0.5)
2.2.3 舌象與藥物
舌象與藥物集外關聯規則共21 條(見表3)。苔厚與生姜、黃芪、山藥、甘草、茯苓高關聯,質淡與白術、茯苓、黃芪高關聯,苔黃與茯苓、陳皮高關聯,苔膩與茯苓高關聯。苔厚多為濕阻之候,生姜發汗利濕,茯苓利水滲濕,黃芪、山藥、甘草健脾益氣。質淡多提示氣血不足,白術、黃芪有健脾益氣功效。苔黃提示有內熱,結合淋巴瘤病癥特點,臨床多為氣郁、痰濕久積化熱所致,高關聯藥物陳皮、茯苓有理氣健脾、利濕化痰之功。

表3 138 則中醫治療淋巴瘤醫案舌象與藥物集外關聯規則(支持度>0.03,置信度>0.5)
2.2.4 脈象與藥物
脈象與藥物集外關聯規則共18 條(見表4)。沉脈、弦脈與陳皮、黃芪、茯苓有較高關聯,弦脈與茯苓高關聯,細脈與黃芪高關聯。淋巴瘤多以虛為主,兼有虛實夾雜。沉脈主里證,弦脈多為氣滯肝郁,細脈多主虛證,故用陳皮理氣調中,黃芪益氣升陽,茯苓利水滲濕兼具補益之功,三藥均有補虛功效又各有所長,可用于虛實錯雜證候。

表4 138 則中醫治療淋巴瘤醫案脈象與藥物集外關聯規則(支持度>0.05,置信度>0.5)
2.2.5 臨床癥狀與病機
臨床癥狀與病機集外關聯規則共23 條(見表5)。齒松、口僵、夜尿、目澀、喜熱飲、皮膚損傷、感冒與痰高關聯,脾腫大、皮膚損傷與濕高關聯,足痛、口僵、夜尿、腹瀉、目澀、潰瘍、浮腫等與各種虛證高關聯,口僵、皮膚損傷、潰瘍與火熱高關聯。提示淋巴瘤與虛證高關聯的癥狀較多,涉及氣虛、陰虛、陽虛、脾虛等。無以固攝,腎氣虛則膀胱失約,夜尿增多,脾陽虛則運化水液失職,易于浮腫,氣滯水停則聚而生痰。陰液不足,虛熱內生,則見目澀、潰瘍等虛火上炎諸證。

表5 138 則中醫治療淋巴瘤醫案臨床癥狀與病機集外關聯規則(支持度>0.005,置信度≥0.5)
基于中醫醫案的數據挖掘與知識發現是近年來中醫藥研究的熱點范式之一。中醫醫案數據挖掘研究方法眾多,符合中醫臨床辨治特點且能有效總結專家經驗的挖掘方法以頻數解構、關聯規則、聚類分析為主。關聯規則挖掘算法主要研究項集內頻繁項之間的關聯性。通過對中醫醫案實際數據樣本集的系列研究分析發現,通常一個醫案數據樣本集可根據中醫臨床辨治特點設立多項字段,從而劃分成若干子項集。不同醫案數據子項集內的項有較高的相關性,而不同醫案數據子項集間的項也存在符合中醫臨床辨治知識規律的高相關性,提示每個醫案數據子項集與其外部的潛在因子間存在著正向或負向關聯。因此,基于中醫藥學知識發現的客觀規律與前期大量中醫醫案挖掘實踐[4-8],筆者所在研究團隊提出集內關聯與集外關聯的概念,并根據關聯規則在中醫醫案研究中的主要目的,確立集內關聯與集外關聯的內涵及外延,擴展和豐富了關聯規則挖掘在中醫醫案領域的應用。本研究通過對淋巴瘤醫案的集外關聯解析,系統梳理中醫診治淋巴瘤臨床真實世界中癥狀、舌脈、病機與藥物不同項集間潛在的辨治規律。
中醫臨床診療的既往知識發現,多在臨床醫師大量診治同類疾病積累經驗的基礎上,總結高頻關聯性藥癥規律,形成知識留存。因此,中醫臨床常有“有是癥用是藥”的專癥專藥的特色藥物知識提煉規則。鄭佳彬等[9]運用測評量表對單純中醫藥治療階段的淋巴瘤患者癥狀進行系統性研究,探索淋巴瘤癥狀特征及中醫證型特點,發現淋巴瘤患者普遍存在多種癥狀,其中發生頻率最顯著的3 個癥狀為口干、疲勞、睡眠不安,強度最顯著的3 個癥狀分別是疲勞、出汗、口干;淋巴瘤患者辨證常出現兩證或三證相兼的情況;在證型頻次中,虛實夾雜證出現最多,其次為虛證,實證較少。本研究結果顯示的臨床表現與同類研究基本一致,其中神疲、乏力與黃芪高關聯,淋巴結腫大、夜寐不安與茯苓高關聯,對于臨床表現蕪雜的淋巴瘤對癥用藥有一定參考價值。
病機的構成要素包括病性、病位、病勢和病理因素,是疾病發展的動態核心,決定了疾病發展的走向與轉歸。證候是疾病階段性特點的歸納與總結,構成了疾病特定時點的診斷要素。病機證素與證候要素在中醫辨證環節有著共性特征,但從術語表達層面很難明確區分,需結合運用語境與辨治思路判別。《惡性腫瘤中醫診療指南》將惡性淋巴瘤分為氣虛證、陰虛證、血虛證、痰濕證、血瘀證、氣滯證[10]。王臻等[11]將淋巴瘤分為寒痰凝滯型、氣滯毒瘀型、肝腎陰虛型、氣血雙虧型、血熱風燥型5 種證型辨證論治。陳錦峰等[12]將淋巴瘤分為3 類:虛證類以脾腎虧虛型、脾胃氣虛型、肝腎虧虛型、氣血雙虧型為主,實證類以血熱風燥型、寒痰凝滯型、氣郁痰凝型、氣滯毒瘀型、痰飲凝聚型、痰瘀互結型為主,虛實夾雜類以陰虛內熱型、脾虛夾濕型為主。國醫大師周仲瑛教授臨證精于病機辨證,善治疑難重癥,多從“癌毒”病機辨治淋巴瘤。周仲瑛工作室研究團隊系統總結周仲瑛教授辨治淋巴瘤經驗,明確淋巴瘤屬于本虛標實之證,五臟氣血虧虛為本,癌毒夾雜痰濁、瘀熱為標[13]。扶正以益氣養陰、補益脾腎為主,祛邪多用解毒抗癌,佐以清熱化痰散結為法。病機辨治分為五型:以痰毒凝結為核心病機,治宜化痰解毒散結;以瘀毒互結為核心病機,治宜解毒活血;以熱毒蘊結為核心病機,治宜清熱解毒、祛痰散結;以氣虛痰毒為核心病機,治宜溫陽利水祛濕;以陰虛痰毒為核心病機,治宜滋補肝腎、解毒散結。本研究結果顯示的病機證素與現有專家病機分型高度重合,氣虛、血虛與黨參、黃芪,氣滯、痰與柴胡、香附、夏枯草,脾虛、腎虛與人參、山藥高關聯,對于淋巴瘤辨證獲取核心病機證素及辨機用藥有指導意義。
本研究為單源數據庫類研究,旨在研究單一來源數據庫的醫案數據結構特點,其優勢在于能夠有效降低建庫噪點,減少研究復核能耗,留存單源數據研究樣本,為多源數據庫類研究形成比對數據,確保后續多源數據庫類醫案挖掘研究的差異值顯現最大化。但單源數據庫類研究存在總體文獻樣本量偏小的客觀研究屬性,采用集外關聯研究其數據結果多為實際辨證中的高關聯、高頻率經驗,顯示規則條目相對集中,可解釋臨床意義范圍相對局限。另外,不同集外關聯平臺采用的底層算法不同,在樣本數據量較小的情況下,挖掘結果存在算法矯正偏倚可能,從而使部分數據規則與已知臨床知識提煉規則存在一定偏移。因此,今后在醫案類集外關聯規則研究中,為達到有效降低偏倚、規則顯現最大化、臨床意義高解釋性的研究目的,應采用單源數據庫類與多源數據庫類研究平行采集、交叉校驗的復合型數據挖掘方法,并根據中醫臨床醫案的文本特征不斷優化底層算法。