許晨璐 梁建慶 王佳華 董海玉 韓政陽 李斐



【摘 要】 目的:通過文獻數據挖掘探討前列腺癌中醫證素及癥狀/體征分布規律,為辨證論治提供參考。方法:檢索中國知網、萬方、維普及中國生物醫學文獻數據庫中前列腺癌中醫證型、證素及癥狀/體征相關文獻,建立數據庫,運用SPSS Statistics 26.0和Gephi 0.9.2軟件進行因子、聚類及復雜網絡分析,挖掘前列腺癌患者的中醫證候特點和分布規律。結果:前列腺癌證型分布以下焦濕熱證多見,總體以虛證為主。證素分布顯示病位多在腎、脾、肝及下焦,病理性質正虛邪實,正虛以氣、陰、陽、血的虧虛為主,實以血瘀、濕、熱、毒、痰為主。證素聚類分析結果分為7類:腎陽虧虛證、毒瘀互結證、脾氣血兩虛證、肝陰虧虛證、下焦濕熱證、痰濁內阻證和氣機郁滯證。癥狀/體征復雜網絡分析核心癥狀/體征為尿頻尿急、小便不利、神疲乏力、納呆、腰膝酸軟、腰痛、失眠、夜尿多、舌紅、腹部脹痛、大便干燥、口干口渴、排尿疼痛、消瘦、畏寒肢冷。癥狀/體征因子及聚類分析最終聚為5類:氣陰虧虛證、腎陽虧虛證、腎虛濕熱證、氣虛血瘀證、熱毒內蘊證。結論:正虛邪實是前列腺癌變化發展的主要病機,腎陽虧虛證、氣陰虧虛證、下焦濕熱證、毒瘀互結證是前列腺癌的臨床常見證型。
【關鍵詞】 前列腺癌;證候;證素;癥狀/體征;數據挖掘
【中圖分類號】R737.25? ?【文獻標志碼】 A? ? 【文章編號】1007-8517(2023)08-0107-07
Abstract:Objective To explore the distribution of TCM syndromes and symptoms/signs of prostate cancer by literature data mining, and to provide reference basis for syndrome differentiation and treatment. Method The literatures related to TCM syndrome types, syndrome elements and symptoms/signs of prostate cancer were retrieved from CNKI, Wanfang, VIP and Chinese Biomedical literature database, and the database was established. SPSS Statistics 26.0 and Gephi 0.9.2 software were used for factor, cluster and complex network analysis.Explore the TCM syndrome characteristics and distribution of prostate cancer patients. Results The syndrome type distribution of prostate cancer is mainly damp-heat syndrome of lower coke, and generally deficiency syndrome.The distribution of syndrome elements showed that the disease location was mostly in kidney, spleen, liver and lower coke. The pathological nature of positive deficiency was mainly deficiency of qi, Yin, Yang and blood, while the latter was mainly blood stasis, dampness, heat, poison and phlegm.The results of cluster analysis of syndrome elements were divided into 7 categories: deficiency of kidney-yang syndrome, combination of poison and stasis syndrome, deficiency of spleen-qi and blood syndrome, deficiency of liver-yin syndrome, damp-heat syndrome of lower jiao, obstruction of phlegm and turbidness, and stagnation of qi.Symptoms/Signs Complex network analysis Core symptoms/signs were frequent urination, urination difficulty, fatigue, lethargy, soreness in the waist and knees, lumbago, insomnia, nocturia, red tongue, abdominal distension, dry stool, dry mouth and thirst, painful urination, emaciation, chills and cold limbs.Symptoms/sign factors and cluster analysis finally clustered into five categories:Qi Yin deficiency syndrome,kidney Yang deficiency syndrome,kidney deficiency and heat syndrome,Qi deficiency and blood stasis syndrome,heat poison accumulation syndrome.Conclusion Positive deficiency and pathogenic solid are the main pathogenesis of prostate cancer. Kidney Yang deficiency syndrome,Qi Yin deficiency syndrome,lower coke dampness and heat syndrome,poison and blood stasis mutual junction syndrome are the common clinical syndrome of prostate cancer.
Key words:Prostate Cancer; TCM Syndromes; TCM Pattern Elements; Symptoms/Signs; Data Mining
前列腺癌(prostate cancer,Pca)為泌尿系惡性實體腫瘤,多發于中老年男性,至2020年居西方國家男性癌癥發病率第二,死亡率第五[1]。當前西醫治療主要采取手術、內分泌、免疫、放化療、分子靶向治療等方法,常導致神經、免疫及內分泌功能紊亂等一系列不良反應。中醫療法強調辨證論治指導個體精準用藥,目前已成為Pca的重要綜合治療手段,中西醫結合對于減輕放化療不良反應、控制Pca復發和轉移、延長去勢抵抗性前列腺癌(castration resistant prostate cancer,CRPC)生存時間取得了良好的臨床療效。但目前關于Pca的中醫辨證分型多具有臨床醫家主觀性,尚未建立統一的辨證體系,制約了中醫辨證論治在本病的發揮應用。本文通過多種數據挖掘方法,從傳統中醫角度探求Pca的病機特點和辨證規律,為完善Pca的中醫辨證體系及后續隨證施治提供思路及參考。
1 資料與方法
1.1 文獻來源與檢索方法 計算機檢索中國知識資源總庫(China national knowledge infrastructure,CNKI)、萬方數據學術論文總庫(Wanfang database,Wanfang)、維普中文科技期刊全文數據庫(VIP database for Chinese technical periodicals,VIP)及中國生物醫學文獻數據庫(China biology medicine disc,CBM)中收錄的Pca中醫證候及癥狀/體征相關文獻,選用高級檢索方式,以“前列腺癌”或“前列腺惡性腫瘤”合并“中醫”或“中西醫”或“中藥”或“證候”或“證型”或“驗案”為主題詞或關鍵詞,檢索時間為建庫至2022年3年31日,其余默認數據庫設置。
1.2 文獻納入標準 ①研究對象經西醫明確診斷為Pca,使用中醫藥或中西醫結合治療的臨床觀察、研究、經驗總結;②中醫辨證分型明確或癥狀/體征清晰明了;③臨床療效觀察文獻總有效率不低于70%。
1.3 文獻排除標準 ①藥理、動物及細胞實驗類文獻,綜述及理論探討類文獻;②未確診Pca的前期治療、合并其他原發腫瘤或其他系統疾病、中醫藥治療手術或放化療后并發癥的文獻;③文獻來源相同且研究內容重復,或引用同一個醫案者僅選擇資料相對完整的1篇;④無法獲取全文的文獻。
1.4 數據庫建立 由兩人按照統一納入和排除標準進行雙人雙機獨立篩選及錄入,出現意見分歧時再由兩名高級職稱老師討論決定,錄入結束后比對錄入結果確保數據準確性,以降低誤差。在數據錄入過程中為了避免主觀判斷對結果的影響,描述性數據未進行整理及分析。利用Excel 2019軟件提取符合納排標準的文獻的標題、作者、疾病類型、證型、證素、癥狀/體征等內容,同一篇文獻中多次出現的數據,記作1頻次,建立數據庫。
1.5 數據規范
1.5.1 證型規范 參考《中醫診斷學》[2]《中醫臨床診療術語·證候部分》[3]把相同病因病機的證候規范為同一證型,如氣血兩虛證、氣血不足證統一為氣血虧虛證,以上規范中未收錄的證型,按照原文的證型進行統計。
1.5.2 證素提取 參考《證素辨證學》[4]中的50項證素,將規范后的證型拆分為病性證素與病位證素,如脾腎陽虛證可以拆分為病性證素陽虛和病位證素脾、腎。
1.5.3 癥狀/體征規范 參考《中醫臨床常見癥狀術語規范》[5]《中醫診斷學》[2]對癥狀/體征進行規范處理,將含義相近的癥狀/體征進行歸類,如眠差、失眠、寐差、寐欠佳等統一記錄為失眠;對部分癥狀/體征進行分解錄入,如頭暈耳鳴分解為頭暈、耳鳴;對于無法規范的癥狀/體征按原文保留,如陰囊潮濕。
1.6 統計學方法 將文獻編號,運用Excel 2019軟件對文獻中的證型、證素及癥狀/體征進行頻次分析,運用Gephi 0.9.2軟件對癥狀/體征進行復雜網絡分析,將高頻證素、癥狀/體征導入IBM SPSS Statistics 26.0軟件進行因子與聚類分析。
2 結果
2.1 文獻檢索結果 通過檢索策略及其他途徑手動檢索共計檢出3518篇文獻(其中CNKI中1009篇,Wanfang中1372篇,VIP中328篇,CBM中785篇,根據參考文獻手動檢索22篇),去除重復后共計1043篇,通過對題目和摘要進行初篩后剩余288篇,按照納排標準對全文進行復篩后剩余125篇,最終納入125篇文獻。
2.2 中醫證型分布 對125篇文獻中的證型規范化處理后共得到83種,其中,單證證型32種,復合證型51種,證型總頻次為215次。經統計頻次≥5的證型(包括單、復證)共13個,累計頻率為51.63%,詳見表1。
2.3 中醫證素分析
2.3.1 頻次分布 對規范后的證型進行拆分,共提取26個證素,其中病性證素15個,病位證素11個(詳見表2、表3)。虛性病性證素主要為氣虛、陰虛、陽虛、血虛;實行病性證素主要為血瘀、濕、熱、毒、痰、氣滯;病位證素主要為腎、脾、肝、下焦。
2.3.2 聚類分析 將頻率>5%的14個高頻證素導入IBM SPSS Statistics 26.0進行系統聚類,選用“組間聯接”“Pearson相關系數”,生成聚類分析樹狀圖(如圖1所示)。對證素進行聚6類、7類、8類實驗,當截距為15時,聚類結果較穩定,結合中醫辨證理論,將Pca中醫證素聚為7類,詳見表4。
2.4 中醫癥狀/體征分析
2.4.1 頻次分布 納入文獻中載有Pca詳細中醫癥狀/體征的共162條,規范化處理后提取一般癥狀124種,舌象45種,脈象40種,總頻次為1895次。頻率>10%的一般癥狀共23個,排前十的為小便不利、神疲乏力、納呆、尿頻尿急、腰膝酸軟、腹部脹痛、失眠、夜尿多、腰痛、排尿疼痛。頻次≥10的舌象11個、脈象9個,排前五的舌象主要為舌紅、苔黃膩、苔少、舌有瘀斑瘀點、舌淡;排前五的脈象主要為細數脈、弱脈、沉細脈、沉弦脈、滑數脈。詳見表5、表6。
2.4.2 復雜網絡分析 將癥狀/體征進行共現分析,以“.CSV”格式保存并導入Gephi 0.9.2軟件進行復雜網絡分析。字符集選“GB2312”,圖的類型為“無向的”,布局為“Fruchterman Reingold”,結果顯示本復雜網絡共包含211個節點,4523條邊(詳見表7)。選取拓撲結構下的“K-core層次分析”對上述復雜網絡圖進行過濾,最大“K-core”值為37,此時共有68個核心癥狀/體征(如圖2所示),位于圖中心排前15的為尿頻尿急、小便不利、神疲乏力、納呆、腰膝酸軟、腰痛、失眠、夜尿多、舌紅、腹部脹痛、大便干燥、口干口渴、排尿疼痛、消瘦、畏寒肢冷。這一結果與頻次分布中排前十五的癥狀/體征相吻合,說明這些癥狀/體征可能是Pca的關鍵臨床特征。[KH*2D]
2.4.3 因子分析 選取頻次≥15的40個高頻癥狀/體征作為變量,導入IBM SPSS Statistics 26.0軟件中進行因子分析。首先進行KMO和Bartlett球型度檢驗,KMO=0.591>0.5,P<0.01,證明數據有進行因子分析的意義。選用主成分分析法,提取公因子共14個,選取旋轉后的成分矩陣表中得分絕對值>0.5的癥狀/體征,按貢獻度降序排列,可以得出14個公因子(分別用F1~F14表示)的具體癥狀/體征條目,詳見表8。
2.4.4 公因子信息聚類分析 運用IBM SPSS Statistics 26.0軟件對14個公因子旋轉后的成分矩陣得分表進行聚類分析,采用“系統聚類”“最遠鄰元素”法、“歐氏測量距離”“Z得分”進行標準化,繪制樹狀圖(如圖3所示)。對結果分別進行聚為不同類群的實驗,依據中醫理論指導,將不合理的癥狀/體征排除,最終確定聚5類,并根據《中醫診斷學》[2]對所得出的中醫癥狀/體征群進行辨證分型,詳見表9。[FL)]
3 討論
中醫沒有“前列腺癌”病名,結合其臨床表現可歸于“癃閉”“淋證”“積聚”“癥瘕”等范疇。目前中醫對本病無明確辨證分型,不同醫家根據病機、癥狀、舌脈等,將Pca分為不同證候類型。賈英杰認為Pca病因可概括為虛、毒、瘀、濕[6]。魏睦新依發病進程將Pca中期階段歸為肝腎陰虛證[7]。王樹聲等[8]認為晚期激素非依賴性Pca證屬脾腎陰陽虧虛。高瞻等[9]認為Pca患者在等待觀察期間多屬濕熱下注膀胱證。張亞大認為Pca虛實夾雜,以腎虛為本,癌毒為標[10]。中醫診療的核心是辨證論治,Pca辨證分型尚無標準,對于指導臨床辨證及后續隨證用藥、提高療效有局限性,故亟待制定規范統一的臨床辨證標準。數據挖掘可以找出大量無直觀聯系的數據背后隱藏的規律。多種數據挖掘技術聯合應用在中醫藥領域已非常成熟,可為中醫辨證論治提供更加系統、客觀、精準的科學理論依據[11]。本研究對多種數據挖掘方法進行聯合使用,意在充分、有效挖掘Pca中醫證型、證素及癥狀/體征分布組合特征,為臨床辨證分型及后續隨證施治提供客觀化參考。
本研究證型頻次分析顯示,Pca以下焦濕熱證最為常見,總體上以虛證為主。證素頻次分析顯示,Pca病位多在腎、脾、肝及下焦,病理性質正虛邪實,正虛以氣、陰、陽、血的虧虛為主,邪實以血瘀、濕、熱、毒、痰為主。本病下焦濕熱證最為常見,究其原因,前列腺位于會陰部屬下焦,患者飲食不節,過食肥甘厚味導致脾失健運、痰濕內生,日久郁而化熱,濕熱下注,而成下焦濕熱證[12]。濕熱是本病早、中期發病的主要原因,進一步發展導致膀胱氣化不利,局部氣血津液運行受阻,則氣滯、痰濁、瘀血等相繼產生,甚者醞釀成毒。上述為Pca發病外因,究其內因,則在于正氣虧虛,《素問·上古天真論》云:“丈夫……八八,天癸竭,精少,腎臟衰,形體皆極,則齒發去。”Pca患者多為中老年男性,人老而腎氣衰、腎精不足,加之手術、放化療等療法,機體正氣進一步損耗,導致正氣更虛而邪實更甚,甚者陰陽離決而成Pca晚期危重證候。
證素聚類分析顯示,類1~類7分別對應腎陽虧虛證、毒瘀互結證、脾氣血兩虛證、肝陰虧虛證、下焦濕熱證、痰濁內阻證、氣機郁滯證。這一結果與證型頻次分布結果基本吻合,進一步驗證說明本病正虛邪實的病機特點。《醫宗必讀》言“積之成也,正氣不足,而后邪氣踞之”,Pca患者素體虧虛而氣血津液運行異常形成濕、熱、瘀、毒、痰,病理產物進一步影響氣血津液運行,最終使正氣更虛而邪氣更甚。證素結果表明Pca正虛邪實,臨床分型上當以把握“肝”“脾”“腎”三臟的“陰”“陽”“氣”“血”虛損狀態為根本,尤其以腎臟虧虛為主,并綜合考慮下焦濕、熱、痰、瘀、毒等病理性質的兼夾進行判斷。
癥狀/體征復雜網絡分析顯示,排前15的核心癥狀/體征為尿頻尿急、小便不利、神疲乏力、納呆、腰膝酸軟、腰痛、失眠、夜尿多、舌紅、腹部脹痛、大便干燥、口干口渴、排尿疼痛、消瘦、畏寒肢冷。這一結果與癥狀/體征頻次分布結果一致,說明這些癥狀/體征可能是Pca的關鍵臨床特征。其中小便不利、尿頻尿急、排尿疼痛、腰痛、腹部脹痛考慮為前列腺占位性病變導致的疾病層面的特征;神疲乏力、納呆、腰膝酸軟、夜尿多、畏寒肢冷、消瘦反應了脾腎兩臟虛損,以氣虛、陰虛與陽虛為主;失眠、舌紅、大便干燥、口干口渴則是邪實的體現,此處濕熱瘀毒痰體現不明顯,考慮Pca以正氣虧虛為本,此為本病的核心癥狀/體征群,故以正虛為主,未能體現對邪實的具體分類情況。
癥狀/體征因子及聚類分析最終聚為5類,分別為氣陰虧虛證、腎陽虧虛證、腎虛濕熱證、氣虛血瘀證、熱毒內蘊證。該結果反應了本病病位主要在腎,正虛以氣虛、陽虛、陰虛為主,邪實以濕、熱、瘀、毒為主。對比證型、證素、癥狀/體征三者數據挖掘證型推斷結果,證素及癥狀/體征的證型推斷結果均可在證型頻次分布中得見,且兩者結果基本相符,均包含腎陽虛、氣虛、陰虛、濕熱、血瘀、毒結;不同點在于,證素聚類較癥狀/體征聚類所涉及臟腑還包括脾和肝,且多出血虛、痰濁和氣滯。推測其可能原因為,所納入的文獻中Pca復合證型雖頻次較低但種類較多(復合證型共51種,總頻次為67次),多兼見毒、瘀、痰濁、氣滯等,證素是對證型的拆分提取,故對此體現較明顯。而在癥狀/體征分布中,臟腑氣血虧虛常作為癥狀/體征采集的重點,而毒、瘀、痰等多為次癥,聚類主要體現高頻核心的癥狀/體征,故對后者體現不明顯。兩者之間雖略有出入,但均與Pca證型頻次分布情況相吻合。綜上所述,Pca常見臨床基本證型可歸納為:腎陽虧虛證、氣陰虧虛證、下焦濕熱證、毒瘀互結證。
癥狀是辨證的前提,證素是辨證關鍵,中醫辨證的規律是從癥狀到證素到證名的過程。本研究綜合應用數據挖掘技術,從證素及癥狀/體征兩方面進行綜合考量,深入探索Pca的中醫辨證分型規律,以期為建立Pca臨床辨證分型標準提供參考依據,擴寬臨床遣方用藥思路,提高中醫藥對Pca的臨床防治療效。現有數據挖掘技術在一定程度上克服了中醫辨證過程中的局限性,但由于臨床辨證論治的復雜性,本文納入的文獻數量較少,加之二次分析、人機交互等因素存在主觀性與局限性,故還需進一步的臨床檢驗和改進。
參考文獻
[1]SUNG H,FERLAY J,SIEGEL R L,et al.Global Cancer Statistics 2020:GLOBOCAN Estimates of Incidence and Mortality Worldwide for 36 Cancers in 185 Countries[J].CA Cancer J Clin,2021,71(3):209-249.
[2]陳家旭,鄒小娟.中醫診斷學(第四版)[M].北京:人民衛生出版社,2021:118-167.
[3]國家技術監督局.中醫臨床診療術語:證候部分[S].北京:中國標準出版社,1997.
[4]朱文鋒.證素辨證學[M].北京:人民衛生出版社,2008.
[5]黎敬波,馬力.中醫臨床常見癥狀術語規范(修訂)[M].北京:中國醫藥科技出版社,2015.
[6]王金秀,李小江,陳軍,等.賈英杰論前列腺癌的中醫病機與治療[J].新中醫,2014,46(4):20-23.
[7]馬國花,吳燕敏,魏睦新.魏睦新采用中醫待機療法治療早期前列腺癌經驗[J].中國中醫藥信息雜志,2008,15(9):88-89.
[8]王樹聲,古熾明.中醫藥治療前列腺癌的探索與優勢[J].中國中西醫結合外科雜志,2010,16(3):263-265.
[9]高瞻,邵魁卿,沈建武,等.前列腺癌的中醫藥輔助治療概況[J].北京中醫藥大學學報(中醫臨床版),2011,18(3):37-39.
[10]張揚,顧曉箭,朱清毅,等.張亞大診治晚期前列腺癌的經驗[J].江蘇中醫藥,2014,46(10):26-27.
[11]徐瑋斐,劉國萍,王憶勤.多元統計學方法在中醫證候分類識別中的應用及展望[J].中國中醫藥信息雜志,2015,22(8):124-128.
[12]張雪薇,袁晶晶,王瑞平.中醫藥治療前列腺癌研究進展[J].河南中醫,2021,41(1):141-146.
(收稿日期:2022-08-05 編輯:徐 雯)