展俊平,鄭 光,孟慶良,谷慧敏,左瑞庭,呂 誠,姜 淼△
(1.河南中醫藥大學第二附屬醫院,鄭州 450002; 2. 蘭州大學數學院, 蘭州 730000;3. 中國中醫科學院中醫臨床基礎醫學研究所, 北京 100700)
雷公藤(TriptergiumwilfordiiHook. F)為衛矛科一年生藤本植物,作為傳統中藥的使用歷史悠久。最早在《神農本草經》中就有所記載,主要以根入藥,歸肝腎經,性苦、辛、涼、大毒,具有祛風除濕、活血化瘀、清熱解毒、消腫散結、殺蟲止血等功效。其廣泛分布于中國南方,為中國的傳統中藥,具有免疫調節、抗炎、抗腫瘤、抗生育、抗菌等藥理作用[1]。雷公藤化學成分非常復雜,目前所知其主要成分包括生物堿類、二萜類、三萜類、倍半萜以及糖在內的380多種物質,多種生物堿類化合物及其他小分子化合物已從雷公藤植物中分離鑒定出來[2]。
本文擬用文本數據挖掘方式,采用現有的臨床研究及實驗研究文獻資料,運用基于敏感關鍵詞頻數統計的數據分層算法,對雷公藤相關的疾病及其生物作用靶點進行初步的總結分析,以期能進一步指導臨床用藥,并為相關研究提供一定的理論基礎。
文本挖掘是從非結構化、自然語言描述的文本數據中,抽取有意義的數據應用到生物醫學領域,文本挖掘可以分為文本數據收集、(預)處理、結構化分析、可視化以及評價5個步驟[3]。
文本數據的收集來自中國生物醫學文獻服務系統 (英文全稱Chinese BioMedical Literature Database,簡稱CBM)的論文摘要。在主題檢索下分別檢索關鍵詞“雷公藤”。經過檢索出現主題詞、命中文獻數,合并檢索主題詞分別得到文獻12957篇(檢索日期2017年9月16日)。為獲取文獻的詳細信息,如流水號、標題、摘要、主題詞等,在顯示格式中選擇“詳細”和“顯示全部”然后進行下載。
從CBM下載的文本數據,按照下載的先后順序合并到一個平面文本文件(后綴txt)中,并以ANSI編碼進行保存。在此基礎上,利用專有的文本提取工具(軟件著作權,軟著登字第0261882號,登記號2010SR073409),對下載的文本數據進行信息提取,并將格式化的結果保存到大型關系型數據庫(microsoft sql server 2008 R2,以下簡稱SQL)中。針對初步提取出來的數據,構建算法并對其中可能的噪音進行清洗[4]。
清洗后的數據仍然采取數據切片分層的形式,針對挖掘對象的一維和二維頻次數據進行分析(即相關挖掘要素在數據集中出現文獻總的頻數以及兩兩之間的頻數關系),用Cytoscape 2.8軟件進行可視化處理。
本文中形成可視化的二維網絡圖,筆者采用連線的寬度和圖形大小2種方式同時進行客觀展示,圖形內為獨立要素名稱,連線代表要素兩兩之間的關聯。圖形的面積越大,代表該要素與其他要素關聯的越多,權重越大,連線越寬[4]代表該要素與雷公藤的關系越密切,在文獻中出現的頻次越高。同時結合專業知識進行解析,對于不合理的結果,即回溯原文獻數據集,按算法進行噪音清洗[5]。人工閱讀評價使得結果更加客觀,通過這種優化的文本挖掘組合,盡可能客觀地呈現各方面的的信息。
表1顯示,文本挖掘共提取到281種疾病,選擇頻次較高有代表意義的前10個列出(括號內為文獻篇數,下同):關節炎(1137)、類風濕(741)、腎小球腎炎(387)、腎病綜合征(321)、糖尿病腎病(287)、紫癜(250)、銀屑病(247)、哮喘(139)、紅斑狼瘡(116)、腫瘤(86)。由于構建詞表及挖掘詞的包含關系,出現以上結果重復的現象,說明挖掘詞越短,挖掘到的頻次越高,其結果基本反映了雷公藤治療相關疾病的一維特征。
圖1顯示,在此基礎上依據共同出現的原則,構建雷公藤對應的疾病二維網絡。圖中節點為疾病名稱,連線代表不同疾病間的聯系,疾病的連線越多越寬,節點就越大,其權重也越大;連線寬度與臨床報道文獻數量多少呈指數線性關系。

表1 雷公藤疾病一維結果比較
文本挖掘共提取到1389項疾病組合,圖1為頻次大于2的疾病組合參與構建的網絡圖。由圖可知,類風濕、關節炎圓圈最大,其相應的權重最高,其他疾病次之,且二者之間關聯最密切(連線最寬)。回看數據結果,“類風濕”和“關節炎”頻數為691。追溯原文獻,可能是因為在多種疾病中均會伴隨關節炎的臨床癥狀表現。

圖1 雷公藤相關疾病二維網絡圖
文本挖掘共提取到358個結果,選擇前10個列出,T淋巴細胞(134)、滑膜(121)、血管(74)、基因(71)、細胞因子類(70)、單核細胞類(61)、蛋白質類(61)、足細胞(51)、內皮(50)、巨噬細胞(46)。
圖2顯示,文本挖掘共提取到65項免疫靶標組合。圖3顯示,血管與內皮相關度最高,其次為滑膜與成纖維細胞、膜糖蛋白類與載體蛋白質類。
圖3顯示,同樣方法文本挖掘共提取59個生物分子靶標結果,選擇前10個列出,文本挖掘共提取到184項生物分子組合,頻次大于8的分子組合參與構建的網絡圖。圖3可知,腫瘤壞死因子α處于核心位置,與白介素1、白介素6、白介素10的相關度最高。

表2 雷公藤生物靶標一維結果

圖3 雷公藤生物分子二維網絡圖

作用靶標頻次權重TNF?α1980245RNA1210149IL?2930115IL?6930115IL?1710087轉化生長因子β550068CD4540066IL?10510063CD8410050IL?4410050

圖2 雷公藤生物靶標二維網絡圖
文本挖掘共有20條通路,選擇前10條列出。
圖4顯示,文本挖掘共提取到45項通路組合,頻次大于2的通路組合參與構建的網絡圖。圖4顯示,PI3K/Akt、TLR4/NF-κB相關度最高。
雷公藤臨床應用極為廣泛,盡管其具有較大的副作用,但因其療效顯著,眾多學者對其生物學作用機制仍進行了不斷的深入研究。圖1顯示,雷公藤主要用于關節炎、類風濕、腎病、皮膚病等領域,提示與其抗炎及免疫抑制作用密不可分;圖2顯示,從淺層分析認為主要作用于T淋巴細胞群、滑膜、血管、細胞因子類,圖3提示具體包括TNF-α、RNA、白介素類,而圖4通路則以NF-κB、Akt、Fas/FasL等為主,二維結果中類風濕與關節炎的關聯度最高,內皮與血管關系密切,腫瘤壞死因子與白細胞介素類共同出現頻次較高,PI3K/Akt、TLR4/NF-κB相關度最高。

表4 雷公藤相關通路一維結果

圖4 雷公藤相關通路二維結果
T淋巴細胞是雷公藤作用的主要靶細胞,能夠有非選擇性、非平衡性的抑制作用,糾正免疫系統紊亂,抑制免疫細胞增殖及誘導細胞凋亡等[6]。實驗證實,雷公藤多苷對早期糖尿病腎病患者具有一定的血管內皮修復效應,同時可糾正患者 T 淋巴細胞亞群失衡現象[7]。而在治療自身免疫性疾病中,雷公藤對促炎和抗炎性細胞因子均有一定的調節作用。其有效成分雷公藤甲素可以通過抑制TNF-α信號傳導通路,進而抑制其與IL-6 的協同作用,達到抑制炎癥反應的目的[8];亦能作用于白細胞介素-2(IL-2)及其受體的基因轉錄水平,抑制兩者的基因表達和其介導的細胞免疫反應。此外,白細胞介素-10 (IL -10) 具有誘導致炎細胞因子凋亡的特性,雷公藤甲素通過上調 IL-10下調 IL -1、IL-6、IL -8及 TNF-α 等促炎因子,達到延緩和降低發病[9]。
NF-κB是一種重要的核轉錄因子,存在于大多數真核細胞中,可誘導多種細胞因子、黏附分子和受體分子等基因表達,雷公藤通過調控參與炎癥級聯效應多種酶的基因表達發揮免疫抑制作用[10]。研究證實,NF-κB信號通路在軟骨細胞的增殖、分化、凋亡中扮演著十分重要的角色[11]。而死亡受體Fas (又稱為CD95/Apo-1)介導著細胞凋亡的外在通道,FasL或抗Fas抗體與Fas結合后可激活一系列細胞內信號通路,進而誘導細胞凋亡[12]。有報道稱,雷公藤多苷可明顯降低TNBS小鼠結腸上皮細胞中Fas表達,增加FasL含量,同時可明顯降低結腸上皮細胞處于G0-G1增殖期數量,升高S期數量,說明雷公藤多苷可以通過調節Fas/FasL信號途徑,加速炎細胞凋亡,完成修復過程,進而治療或緩解結腸黏膜炎性損傷[13]。
AKT通路則廣泛存在于細胞中,是參與細胞生長、增殖、分化調節的信號傳導通路,與人類惡性腫瘤、慢性炎癥甚至過敏反應中相關下游主要效應靶基因激活相關,造成細胞凋亡[14]。雷公藤紅素對肥大細胞脫顆粒的抑制作用是通過下調PI3K / AKT信號通路上重要的抗凋亡基因Pik3r3、Akt2的表達以及上調促凋亡基因 Gsk3b的表達實現的[15]。另外,作為雷公藤的重要靶向通路之一的ERK,報道顯示復方雷公藤外敷劑能降低關節炎大鼠血清及滑膜組織中炎癥因子,抑制滑膜組織ERK通路的活化,從而抑制滑膜組織增殖、減少滑膜中血管新生和血管翳形成[16]。
文本挖掘(Text Mining)技術是以計算語言學及統計數理分析為理論基礎,借用大數據時代的信息服務于各學科的交叉學科[17]。中醫藥源遠流長,有許多行之有效的寶貴經驗需要更為科學直觀的驗證,基于循證醫學的文本挖掘技術無疑是一有利工具,尤其在生物分子機制方面的深入探討[18],通過對信息產生的潛在的關聯關系,讓我們獲取和拓展新的知識[19]。
參考文獻:
[1] WANG H L, JIANG Q, FENG X H, et al. Tripterygium wilfordii, Hook F versus conventional synthetic disease-modifying anti-rheumatic drugs as monotherapy for rheumatoid arthritis: a systematic review and network meta-analysis[J]. Bmc Complementary & Alternative Medicine, 2016, 16(1):215.
[2] WONG K F, YUAN Y, LUK J M. Tripterygium wilfordii bioactive compounds as anticancer and anti-inflammatory agents[J]. Clinical & Experimental Pharmacology & Physiology, 2012, 39(3):311.
[3] 孟慶良, 展俊平, 郭會卿,等. 基于文本挖掘技術析甲氨蝶呤與中醫治療聯合應用的規律[J]. 中國中醫基礎醫學雜志, 2014, 20(12):1665-1667.
[4] 沈姍姍, 鄭光, 展俊平,等. 基于數據挖掘探討類風濕關節炎證-癥-法-方藥規律[J]. 風濕病與關節炎, 2013(10):5-9.
[5] 李仲賢, 鄭光, 展俊平,等. 基于文本挖掘技術探索強直性脊柱炎“理-法-方-藥”相應規律[J]. 蘭州工業學院學報, 2013, 20(2):23-26.
[6] 何英蒙,姚媛媛,陳一龍,等.雷公藤類制劑的研究進展[J].中國藥房,2017,28(4):551-554.
[7] 周瑞琴, 李小巧, 楊艷琴. 雷公藤多苷對早期糖尿病腎病患者的血管內皮功能及T淋巴細胞亞群的影響[J]. 世界中醫藥, 2017, 12(8):1840-1843.
[8] 王偉東, 陳如平, 肖魯偉,等. 雷公藤甲素對類風濕關節炎滑膜新生血管中血管內皮生長因子、白細胞介素-6抑制機理的探討[J]. 中醫正骨, 2012, 24(2):3-5.
[9] 曹學梅. 雷公藤多苷對類風濕關節炎患者血清細胞因子水平的影響[J]. 中國藥業, 2013, 22(7):21-23.
[10] 張敏, 王守安, 劉黎星,等. 雷公藤多苷干預TLR-NF-κB通路發揮免疫抑制作用[J]. 中草藥, 2014, 45(9):1288-1292.
[11] 周莊, 張柳. NF-κB信號通路在骨性關節炎發生發展中作用機制的研究[J]. 中國骨質疏松雜志, 2012, 18(1):78-82.
[12] YAMADA A, ARAKAKI R, SAITO M, et al. Dual Role of Fas/FasL-Mediated Signal in Peripheral Immune Tolerance[J]. Frontiers in Immunology, 2017, 8(4):403.
[13] 黃小英, 劉端勇, 程紹民,等. 雷公藤多苷對結腸炎小鼠結腸上皮細胞周期及Fas/Fas L表達的影響[J]. 時珍國醫國藥, 2012, 23(11):2785-2786.
[14] 王曉南, 吳青, 楊旭,等. 雷公藤紅素對白血病細胞Akt信號通路的影響及在細胞凋亡中的作用[J]. 中國中西醫結合雜志, 2011, 31(2):228-232.
[15] 姚賜玉, 王滔, 蔣云林,等. 雷公藤紅素對致敏肥大細胞的抑制作用及其中PI3K/AKT/GSK3-β信號通路的影響[J]. 福建醫藥雜志, 2017, 39(1):61-64.
[16] 趙越, 唐曉頗, 姜泉,等. 復方雷公藤外敷對Ⅱ型膠原誘導型關節炎大鼠滑膜組織細胞因子及ERK通路的影響[J]. 中醫雜志, 2017, 58(7):582-586.
[17] LI Z, et al.Applying Discrete Derivative Algorithm in Two Dimensions in Mining Acupuncture and Moxibustion Rules on Bell’s Palsy, in Eighth International Conference on Fuzzy Systems and Knowledge Discovery (FSKD),2011: 1570-1574.
[18] ANANIADOU S, THOMPSON P, NAWAZ R, et al. Event-based text mining for biology and functional genomics[J]. Briefings in Functional Genomics, 2015, 14(3):213-230.
[19] O'MARAEVES A, THOMAS J, MCNAUGHT J, et al. Using text mining for study identification in systematic reviews: a systematic review of current approaches[J]. Systematic Reviews, 2015, 4(1):5.