馬麗娟,暴正瀚,雷樂庭,王逸飛,朱振宇,王 濟,王 琦,喬延江,鄭燕飛**,吳志生**
(1.北京中醫藥大學中藥學院 北京 102488;2.北京中醫藥大學房山醫院北京 102400;3.北京中醫藥大學中醫學院 北京 100029)
2019年12月,我國湖北省武漢市爆發了新型冠狀病毒(2019-nCoV)感染的肺炎,截至2020年2月27日24時,全國確診案例達78631例,人民健康、經濟發展和社會穩定均受到嚴重威脅。如何有效救治新型冠狀肺炎是當前亟待攻克的關鍵難題。主動健康是遵循國家中長期科技發展規劃綱要的重要理念之一。國家衛生健康委員會針對此病癥先后印發了6版《新型冠狀病毒感染的肺炎診療方案》[1-4],在推薦采用中醫藥方劑進行新型冠狀病毒肺炎的治療的同時,也提供了多種預防方劑及中成藥。全國各省市也相繼出臺了各自的診療方案及推薦處方?!吨嗅t藥有效方劑篩選研究取得階段性進展》中明確指出,中醫治療方案在山西、河北、黑龍江、陜西4個省份試點的總有效率可達90%以上,可見中醫治療該病療效明確[5]。中國中醫科學院張伯禮院士也明確指出,以整體觀和辨證論治為特色的中醫診療方案在病毒感染疾病治療中的優勢[6]。
數據挖掘[7]和網絡藥理學[8-9]方法在中醫藥組方規律和作用機制中應用廣泛。周添奕等[10]采用數據挖掘方法發現中藥治療急性胃腸損傷以承氣湯與香砂六君子湯為主,并且發現了治療急性胃腸損傷的常用穴位。嚴瑤琦等[11]采用數據挖掘結合網絡藥理學方法研究了痛風濕熱蘊結證用藥規律和作用機制。尕藏措[12]采用數據挖掘的方法分析了藏族醫治療HAPC高頻次使用藏族藥,并進一步通過網絡藥理學研究了其作用機制。本研究擬以全國各省市針對新冠肺炎公布的預防方藥為研究載體,采用數據挖掘及網絡藥理學方法,研究中醫藥預防新冠肺炎組方規律和作用機制,為2019-nCoV新冠肺炎的預防提供借鑒,同時為主動健康指導方針下的未病先防研究提供方法指導。
本研究中的處方來自于國家衛生健康委員會以及各省市針對2019-nCoV所致的新型冠狀病毒肺炎公布的各版《新型冠狀病毒感染的肺炎診療方案》中包含的中醫預防方劑和預防用中成藥;全國各省市針對新冠肺炎官方公布的預防方劑和預防用中成藥;國醫大師王琦院士等主編的《新型冠狀病毒肺炎中醫診療手冊》[13]中針對新冠肺炎擬定的預防方劑和預防用中成藥,選取口服劑型,篩去注射劑,熏香劑等其他劑型。
查詢中成藥所包含的中藥藥味,將整理好的方劑錄入Excel表格,并對錄入數據進行雙人核對,保障數據的準確性。根據《中華人民共和國藥典》規范藥名,如將“銀花”統一為“金銀花”,“山銀花”不計入“金銀花”。對采用不同炮制方法的同一藥物,均不計炮制方法,如“生黃芪”“炙黃芪”統一命名為“黃芪”。相同組分,不同劑型的方劑只錄入一次,如“藿香正氣水”“藿香正氣膠囊”,按方劑組分只錄入一次。
將數據庫中的方劑按一列單獨提取出來,并對方劑中的每一味中藥不計種類的羅列,以便于后續頻數分析。將每一味中藥按名稱作為變量列,對每一個方劑進行二分類處理,即若方劑中含有某一味中藥,就在與那味中藥所在的變量列的對應的位置記為“T”,否則記為“F”,整理成方劑與其所含中藥的二分類變量形式的表格格式數據。
1.4.1 組方特點分析
本研究采用IBMSPSSStatistics 20.0軟件,將整理過的新冠肺炎中藥治療方劑和治療中成藥的中藥組分按用藥頻次逐個進行統計分析。并設計出現頻次和出現頻率兩個指標綜合分析新冠肺炎治療方藥組方規律,揭示新冠肺炎治療方藥內在中藥配伍規律。進一步采用IBM SPSSStatistics 20.0軟件對篩選過新冠肺炎治療方藥中單味中藥出現在方劑中的頻率,篩選出高頻中藥組分,并顯示每一味藥的出現頻次,出現頻率。在此基礎上,依據《中華人民共和國藥典》(2015版)對所得藥味的性、味、歸經規律進行分析。
1.4.2 網絡圖分析
關聯性分析是針對兩味及以上高頻中藥組分在配方中的配伍聯系,故將提取到的二分類變量形式的表格格式數據進行重新整理,篩去經處理后僅剩一味中藥的配方,同時刪去高頻中藥組分以外的中藥組分的變量列,再利用IBM SPSSModeler 18.0軟件對篩選出來的高頻中藥組分進行關聯網絡圖分析,分析高頻中藥之間的關聯性。
1.4.3 關聯規則分析
為了進一步揭示高頻中藥組分之間的關聯規則,利用IBMSPSSModeler 18.0軟件所提供的Apriori算法對篩選出的高頻中藥組分進行關聯度分析。
1.5.1 高頻藥物化合物篩選和相應靶點收集
以通過關聯規則得到的核心藥對和藥組為研究載體,采用BATMAN-TCM數據庫,設定預測候選目標(包括已知目標)的得分不小于每個成分得分分界的20%,置信區間設置為95%,獲取核心藥味所含化合物及其相應靶點。
1.5.2 “疾病-成分-靶點”網絡的構建
采用BATMAN-TCM在線分析系統,將核心高頻藥組的活性成分及其作用疾病和靶點信息作為“節點(node)”,以“邊(edge)”作為活性成分和作用靶點的相互關系,構建核心高頻藥組的“疾病-成分-靶點”網絡,可視化呈現靶點與靶點之間直接、間接的調控關系。
1.5.3 基因富集分析和通路注釋研究
基因本體(gene ontology,GO)是注釋基因及其表達產物的常用方法。通過GO分析可以幫助發現新的研究方向。京都基因與基因組百科全書(kyoto encyclopedia of genes and genomes,KEGG)可對藥物作用靶點或差異表達基因進行信號通路分析。采用BATMAN-TCM在線分析系統,通過GO富集和KEGG通路分析,研究核心藥對和藥組生物信號通路等生物學信息,闡明其作用機制。
統計新冠肺炎預防方藥63個預防方劑和中成藥,其中涉及藥物共105種,藥物出現頻次為475。使用頻次大于10的藥物一共14味,共出現278次,占總用藥次數的58.5%,將這14味中藥作為高頻藥物。依據《中華人民共和國藥典》,表1展示了該14味中藥的頻數、頻率,性、味,歸經等基本信息。由表1可知,頻率排名靠前的中藥味為甘草、黃芪、金銀花、藿香、蒼術、防風、白術。
由表1可知,統計所含藥味的性、味及歸經信息,高頻藥味中除蒼術、白術和防風外,歸經中均包含肺經,其次是歸脾、胃經,這符合現代醫學中以肺為主的呼吸系統疾病。新冠肺炎歸屬中醫“疫病”范疇,屬中醫溫病學中感受疫、毒邪的一類傳染疾病。病因主要歸結于溫燥之邪久伏于肺,再加寒濕之氣襲肺,導致邪熱壅肺、邪毒閉肺。據統計發現,新冠肺炎預防方藥性味主要以“甘、辛、苦,溫”為主。肺為人體氣機運行的主要臟器,肺之氣機,重在宣降,而預防則以補氣為主,宣降為輔,主以甘味藥以升正氣,辛、苦藥味一升一降、一開一泄,調和人體氣機。研究表明,辛開苦降甘調常作為癌癥晚期用于提高人體機能的組方思路。
對整理后的二分類變量形式的表格格式數據進行關聯網絡圖分析,結果如圖1所示。為了展示高頻中藥組分之間的關聯性強弱,分析新型冠狀病毒肺炎預防機制的核心藥對與核心藥組,本次分析對關聯網絡圖進行分層展示。鑒于14味高頻中藥組分關聯頻數的分布情況,將0~20的區間為包括全部關聯頻數的數據空間,并按高頻中藥組分的關聯性將其分為三個層級,即顯著性關聯層、一般性關聯層和非顯著性關聯層。其中,顯著性關聯層為關聯性較強的60%~100%的數據空間(關聯頻數范圍為12~20);一般性關聯層為關聯性較弱的20%~60%的數據空間(關聯頻數范圍為4~12);非顯著性關聯層為關聯性很弱的0~20%的數據空間(關聯頻數范圍為0~4),且每個層級區間包括上限而不包括下限。由于非顯著性關聯層的實際意義不大,而且會對網絡圖中其他層級產生干擾,故將非顯著性關聯層濾去,并對顯著關聯與一般關聯進行區分,分別以粗實線、細實線在網絡圖中表示。由此可得,以甘草和黃芪為核心的藥物配伍關系,與其有顯著性關聯的藥物涵蓋了白術、桔梗、防風、金銀花、連翹和藿香。另外,網絡圖也顯示“防風、白術”和“藿香、蒼術”,在無甘草和黃芪參與時仍為顯著性相關的藥物。

表1 新冠肺炎預防方藥高頻中藥基本信息

圖1 14味高頻中藥組分關聯網絡圖
運用Apriori算法對整理后的二分類變量形式的表格格式數據進行關聯規則分析。設置關聯規則提取的條件支持度下限為20%,規則置信度下限為0.6,提升度下限為1。進一步進行提取關聯規則中的中藥藥對規則和中藥藥組規則,得中藥藥對規則14條,中藥藥組規則15條。將分析結果按支持度降序排序,藥對結果如表2所示,由表可知,所得支持度排名前五的是(防風→黃芪)、(黃芪→白術)、(防風→白術)、(甘草→白術)和(藿香→蒼術)。防風與黃芪配伍常作為解表藥物用于表證的治療。防風得黃芪,驅邪不傷正;黃芪得防風,固表不留邪。防風和白術也常配伍使用,用于提高免疫力,如一些常見的過敏性疾病,鼻炎、哮喘等。藿香和蒼術均為芳香中藥,藿香味辛,性微溫;蒼術味辛、苦,性溫,歸肺、脾、胃經,兩者合用,辛溫解表,宣降氣機,現代常配伍用于呼吸道疾病。
表3展示的是基于關聯規則的新冠肺炎預防方藥藥組排序結果。由表3可知,綜合支持度、置信度和提升度3項指標,考慮甘草調和諸藥的作用,綜合排名靠前的藥組為防風→白術,黃芪。防風、白術和黃芪為中藥經典方劑玉屏風散的組成成分,常用于解表。清代傷寒學家柯韻伯有云:“夫以防風之善驅風,得黃芪以固表,則外有所衛,得白術以固里,則內有所據。風邪去而不復來,此欲散風邪者,當倚如屏,珍如玉也?!毖芯勘砻鳎鋵γ庖呦到y具有重要調節作用,可作為預防藥物提高機體免疫力,起到未病先防的功效。汪瓊等對國醫大師解表藥的組方規律進行分析,發現防風常與白術、甘草、黃芪等藥同用,據統計防風→黃芪、防風→白術、防風→甘草是高頻次藥對,頻次最高的藥組是白術→黃芪、白術、甘草。并且,研究顯示黃芪和白術同時使用時,有100%的幾率會同時出現防風[14]。
基于以上研究結果,發現防風、白術和黃芪不僅是高頻藥對,而且三者常作為藥組出現。進一步基于BATMAN-TCM在線分析系統(http://bionet.ncpsb.org/batman-tcm/index.php),設定預測候選目標(包括已知目標)的得分不小于每個成分得分分界的20%,置信區間設置為95%,用于進一步的生物信息學分析。防風、黃芪和白術共涉及99個有結構信息的化合物,其中黃芪70個,其中35個無結構信息;防風71個,其中19個無結構信息;白術26個,其中15個無結構信息。設定調整P值小于0.05,防風、黃芪和白術三者所含化合物及其對應靶點的網絡圖如圖2(a)所示,防風、黃芪和白術潛在靶點所涉及的疾病共9種,主要包括呼吸系統疾病(Respiratory diseases)、阿爾茨海默癥、藥物依賴、末梢疼痛(Pain,unspecified)等。

表2 基于關聯規則的新冠肺炎預防方藥高頻藥對

表3 基于關聯規則的新冠肺炎預防方藥高頻藥組

圖2 “防風、黃芪和白術”作用機制
進一步進行KEGG分析,防風、黃芪和白術對應潛在靶點富集的生物通路39條,對應靶點數在20以上的有21條,如圖2(b)所示,主要包括各種氨基酸代謝,如脯氨酸、絡氨酸、絲氨酸、蘇氨酸、亮氨酸、異亮氨酸、丙氨酸、天門冬氨酸和谷氨酸等的代謝,以及嘧啶代謝等基礎代謝過程,從而提高機體免疫功能。此外,還參與體液調節,如鈣信號通路等。圖(c)和(d)分別展示的是防風、黃芪和白術所涉及的生物過程和分子功能,防風、黃芪和白術除共同參與一些基礎代謝過程外,還可直接參與機體免疫功能調節過程,可見防風、黃芪和白術通過介導多個生物通路共同維持機體正常功能,其中以調節基礎代謝為主。
除防風、白術、黃芪和甘草外,藿香和蒼術是高頻藥對。采用Batman分析網站,設定預測候選目標(包括已知目標)的得分不小于每個成分得分分界的20%,置信區間設置為95%,用于進一步的生物信息學分析。蒼術和藿香共涉及75個有結構信息的化合物,其中蒼術26個,藿香49個,對應靶點共2339個。設定調整P值小于0.05,蒼術和藿香化合物及其對應靶點的網絡圖如圖3(a)所示,由圖可知,蒼術和藿香潛在靶點所涉及的疾病共4種,主要包括呼吸系統疾病(Respiratory diseases)、乳腺癌(Breast cancer,)、前列腺癌(Prostate cancer)、末梢疼痛(Pain,unspecified)等,結果與防風、黃芪和白術所涉及的疾病較為一致。
進一步進行KEGG分析,蒼術和藿香對應潛在靶點富集的生物通路40條,對應靶點數在15及以上的有22條,如圖3(b)所示,與防風、黃芪和白術相比,除包含一些基礎代謝(氨基酸代謝)和體液代謝(鈣信號通路)外,藿香和蒼術藥對還包括一些炎癥信號通路,如炎癥介質調控、AMPK通路、HIF-1通路等。這也與藿香和蒼術常作為解表藥物用于流行性感冒的預防和治療相一致。圖3(c)和3(d)分別展示的是蒼術和藿香所設計的生物過程和分子功能,蒼術和藿香涉及的生物過程和分子功能與防風、黃芪和白術結果較為一致,共同參與一些基礎代謝過程外,還可直接參與機體免疫功能調節過程,可見蒼術和藿香也是通過多個生物通路的介導共同維持機體正常功能,側重于炎癥反應的介導。

圖3 “蒼術和藿香”作用機制
本研究采用數據挖掘和關聯規則分析方法,研究63個官方公布的新冠肺炎預防方藥,發現14味高頻中藥,除甘草外,排名靠前的是黃芪、金銀花、藿香、蒼術、防風和白術。綜合評價14個高頻藥對和15個高頻藥組,顯示“防風、白術和黃芪”和“藿香和蒼術”為高頻核心藥組。網絡圖也顯示“防風、白術”和“藿香、蒼術”,在無甘草和黃芪參與時仍為顯著性相關的藥物。防風、白術和黃芪為中藥經典方劑玉屏風散的組成成分,防風得黃芪,驅邪不傷正;黃芪得防風,固表不留邪,針對新冠肺炎的“濕邪犯肺、邪熱壅肺、邪毒閉肺”病機,具有“扶正祛邪”之功。藿香和蒼術均為芳香藥物,辛散之功較強,可助肺氣宣降,從而發揮預防新冠肺炎的作用。
進一步采用網絡藥理學方法,對兩個高頻核心藥組作用機制進行分析,發現“防風、白術和黃芪”主要通過干預多種氨基酸(脯氨酸、絡氨酸、絲氨酸、蘇氨酸、亮氨酸、異亮氨酸、丙氨酸、天門冬氨酸和谷氨酸)代謝、嘌呤代謝等基礎代謝途徑發揮預防作用,而“藿香和蒼術”除基礎代謝外,還通過參與炎癥相關生物過程(炎癥介質調控、AMPK通路、HIF-1通路等)發揮預防治療作用。本研究詳細講解了新冠肺炎預防方劑組方規律和核心高頻藥組,并闡釋了其作用機制,擬進一步通過其他方法對所得核心高頻藥組和關鍵通路進行驗證,為新冠肺炎的主動預防和治療提供參考。