席曉萌,姜云鴿,王煜丹,黃相中,田 凱
(1.云南民族大學 理論與計算化學實驗室,云南 昆明 650500;2.云南民族大學 民族藥資源化學國家民族事務委員會-教育部重點實驗室,云南 昆明 650500)
糖尿病是一種以糖代謝紊亂為主要表現的疾病,以慢性高血糖為主要特征.糖尿病發病原因有很多,但是主要原因多涉及環境、遺傳以及生活方式等[1].自從 2 000 年糖尿病地圖集面世至今,該疾病的發病率呈現出日益高發的態勢,給全球造成了巨大的公共衛生壓力.在眾多的慢性疾病中,其對人類的危害,僅次于心血管疾病和癌癥[2-4].一旦患上這種疾病,機體內的多種物質,比如水、脂肪、蛋白質等,其代謝都將出現異常,胰島素合成減少,血糖升高,長此以往,眼、腎、神經等多臟器的功能水平都將受到影響而降低.糖尿病會導致人的食欲增強,飲水量增加,小便增多,體重不斷降低,即所謂的“三多一少”[5-8].糖尿病包括多種類型,從致病根源上來看包括了1型、2型糖尿病,以及妊娠期糖尿病和特殊類型糖尿病,相比之下,1型和2型患者占比更高,尤其是2型,超過 90%的患者都屬于2型,并且發病年齡日趨年輕化[6, 9-10].糖尿病患者一經發病,往往很難治愈,只能終生服用各類降糖類藥物.傳統降糖藥毒性較大,長期服用往往給患者身體造成嚴重的傷害,因此研制新型的、高效的、低毒的抗糖尿病藥物是目前的主流研究.
網絡藥理學的概念是由來自英國的Hopkins教授于2007年率先提出的[11],其主要借助系統生物學、網絡生物學、化學生物學和計算機技術等先進手段,通過藥物對集體的干預實現對疾病詳細而準確的判斷和解釋,然后在利用網絡拓撲構建模型,以此對不同節點的相關性與作用機理實施分析[12-13].網絡藥理學是近些年新興的一種基于系統生物學的理論,它首先對生物系統進行網絡分析,以特定信號節點(Nodes)為基準,最終設計并研究多靶點藥物分子的一門新學科.網絡藥理學表示,要從多個途徑上對信號通路進行調節,確保藥物的最佳療效,減小毒副作用,提高新藥在臨床上的成功率,節約研發費用.所以,從某種意義上講,它是從全新的角度去認識藥物和機體的相互作用關系,以及闡釋疾病與藥物關聯的計算方法.
黃酮泛指通過一個三碳原子實現2個酚羥基的苯環(A環,B環)的聯結,由此所形成的若干種化合物,其基本母核為2-苯基色原酮.黃酮類化合物結構中常連接有酚羥基、甲氧基、甲基、異戊烯基等官能團.此外,它還常與糖結合成苷[14].黃酮類化合物廣泛存在于天然的植物和中草藥中,正是依賴于這些中草藥,使黃酮類化合物的獲取變得相對容易,給研究開展提供了便利(常見黃酮類化合物結構式見表1).
研究表明,黃酮類化合物的生理活性與藥理活性都相對較多,在抗炎癥、抗氧化、抗糖尿病并發癥以及抗癌癥等方面都能夠產生一定的療效[15-17].黃酮類化合物擁有毒性低的特點,在一些食物或者化妝品中都有添加.近幾年來,有學者發現葛根異黃酮類化合物具有降血糖、降血脂及擴張冠狀血管的作用[18];梅桂雪等[19]研究發現,黃酮類化合物可以通過抑制 Maillard 反應、增強機體對葡萄糖的攝取、促進胰島素的分泌、作用于血管緊張素等,發揮防治糖尿病的作用;葛根素可以使鏈脲佐菌素(STZ)誘導的糖尿病小鼠的血糖明顯降低,促進胰腺胰島素受體底物以及生長因子的蛋白水平上升,進而促進胰島素分泌能力的提升[18].Cheng等[20]對水飛薊的藥用機理進行分析,指出其能夠使沉默信息調節因子表達能力下降,使胰腺β細胞的自我吞噬受到抑制,從而使血糖水平趨于正常,同時它還能對機體胰島淀粉樣多肽的毒性低聚反應形成抑制,避免其出現纖維化,進一步增強胰島β細胞活力,減輕糖尿病的癥狀.

表1 常見的黃酮類化合物結構式
論文中所用到的6個黃酮均來自云南民族大學民族藥資源化學國家民族事務委員會-教育部重點實驗室在辣木、半育耳蕨、野番豆等藥材中分離獲得的黃酮類化合物.將上述化合物分別用ChemBioDraw Ultra 14.0軟件畫出,保存為sdf格式文件.
聯網打開Swiss ADME(http://www.swissadme.ch/)數據庫,將這6個黃酮類化合物的分子結構依次導入其中,檢測其藥代動力學參數.通過查閱文獻,選擇 GI absorption為High,P-gp substrate為Yes,再選一個參數為Yes作為篩選這些小分子的方法,即“1High,2Yes”[21].通過初步篩選,發現這6個黃酮類化合物均符合藥代動力學參數規則,因此將其分別命名為HT-1-HT-6.具體的結構信息見表2.將上述經過初步篩選的6個化合物依次導入Swiss Target Prediction(http://www.swisstargetprediction.ch/)數據庫中,分別獲取它們所對應的靶基因.將化合物靶點數據保存為Excel表格形式.

表2 6個黃酮類化合物的分子結構信息表
聯網打開GeneCards(https://www.genecards.org/)數據庫,以“Type 2 Diabetes Mellitus”為關鍵詞預測2型糖尿病相關靶點,隨后將2型糖尿病靶點數據保存為Excel表格形式.
將上述獲得的6個小分子Excel表格中“Common name”一列單獨粘貼至一個全新的Excel表格中,以“Probability”這一欄大于零作為篩選標準,如果存在可能性為0的數據,需要將此數據的Common name刪去,最后剔除重復的數據;
將下載好的2型糖尿病靶點信息Excel表格中“Gene Symbol”單獨粘貼至一個全新的Excel表格中,剔除重復的數據;

圖1 6個黃酮類化合物與2型糖尿病交集靶點韋恩圖
聯網打開Draw Venn Diagram(http://bioinformatics.psb.ugent.be/webtools/Venn/)數據庫,將篩選后的黃酮類化合物和2型糖尿病的靶基因導入其中,即可得到這6個黃酮類化合物與2型糖尿病的交集靶點,共收集到201個交集靶點,如圖1所示.
聯網打開String(https://string-db.org/)數據庫,將上述獲得的201個交集基因導入其中,選擇高置信度(highest confidence0.900)解析,可以得到原始的PPI網絡圖,如圖2所示.將原始PPI網絡文件導入Cytoscape 3.8.0軟件中,選取網絡節點度(Degree,Deg)、接近中心性(Closeness Centrality,CC)和介數中心性(Betweenness Centrality,BC)等指標作為量化節點,Degree、CC和BC值越大,說明該節點在網絡中越重要[22].從中選取大于Degree、CC和BC三者值的中位數的化學成分和靶點分別作為關鍵化學成分和核心靶點,即為黃酮類化合物治療2型糖尿病的關鍵化學成分和核心靶點.以這些核心靶點和關鍵化學成分為基礎,做出蛋白-蛋白相互作用網絡圖(PPI)與成分-疾病-靶點網絡圖.
R語言是一款強大生物信息學數據處理的半編程軟件,主要用于統計分析、繪圖、數據挖掘.它可以靈活調用后臺開發的集成包,支持擴展包的安裝及更新[23].本論文采用R語言clusterProfiler[24]包進行富集分析.
將交集基因導入至symbol2id文件夾中Drug_Disease.txt文檔中,聯網打開R語言程序,R x64 3.6.3,調用org.Hs.eg.db指令將交集基因的Symbol轉化為Entrez IDs,進一步調用clusterProfiler包對靶點基因進行GO生物富集分析和KEGG通路分析.物種設置為人,P<0.05作為富集篩選的標準,取排名前20的數據,利用Rstudio中的ggplot2包進行繪圖.
通過篩選整理,6個天然黃酮類化合物共獲得600個靶點基因,剔除重復數據,一共獲得235個靶點基因;通過GeneCards數據庫篩選整理,共獲得了 10 735 條關于2型糖尿病相關的靶點.
將原始的PPI網絡文件通過Cytoscape3.8.0軟件基于Degree、combined score值等參數的構建,即可得到黃酮化合物-2型糖尿病相關的PPI網絡,如圖3所示.網絡中共有201個節點和514條邊,網絡平均自由度為5.11.

圖2 蛋白-蛋白相互作用網絡關系原始圖 圖3 黃酮化合物-2型糖尿病PPI網絡圖
該圖中,根據Degree值設置圖形的大小及顏色的深淺,Degree值越大,圖形越大,顏色也越深,說明與蛋白聯系越密切;Combine score值越高,邊就越粗,說明與蛋白相互作用的越好.
從圖中可以看到顏色較深的幾個蛋白,例如:PIK3CA、PIK3R1、MAPK3等均屬于網絡中前20的節點,在整個網絡圖中十分重要.
將6個黃酮類化合物共計235個靶點基因與2型糖尿病的 10 735 個靶點基因取交集之后,得到201個交集靶點基因.利用Cytoscape3.8.0軟件構建化學成分-疾病-靶點網絡圖如圖4所示(黃色菱形結構代表藥物成分;綠色倒三角形結構代表靶點;藍色六邊形結構代表疾病).網絡中一共有241個節點(其中6個節點屬于黃酮類化合物,235個節點屬于靶點);度值較高的化合物有HT-2、HT-3、HT-6等.上述提及的黃酮化合物對醫治2型糖尿病可能具有一定功效.

圖4 成分-疾病-靶點網絡圖
利用R語言程序的org.Hs.eg.db包和clusterProfiler包對201個交集基因進行GO功能富集和KEGG通路富集分析,201個交集基因共影響了146個生物功能(P<0.05,FDR<0.05),選取排名前20位靶基因功能信息,詳見圖5(柱狀圖中柱形區域越長,表明該生物功能富集的基因越多;顏色越紅,表示P值越小,結果越顯著)、表3.

圖5 GO功能富集柱狀圖(排名前20名)

表3 GO功能富集分析表(排名前20名)

續表3
由表2可知,本論文中所使用的黃酮化合物主要富集在蛋白絲氨酸/蘇氨酸激酶活性、蛋白酪氨酸激酶活性、碳酸鹽脫水酶活性、跨膜受體蛋白酪氨酸激酶活性、蛋白絲氨酸/蘇氨酸/酪氨酸激酶活性、跨膜受體蛋白激酶活性、非膜跨越蛋白酪氨酸激酶活性、磷酸酶結合、羧酸酯水解酶活性、蛋白磷酸酶結合、組蛋白激酶活性、胰島素受體底物結、SH2結構域結合、碳氧裂解酶活性、水解裂合酶活性、裂合酶活性、鈣依賴性磷脂酶A2活性、核受體活性、轉錄因子活性,直接配體調節的序列特異性DNA結合和磷脂酰肌醇3-激酶結合,這充分表明本論文選取的黃酮類化合物是通過多種生物學途徑發揮治療2型糖尿病的作用.
通路富集分析發現,201個交集基因顯著富集在了159條通路上(P<0.05,FDR<0.05),選取排名前20位靶基因功能信息,詳見圖6(柱狀圖中柱形區域越長,表明該通路富集的基因越多;顏色越紅,表示P值越小,結果越顯著)、表4.

圖6 KEGG通路富集柱狀圖(排名前20名)

表4 KEGG通路富集分析表(排名前20名)
由表3可知,KEGG通路富集中,與腫瘤相關的有14條,分別是:前列腺癌、Ras信號通路、胰腺癌、急性髓樣白血病、非小細胞肺癌、癌癥中的蛋白聚糖、VEGF信號通路、神經膠質瘤、磷脂酶D信號通路、ErbB信號通路、HIF-1信號通路、癌癥的中樞碳代謝、黑素瘤、結直腸癌;與2型糖尿病有關的通路有3條,分別是:PI3K-Akt信號通路、EGFR酪氨酸激酶抑制劑耐藥性、內分泌抵抗;與炎癥相關的通路有2條,分別是:花生四烯酸代謝、神經營養蛋白信號通路;以及其它1條信號通路:脂質與動脈粥樣硬化.圖7是與2型糖尿病關系最為密切的PI3K-AKT信號通路完整示意圖.

圖7 PI3K-AKT信號通路圖
文中應用網絡藥理學的方法探究了實驗室分離得到的黃酮類化合物與2型糖尿病相互作用的機制.通過相關數據庫的篩選與預測,獲得了化合物與疾病的靶基因,進一步得到了兩者的交集基因;通過Cytoscape軟件構建了蛋白-蛋白相互作用網絡圖(PPI)與成分-疾病-靶點網絡圖;通過R語言半編程程序對交集基因進行生物功能富集與通路富集分析,發現這些黃酮類化合物是通過多種生物學途徑及影響多條信號通路來發揮治療2型糖尿病的作用,明確了黃酮化合物在基因水平上作用于2型糖尿病的機制.相關的較為重要的信號通路有PI3K-Akt信號通路、EGFR酪氨酸激酶抑制劑耐藥性,接下來就以上述通路具體展開說明其作用機制.
磷脂酰肌醇3-激酶-蛋白激酶B(phosphatidylinositol 3-kinase and protein kinase B,PI3K-AKT)信號通路是一條十分重要的通路,該通路不但可以調節機體的胰島素信號傳導,而且是胰島素下游的信息通路,有效參與機體內一些生物學途徑,例如:細胞生長、增殖、分化、凋亡及葡萄糖轉化等.如果PI3K-AKT信號通路出現異常,那么人體中的胰島素合成及釋放信號就會受到影響,從而導致胰島素不能正常唯機體所使用,進一步誘發機體罹患2型糖尿病[25].人體內有很多重要的信號蛋白,胰島素受體底物-2(IRS-2)是其中一種,該蛋白可使胰島β細胞保持良好的生物學活性,能促進胰島β細胞的新生與復制,關系到胰島β細胞的存活與凋亡.當胰島素與相關受體特異性結合后,會使得IRS-2酪氨酸位點磷酸化,進而與PI3K的P85調節亞基發生結合,這樣一來下游的PI3K分子將被活化,產生磷脂酰肌醇二磷酸和磷脂酰肌醇三磷酸;與此同時,活化后的 PI3K 分子可以充當第二信使的身份,誘導產生AKT 活化效應.活化后的 AKT 可導致FoxO1磷酸化失活,FoxO1是胰島β細胞團的關鍵調控因子,其一旦失活,機體內的G6P基因和PEPCK表達就會受到影響,糖異生途徑受到抑制,血糖因此而降低[26-27].
多數研究表明,糖尿病和肺癌發病率增高有關[28].表皮生長因子受體(epidermal growth factorreceptor,EGFR) 的靶向治療是非小細胞肺癌(NSCLC)的主要治療手段之一,目前臨床上最常用的非小細胞肺癌靶向治療藥物之一就是EGFR酪氨酸激酶抑制劑,其中比較有代表性的藥物有第1代的厄洛替尼,第2代的阿法替尼,第3代的奧西替尼等.通過查閱相關文獻和報道,發現厄洛替尼可以降低血糖,并且能逆轉胰島素抵抗.Costa 等[29]報道了1例72歲的NSCLC老年女性患者,確診肺癌時已有兩年糖尿病病史,在服用了厄洛替尼后并進行醫學檢測,發現該患者的血糖和糖化血紅蛋白(ALC)指數明顯降低;此外,針對EGFR酪氨酸激酶抑制劑耐藥性,也有學者做了相關研究:眾所周知,二甲雙胍是一類降糖療效出色的藥物,一些研究學者認為二甲雙胍可逆轉肺癌細胞對EGFR酪氨酸激酶抑制劑的耐藥性.楊翠等[30]研究認為二甲雙胍能夠逆轉肺腺癌耐厄洛替尼細胞A549ER耐藥性.另外,上文中提到的PI3K-AKT 通路是 EGFR的主要下游靶點.
綜上所述,本研究中通過網絡藥理學的方法構建了黃酮類化合物治療2型糖尿病的成分-疾病-靶點網絡圖及PPI圖,明確了6個黃酮類化合物通過多靶點、多通路治療2型糖尿病的作用機制.