袁龍飛,李亞輝,楊欣,張文潔,劉彤玲,楊敏,楊美紅
(貴州中醫(yī)藥大學,貴州 貴陽 550025)
隨著人們生活水平不斷提高,全球糖尿病發(fā)病率不斷升高,其微血管并發(fā)癥的患者人數(shù)也逐年增加[1]。糖尿病由于機體糖代謝、蛋白質代謝、脂代謝出現(xiàn)紊亂,導致一系列的并發(fā)癥,如心血管系統(tǒng)、內分泌系統(tǒng)、神經(jīng)系統(tǒng)等[2]。其中2 型糖尿病占總數(shù)的90%以上,中年人以上為高發(fā)人群[3]。典型癥狀為多飲、多食、多尿以及體質量下降,誘發(fā)2 型糖尿病主要原因包括遺傳、環(huán)境和飲食習慣等,2 型糖尿病表現(xiàn)為長期代謝紊亂引起全身器官出現(xiàn)功能衰竭和障礙,嚴重者可引發(fā)內環(huán)境紊亂等[4]。臨床治療方式在于改善患者血脂新陳代謝水平,減輕胰島素抵抗,從而達到增強患者身體素質的效果[5]。
分子對接技術目前已被廣泛應用于單味藥、中藥復方及新藥研發(fā)工作中,用于預測設計的類似物與特定受體的相互作用,在中藥藥效物質、探索中藥的作用機制等方面得到了廣泛應用,且取得了一定的進展[6]。因此,本研究基于分子對接技術,探索白術小分子配體與2 型糖尿病核心靶點結合位點的親和力,篩選出關鍵核心靶點及化學成分,為2 型糖尿病小分子抑制劑的開發(fā)提供理論依據(jù)。
本研究選擇的數(shù)據(jù)庫和軟件如下:Cytoscape 3.5.1(http://www.cytoscape.org);STRING(https://string-db.org/);R(https://www.r-project.org);GEO(http://www.ncbi.nlm.nih.gov/geo)。
Gene Expression Omnibus(GEO)是一個公共存儲庫,基于GEO 數(shù)據(jù)庫檢索“type-2 Diabetes mellitus”樣本。可獲得2型糖尿病的芯片數(shù)據(jù)。納入標準:樣本應包含2型糖尿病患者(6例)和非糖尿病患者(7例)的表達數(shù)據(jù),樣本為人組織來源且芯片數(shù)據(jù)類型為基因表達譜[7]。
使用R 語言(https://www.r-project.org)進行系統(tǒng)分析,對2型糖尿病基因芯片原始數(shù)據(jù)的探針進行注釋和過濾后,基于R語言對原始芯片數(shù)據(jù)進行分析,2型糖尿病患者和非糖尿病患者差異基因識別采用Limma程序包分析。2型糖尿病差異基因篩選條件為:表達量差異在2倍以上或者0.5倍以下,且以P<0.05為閾值[8]。
關鍵基因(Hub gene)是在生物學過程中發(fā)揮至關重要作用的基因,在相關通路中,其他基因的調控往往受到該基因的影響。可以通過共表達或蛋白相互作用構建互作網(wǎng)絡,然后根據(jù)網(wǎng)絡拓撲結構篩選關鍵基因。準備好本次實驗的網(wǎng)絡文件,STRING(https://string-db.org/)是在線分析蛋白相互作用的數(shù)據(jù)庫,基于Cytoscape3.5.1 中的Cytohubba 模塊[9],網(wǎng)絡界面會展示這些Hub 節(jié)點在網(wǎng)絡中的連接情況,節(jié)點顏色越深代表分值越高。本研究基于最大鄰居組件(maximum neighborhood component,MNC),最大團中心性(maximal clique centrality,MCC),節(jié)點連接度(degree),邊緣滲出組件(Edge Percolated Component,EPC),應力(stress)5 種算法輸出前核心靶點,通過韋恩圖輸出交集靶點。
白術化合物基于TCMSP 下載化學結構,采用SYBYL 對小分子進行Minimize 能量最小化優(yōu)化,獲得合理構象。采用藥物分子設計模擬SYBYL 2.1.1 軟件的Surflex-Dock 模塊完成分子對接研究[10],基于形狀相似性和結構相似性進行能量匹配。初始篩選采用標準模式進行對接,修飾后的小分子與靶標蛋白進行半柔性對接。基于Ligand 模式產(chǎn)生活性口袋,優(yōu)化完畢后保存為SFXC 文件作為對接文件,其他參數(shù)均采用SYBYL默認值[11]。
通過GEO 數(shù)據(jù)庫查詢2 型糖尿病相關研究并篩選抽提樣本,選擇編號為GSE25724 的基因表達譜數(shù)據(jù),包含13 張芯片,其中2 型糖尿病樣本6 例,正常樣本7 例。差異表達基因篩選借助R 中的limma 包進行分析,GSE25724 差異基因個638 個,2 型糖尿病前40 個靶點見表1。本文利用R 軟件中的packages(pheatmap)對差異表達基因進行層次聚類分析,輸出前40 個差異表達基因熱圖,綠色代表基因表達水平下降,紅色代表基因表達水平上升,見圖1。

圖1 差異表達基因層次聚類分析

表1 2型糖尿病前40個靶點
40 個差異基因的GO 富集分析結果見表2,發(fā)現(xiàn)40 個靶點參與的生物過程中主要富集于神經(jīng)發(fā)現(xiàn)、細胞分化等過程(P<0.01);基因主要定位于分泌顆粒腔、囊泡腔等(P<0.01);分子功能主要有細胞因子活性、氧化還原酶活性和受體配體活性等(P<0.01)。

表2 GO富集分析
基于Cytohubba 模塊獲得3 個靶點為前蛋白轉化酶枯草溶菌素1(neuroendocrine convertase 1,PCSK1),胰島淀粉樣多肽(islet amyloid polypeptide,IAPP),骨硬化病相關跨膜蛋 白1(osteopetrosisassociated transmembrane protein 1,OSTM1)。蛋白的三維結構基于PDB 數(shù)據(jù)庫下載,用于分子對接分析,見表3。

表3 關鍵靶點分析
Hub 分析發(fā)現(xiàn)PCSK1、MAFB、OSTM1 為核心靶點,基于SYBYL 分析白術與關鍵靶點匹配程度,見表4,Surflex-Dock 的分子對接可靠性和準確性高,每個化合物與靶標蛋白對接后的結果以total score>5 為閾值,白術55 個化學成分,其中21 個化學成分與PCSK1 有較好的結合(total score>5),2 個化學成分與PCSK1 有強烈的結合(total score>7);33 個化學成分與IAPP 有較好的結合(total score>5),5 個化學成分與IAPP 有強烈的結合(total score>7);21 個化學成分與OSTM1有較好的結合(total score>5),4個化學成分與OSTM1有強烈的結合(total score>7)。通過交集分析發(fā)現(xiàn)白術12 個化學成分均能與PCSK1、IAPP 和OSTM1有較好的結合。

表4 化學成分與關鍵蛋白分子對接
白術為臨床常用中藥,具有補脾健胃、燥濕利水、止汗和安胎等功效,化學成分復雜。白術的有效成分為揮發(fā)油、白術內酯類成分、多糖、多炔類化合物、氨基酸和倍半萜類化合物等[12-13],絕大多數(shù)為單萜或倍半萜類成分,具有改善糖代謝,改善胃腸道功能和調節(jié)腸道菌群等多重藥理作用,對免疫力低下、糖尿病、類風濕關節(jié)炎等疾病具有潛在的治療作用[14-16]。通過分子對接分析發(fā)現(xiàn)白術12 個化學成分均能與前蛋白轉化酶枯草溶菌素1(neuroendocrine convertase 1,PCSK1),胰島淀粉樣多肽(islet amyloid polypeptide,IAPP),骨硬化病相關跨膜蛋白1(osteopetrosisassociated transmembrane protein 1,OSTM1)有較好的結合。PCSK9是前蛋白轉化酶家族的第9個成員,在肝臟、腎臟等臟器組織中表達,且存在血液中,已經(jīng)研究表明PCSK9 在胰島素抵抗、糖代謝、膽固醇代謝、心肌梗死中發(fā)揮重要作用,參與了糖尿病、膽固醇、肥胖等疾病的發(fā)生和發(fā)展[17-19]。研究者也致力于開發(fā)PCSK9 抑制劑;OSTM1是一種與骨硬化癥相關的蛋白,輔助氯離子通道發(fā)揮其生理作用;已經(jīng)有研究表明人類胰島淀粉樣多肽(hIAPP)是引起β細胞凋亡的重要原因[19-21]。白術與PCSK1、IAPP 和OSTM1 有較好的結合,能否篩選出小分子抑制劑,有待于進一步體內分析。