劉 敏,張紀亮,張春暖,齊 茜,崔 偉,馮海洋 (河南科技大學動物科技學院,水環境與動物安全實驗室,河南 洛陽471023)
有機錫化合物廣泛應用多種工業用途.其中,三丁基錫(TBT)因其作為海洋船只的防污涂料添加劑被廣泛使用,造成全球水體環境的普遍污染[1].最近,在水體、海洋水產品和生活用品中均檢測到TBT[2-4].人類通過攝入海洋水產品暴露于TBT已被廣泛報道,一些污染嚴重地區居民每天人均攝入量可高達上百微克[5-8].通過對我國部分城市市售海產品中的污染物水平調查,顯示丁基錫污染普遍存在[9-10].研究得出我國居民 TBT攝入濃度范圍為 0.003~0.006μg/(kg?d)[11].另外,人類還可能通過接觸聚氯乙烯塑料制品等方式暴露于有機錫.在人體血液和肝臟中已經檢測出TBT存在[12-13].TBT對哺乳動物的毒性效應主要體現在免疫、神經、生殖和肝毒性外,并引起細胞發生凋亡、壞死或自噬[14-19].因此,目前TBT對人的暴露可能成為常態,環境水平TBT暴露對人類健康的威脅應引起重視.
近年來,在傳統毒理學的基礎上,預測毒理學不斷發展.大量毒理學數據庫開始出現,如比較毒理組學數據庫(CTD),京都基因和基因組百科全書(KEGG),注釋、可視化和集成發現數據庫(DAVID),化學物生物活性預測系統(PASS)等.這些數據庫提供的“大數據”是非常高效的分析工具,通過多種分析方法與工具的靈活應用,可以有效從大量數據中發現潛在的生物影響信息,為毒理學研究開辟新的方向.例如,通過結合KEGG和CTD,能夠預測黃酮類化合物和雌激素受體結合對生物影響[20];結合 Gene Ontology(GO)能夠對人類疾病的致病機制進行推測[21];結合 ToxCast預測毒性機制,能夠分析體內藥物誘發潛力[22];還可以應用CTD開發新的疾病和藥物相關性預測系統[23].我國預測毒理學研究尚處于起步階段,本研究通過應用預測毒理學數據庫,預測分析TBT暴露與人類相關疾病的關系,預測結果將為TBT毒理學進一步的研究指明方向,為TBT的環境政策決策提供依據.
1.1 數據來源
CTD(http://ctdbase.org)提供了從文獻手動策劃的化學-基因、基因-疾病和化學-疾病的關聯.本研究根據2017年7月CTD更新的數據[24]進行分析.更新后,核心CTD包括14672種化學物質、42761個基因和 6401個疾病的手動策劃相互作用(包括 1379105化學物-基因、202085化學物-疾病和33 583基因-疾病直接相互作用).CTD還可以通過手動策劃產生預測推論.例如,某化學物(A)與某基因(B)相互作用,如基因 B單獨與某疾病(C)相關,則化學物A被推斷與疾病C(通過基因B)有關聯.
1.2 CTD分析
CTD提供了一套基于網絡的分析工具(http://ctdbase.org/tools/).本研究中主要應用了 Set Analyzer(http://ctdbase.org/tools/analyzer.go),其可對化合物或基因集合進行富集分析,如疾病、通路以及基因間的相互作用.進入CTD的TBT界面后,應用Set Analyzer分析CTD手動策劃篩選出的與TBT具有相互作用的基因(共計 488個).另外,CTD 整合了來自BioGRID的基因-基因和蛋白質-蛋白質相互作用信息.將這488個基因(NCBI基因符號或IDs)輸入CTD的 Set Analyzer,即可快速得到這些基因間的相互作用網絡圖.CTD的超幾何分布計算和Bonferroni法多重檢測校正[25]可進行疾病富集性研究.系統默認顯著性校正P值為0.01.通過分析,生成與488個基因具有相互關系的疾病,共計492個.
1.3 基因功能和網絡分析
KEGG(http://www.kegg.jp/;http://www.genome.jp/kegg/),是一個包含了基因組、生物學途徑、疾病、藥物、化合物集合的數據庫.KEGG PATHWAY是該數據庫的核心資源,將許多實體(包括基因、蛋白質、RNAs、化合物、聚糖和化學反應)以及疾病基因和藥物靶標整合的途徑圖集合,作為個體條目存儲在KEGG的其他數據庫中[26].CTD整合了KEGG通路信息.為了進一步挖掘信息,利用注釋、可視化和集成發現數據庫(DAVID,https://david.ncifcrf.gov/)對TBT基因集進行功能富集分析[27-28],以基因符號作為輸入內容,可以觀察到TBT和疾病之間豐富的KEGG途徑的重疊.
1.4 PASS預測TBT生物活性
PASS是使用計算機輔助,通過化學結構來預測生物活性的工具.在 PASS中生物活性被定性描述為有活性和無活性.將TBT簡化分子式SMILES輸入系統,可得到活性概率(Pa)和無活性概率(Pi).通過Delta=Pa-Pi,可以預測TBT的生物活性[29].Delta值越大,表示相關的生物活性越高.
2.1 CTD分析與TBT相關的基因
在CTD中,通過手動策劃,共篩選出與TBT具有相互作用的基因488個.PPARG是出現頻次最高的基因(表1).PPARG主要負責脂類的分解代謝[30].研究證實TBT能夠通過PPARG誘導脂肪細胞分化,引起小鼠體內脂肪沉積[31].在作者的研究中也發現伴隨TBT誘導的魚類精巢脂質的蓄積,PPARG表達增加[32].

表1 應用CTD分析與TBT相互作用出現頻次最高的10個基因Table 1 10genes with the highest frequency of interactions with TBT in CTD analysis
圖1顯示了與TBT具有相互作用的488個基因之間相互作用網絡圖.圖中的每個圈代表一個基因,直線代表基因存在相互作用.圈越大,顏色越深,表明與其他基因的相互作用越強,越處于中心地位.可看出,基因TP53擁有相關聯基因最多,處于中心地位;其次是ESR1和FN1.TP53為著名的抑癌基因,可在多個腫瘤類型中發生突變[33];ESR1為雌激素受體alpha,對于雌性的生殖活動起重要作用[34];FN1基因可影響糖尿病并發癥中的 RET信號和 AGE-RAGE信號通路[35].因此這些基因表達的改變可能是 TBT誘導相關疾病中的關鍵事件.
2.2 CTD分析與TBT相關的疾病
如圖2所示,與488個基因具有直接相互作用關系的疾病為 492個.其中,癌癥的比例最高.這和 TBT與抑癌基因TP53相關性最高的結果一致.在前10類疾病中,基本都與已經報道的TBT能夠誘導免疫、神經、生殖毒性以及引起細胞發生凋亡、壞死或自噬的結果[14-19]一致.值得注意的是,代謝疾病在所有疾病中的比例為10.2%.然而,TBT與代謝疾病的關系卻很少引起關注.

圖1 應用CTD分析與TBT相關的基因間相互作用網絡Fig.1 Network map of genes interacted with TBT in CTD analysis

圖2 CTD分析與TBT可能相關的前10類疾病Fig.2 Top 10diseases induced by TBT in CTD analysis
2.3 CTD分析與TBT相關的KEGG通路
表2顯示了與TBT相關的前10個KEGG通路,可以發現基因注釋較多的途徑包括代謝、信號傳導、癌癥、免疫系統等.其中與免疫有關的通路3個(免疫系統、先天免疫系統、免疫系統驗證因子信號通路),與代謝有關的通路4個(代謝、脂質和脂蛋白代謝、代謝通路、蛋白代謝).TBT免疫毒性已經開展了較多的研究[36],而 TBT與代謝類疾病的關系研究還較少,更需要在以后的研究中關注.在作者的研究中[37],已經發現TBT可能通過誘導肝臟中與脂質轉運、脂質存儲、脂酶以及脂生成因子等基因的表達進而誘導肝臟脂肪變性.
2.4 DAVID對KEGG中代謝通路的基因注釋
結合前述結果,對TBT所影響的代謝途徑和代謝性疾病進行更加深入的分析和研究.應用 DAVID對KEGG PATHWAY數據庫中人類所有代謝的通路圖進行注釋.如圖3所示,發現基因注釋大多分布于糖的生物合成與代謝途徑區域,說明TBT可能干擾糖的合成與代謝.
2.5 PASS分析TBT生物活性
表3顯示,TBT可能具有多種與糖代謝相關的生物活性.如對糖磷酸酶的抑制作用將影響體內葡萄糖水平的穩態[38].糖代謝異常可引起人體多種疾病,其中以糖尿病最為常見[39].因此,可以推測 TBT暴露能夠干擾生物體糖類代謝過程,與人類糖類代謝性疾病有關,如糖尿病、胰島素抵抗等.

表3 PASS分析TBT影響糖代謝的生物活性Table 3 Biological activity of TBT on glucose metabolism predicated by PASS
3.1 在CTD中,共篩選出與TBT具有相互作用的基因488個;基因相互作用網絡圖顯示TP53處于中心地位,其次是ESR1和FN1.
3.2 CTD分析結果表明,與TBT相關疾病中癌癥比例最高;另外,代謝類疾病應引起關注,其在所有疾病中的比例高達10.2%.
3.3 KEGG通路和DAVID基因功能注釋分析,發現TBT不僅和代謝性疾病有較高的關聯性,其相互作用基因在糖代謝途徑上亦有較密集的基因功能注釋.
3.4 PASS的活性預測發現TBT可能影響多種與糖代謝相關的酶生物活性,提示TBT對糖代謝相關疾病的影響在今后研究中應引起注意.