楊 晨,顏 軍,何 鋼,任鳳英,梁 立,魯 蘭
(成都大學藥學院,藥食同源植物資源開發四川省高校重點實驗室,成都 610106)
不同學科間的交叉融合,多技術跨界交聯將不斷催生新學科、新技術和創新成果。在高校實驗課程開展過程中,多學科交叉融合不僅可以拓展學生知識面,更能激發學生自主學習意識,提高實驗中創新能力,更能推動學院間學科協同發展從而培養出復合型人才[1-6]。
生物信息學作為當今生命科學和自然科學重大前沿領域之一,是以計算機為工具對生物信息進行儲存、檢索和分析的科學。生物信息學作為一門實踐性很強的學科,需要從網絡信息中獲取大量實驗數據,因此對學生的計算機操作能力和數據分析能力顯得十分重要。通過生物信息學技術,可以去探索基因如何形成代謝通路控制復雜生命現象和行為[7-12]。儀器分析作為化學學科重要分支,是以物質理化性質為基礎建立的一種分析方法。氣相色譜質譜聯用技術(GC-MS)以其靈敏度高的優點,可檢測到大量低含量小分子物質。目前已成為微生物功能基因組代謝表型研究的常規分析技術。GC-MS在色譜分析重復性、分辨率和質譜裂解碎片重復性方面具有明顯優勢,因此可以選擇性地富集和檢測大量代謝物中痕量物質,表型代謝通路中參與各種反應的化學物質,使其在代謝組學基礎上更好地評估生命系統。
結合生物、藥學學科特點以及研究生科研項目需求,本實驗以生物信息學技術結合GC-MS對銅綠假單胞菌胞內代謝物進行定性分析,通過實驗設計使學生掌握氣質聯用儀工作原理,熟悉生物信息數據挖掘方法和化合物定性分析檢測技術。
本實驗面向生物專業、藥學專業本科生及一年級藥物分析學研究生開設。實驗內容設計要在學生掌握基本知識與技能基礎上,提高學生在實驗過程中的主動性,挖掘實驗分析結果的創造性。實驗內容不僅包含數據挖掘分析,還涉及儀器分析中氣相色譜質譜聯用法的應用,因而實驗課程分為生物信息學數據挖掘及代謝產物定性鑒別兩部分構成。本實驗以大型精密儀器為教學平臺,結合微生物樣本和學科前沿內容而開設,有利于充分建立不同學科專業知識間聯系,體現學科之間交叉性,提高學生實踐能力。
基因表達的綜合性(Gene Expression Omnibus,GEO)數據庫是生物信息學發現的重要基礎,它接收和管理各研究機構提交的基因芯片或測序技術獲得的不同生理、病理狀態等基因表達數據。實驗選取GSE65882 數據芯片和GPL84(Affymetrix Pseudomonas aeruginosa Array)平臺,利用GEO2R 在線分析工具比較芯片中兩組樣品,以鑒定在整個實驗條件下差異表達基因[13]。獲得的大量差異表達基因通過KEGG(Kyoto Encyclopedia of Genes and Genomes,京都基因與基因組百科全書)數據庫,利用富集分析篩選與研究相關信號通路,為后續生物學實驗提供思路。
GC-MS主要由氣相色譜-接口-質譜儀組成。樣品經進樣口高溫霧化后進入毛細管色譜柱,利用不同組分在兩相間吸附能力、分配系數等不同性質使不同組分得到分離。分離后各組分通過毛細管柱直接連接法進入質譜儀。質譜儀主要由離子源、質量分析器和檢測器3 部分構成。電子轟擊電離源(EI)作為應用最廣泛的一種離子源,其電離效率高、能量分散小、結構簡單、操作方便;得到的特征性質譜圖對化合物結構鑒別和解析十分有利。質量分析器將電離室中離子按質荷比(m/z)大小分開進入檢測器,最后在檢測器將離子束轉變成放大后的電信號。計算機將采集到的每個質譜的所有離子相加得到總離子強度,其隨時間變化形成的曲線作為總離子流色譜圖(TIC),從而推斷每個色譜峰分子結構相關信息。
由于GC-MS適用于分離分析具有揮發性物質,對揮發性低、熱穩定性差的物質不能直接進樣分析,因而常對樣品進行衍生化反應,取代分子中的活潑氫來降低化合物極性。硅烷化反應在GC分析中常用來對樣品進行前處理,化合物中羥基或氨基上活潑氫與硅烷化試劑中的烷基硅烷基發生交換,形成烷基硅烷基產物。常用的硅烷化類型有三甲基硅烷化(-TMS)和叔丁基二甲基硅烷化(-TBDMS)。烷基硅烷基產物其極性減弱,被測能力增強,熱穩定性提高而有利于GCMS對其分離分析。各產物經國家標準技術研究所(NIST)數據庫進行鑒定后,通過KEGG數據庫驗證差異表達基因信號通路富集分析結果。
(1)實驗儀器。Clarus SQ8 氣相色譜-質譜聯用儀(美國珀金埃爾默公司)、AS5150A 超聲儀(天津奧特賽恩斯儀器有限公司)、TGL-16B 離心機(上海安亭科學儀器廠)、XS205 精密電子天平(瑞士梅特勒-托利多公司)。
(2)實驗材料。鹽酸、吡啶、N,O-雙三甲硅基乙酰胺(BSA)均由成都市科隆化學品有限公司提供、色譜乙腈(美國Fisher公司);銅綠假單胞菌凍干菌絲體(由成都大學藥學院臨床藥學實驗室提供)。
(1)差異表達基因的篩選。采用GEO2R 在線分析工具(https:/ /www.ncbi.nlm.nih.gov/geo/geo2r/)對GSE65882 數據芯片進行分析。4 個對照組樣本(GSM1608059、GSM1608060、GSM1608061、GSM1608062)和6 個樣品組樣本(GSM1608067、GSM1608068、GSM1608069、GSM1608070、GSM1608071、GSM1608072)篩選銅綠假單胞菌差異表達基因,其中P<0.05,>1 的基因為差異表達基因。
(2)差異表達基因KEGG通路分析。將差異表達基因導入DAVID(the Database for Annotation,Visualization and Integrated Discovery)數據庫(http:/ /david.ncifcrf.gov/)中進行KEGG 通路分析,以P<0.05作為標準篩選得到銅綠假單胞菌KEGG關鍵信號通路[14]。
(3)樣品的準備。精確稱取菌絲體樣品2 mg,加入100 μL 0.1% HCl-乙腈溶液。超聲處理10 min后,加入100 μL BSA 和100 μL 吡啶。60 ℃反應30 min后離心,將上清液轉移至進樣小瓶中進行GC-MS分析。
(4)GC-MS 色譜條件。氣相色譜采用PerkinElmer clarus680 系統,色譜柱為PerkinElmer Elite-5 ms毛細管柱(30 m×0.25 mm,0.25 μm);柱溫箱初始溫度設置為50 ℃,保持5 min 后以10 °C/min速度升溫至180 ℃,隨后以15 °C/min速度升溫至300℃,保持5 min。進樣口溫度為200 ℃;不分流進樣,進樣體積1 μL;載氣為高純氦氣,流速為1.5 mL/min。質譜采用PerkinElmer Clarus SQ8 MS 質譜儀,離子源為電子轟擊離子源(EI)200 ℃,離子化能量70 eV;傳輸線溫度220 ℃;掃描方式為全掃描;掃描范圍50~500 amu。
GSE65882 芯片利用GEO2R 工具共篩選出3 138個差異表達基因,其中2 199 個為上調基因,939 個為下調基因。3 138 個差異表達基因中篩選出含有標準基因名基因1 020 個,經KEGG富集分析,以P<0.05為篩選條件,共得到13 個關鍵信號通路:代謝途徑(Pae01100)、抗生素生物合成(Pae01130)、次級代謝產物生物合成(Pae01110)、氨基酸生物合成(Pae01230)、氧化磷酸化(Pae00190)、不同環境中微生物代謝(Pae01120)、碳代謝(Pae01200)、糖酵解/糖異生(Pae00010)、氮代謝(Pae00910)、嘧啶代謝(Pae00240)、檸檬酸循環(TCA 循環)(Pae00020)、甘氨酸、絲氨酸和蘇氨酸代謝(Pae00260)、氨基糖和核苷酸糖代謝(Pae00520),結果見圖1。

圖1 差異表達基因及其KEGG通路分析結果
采用GC-MS對樣品中成分進行分析鑒定。通過NIST17 質譜數據庫對各色譜峰進行鑒定。分離鑒定出的9 種氨基酸類化合物見圖2 和表1。以橫坐標為質荷比m/z,縱坐標為相對豐度,得到丙氨酸硅烷化反應后特征離子峰m/z=73,116,147,190;纈氨酸硅烷化反應后特征離子峰m/z=73,144,218;異亮氨酸硅烷化反應后特征離子峰m/z=73,158,218,232;甘氨酸硅烷化反應后特征離子峰m/z=73,147,174,248,276;絲氨酸硅烷化反應后特征離子峰m/z=73,147,204,218,278;焦谷氨酸硅烷化反應后特征離子峰m/z=73,147,156,230,258;苯丙氨酸硅烷化反應后特征離子峰m/z=73,192,218;鳥氨酸硅烷化反應后特征離子峰m/z=73,142,174;賴氨酸硅烷化反應后特征離子峰m/z=73,128,156,174,230,317。以質譜峰的特征離子碎片作為定性依據,對樣品進行定性分析,并讓學生發現m/z=73 或147 為三甲基硅烷基碎片特征峰,引導學生使用NIST17 數據庫對未知化合物進行鑒定。

表1 鑒定出的9 種氨基酸類化合物

圖2 9種氨基酸GC-MS總離子流色譜圖與質譜圖
通過鑒定出的9 種氨基酸類化合物,導入MBROLE2.0 數據庫,以pseudomonas aeruginosa PAO1為生物背景進行KEGG 富集分析[15-16]。結果可得9種氨基酸都參與了代謝途徑(Pae01100)過程。甘氨酸和絲氨酸同時參與了甘氨酸、絲氨酸和蘇氨酸(Pae00260)代謝過程。通過GC-MS 對各化學成分的定性鑒別,學生能將定性實驗結果與生物信息學分析推論得到信號通路結合在一起,驗證KEGG 信號通路富集結果的可靠性。同時,樣品中其他未鑒定成分的定性分析,能激發學生對實驗探索的興趣。
本實驗課程是在微生物實驗和儀器分析實驗課程基礎上而開設,由于本實驗課程難點在于實驗內容多,學科知識交叉廣,并且大部分本科生以及一年級研究生對儀器設備接觸較少,因此很難在短時間內理解并掌握儀器原理及操作,又能把實驗結果與生物信息學分析結果緊密聯系在一起。因此,本實驗教學以“提出問題-解決問題-存在問題”為思路,利用思維導圖構筑課堂筆記及實驗記錄,鼓勵學生以實驗小組為單位在有效時間內將課堂中原理內容和實驗過程整體體現在思維導圖中(見圖3)。

圖3 生物信息學與GC-MS實驗原理思維導圖
本實驗教學過程中教師對生物信息學及GC-MS概念和原理進行講解后,提出如何建立兩者之間密切聯系,如何將生物信息分析結果與儀器檢測數據有機整合等問題。將以上問題帶入實驗過程中,利用GCMS采集得到9 種氨基酸類代謝產物與GSE65882 芯片差異表達基因富集的信號通路建立關聯性,驗證生物信息分析結果。同時,引導學生對其他未知代謝產物進行定性鑒定,利用代謝產物表征差異性探索與代謝相關的其他重要信號通路。實驗完成后學生撰寫實驗報告,分析實驗過程中存在問題,總結實驗得失,對生物信息學及儀器分析知識要點進行歸納與總結,形成學科交叉關聯網絡圖,并且在實驗報告中,通過數據分析處理結果,建立學科之間關聯性,對交叉學科實驗心得體會進行探討。
在以前的學科實驗教學中,學生實驗內容較單一且僅局限與本學科知識的掌握,因此實驗教學相對簡單,內容單調,結果單薄,實驗結果應用分析不強。交叉學科實驗具有創新性、綜合性、多樣性等特點,能夠培養出高層次、高素質復合型人才,因此在各大高校大力推進交叉學科人才培養。本實驗教學正是基于生物信息學技術與氣質聯用技術,對銅綠假單胞菌胞內代謝物進行定性分析,通過GEO數據庫篩選目標芯片獲得差異表達基因,利用代謝物分析結果驗證差異表達基因富集信號通路。本實驗具有知識點多綜合性強的特點,不僅能全面提升學生實驗操作能力、豐富實驗技能、擴充知識領域、提高科研能力,還能用于學生畢業實驗設計,不但可以順利完成畢業實驗,而且讓學生更多參與大型實驗設計進行探索性及創新性實驗,從而培養出符合社會需要的高素質復合型人才。