屈紅林,劉瑞蓮,陳嘉勤,陳 銳
高通量測序即二代測序,該技術可一次性對一個物種的轉錄組和基因組幾十萬到幾百萬條DNA 分子進行序列測定,已經成為當前科學研究的重要手段[1]。目前使用最廣、效果最好的是二代測序方法,即高通量測序技術。二代測序技術以極低的單堿基測序成本、超高的數據產出量,避免繁瑣的克隆技術,具有較高的可靠性和準確性等特點[2]。二代測序技術在全基因重測序、表達譜分析、轉錄組測序、SNP 分析、DNA甲基化、mi-croRNA、MBD、Seq、ChIP-Seq等研究領域應用廣泛。通過對比CUMS 抑郁造模小鼠與有氧運動干預抑郁小鼠血液和海馬組織進行高通量測序,分析2 種組織中差異表達基因的異同,為臨床血液檢測提供借鑒。
實驗選用健康雄性 C57BL/6 小鼠 42 只,8 周齡,SPF 級,由湖南斯萊克景達實驗動物有限公司提供(SCXK湘2016-0002)。標準B 級齒啃類動物干 燥 飼料 喂 養 ,維 持 飼 料 合 格 證 號 :NO. 43200600003 951,許 可 證 號 SCXK(湘)2014-0002,自由飲食,分籠飼養,6 只/籠,室溫(25±1)℃,濕度(50±10)%,自然晝夜節律光照。在實驗室適應性喂養 1 周后,隨機數字法分為空白對照組(CG)12 只、造模組(MG)15只、模型運動組(ME)15 只。
1.2.1 CUMS抑郁小鼠造模及樣本處理 對13 種應激刺激因子采用在線隨機數字生成器方法,總造模時間28 天(4 周),按照隨機數的數目為28,最小值為1,最大值為13,選擇隨機數的性質為隨機,生成隨機數[3]。同樣方法生成2 次,將2 次配對組合,并適當調整重復和相鄰重復的隨機數字,最終確定刺激的具體方案。13 個應激因子分別為晝夜調整、光照性質、禁食、禁水、傾斜45℃鼠籠、潮濕墊料、4℃冰水游泳、45℃高溫游泳、水平震蕩、輕夾鼠尾、束縛、白噪音和間斷(閃光)刺激。
所有小鼠禁食過夜,次日以 1% 戊巴比妥鈉(50mg/kg)腹腔注射麻醉,隨機選取6 只進行開胸自心臟提取新鮮血液,迅速采取Trizol 法提取總RNA,-80℃凍存備用。處死后的小鼠于冰上剝離頭部皮膚,暴露顱骨,眼科鑷自枕骨大孔輕輕撬開顱骨,充分暴露腦組織,小心剝離大腦左右皮層后,暴露整個海馬組織,玻璃分針剝離海馬組織與大腦皮層及周圍腦組織,取出海馬,冰磷酸緩沖鹽溶液(Phosphate buffer saline,PBS)液沖洗,濾紙吸掉多余水分,稱重后于Trizol 試劑中-80℃凍存備用。在剩余小鼠中再隨機選取6 只進行腦在體固定,冰上取腦后于4%多聚甲醛固定48 h 以上,石蠟包埋。
1.2.2 中等強度有氧跑臺運動方案 模型運動組小鼠參考Bedford 訓練方案進行改進,即在造模成功后按照10 m/min、0°坡度,由第1 天的10 min,每天遞增10 min,共計6 天后,開始正式訓練,以10 m/min,0°坡度,60 min/天,6 天/周,連續訓練8 周。運動訓練時間均安排在上午9:00-11:30 進行。訓練期間無小鼠死亡。
1.2.3 造模與干預效果評定 ( 1)神經行為學評定。最后一次運動訓練結束當天,每組隨機數字法選取10只小鼠進行糖水偏好試驗和強迫懸尾測定,用于評價小鼠快感缺失和絕望行為的程度。(2)小鼠海馬組織Nissl 染色。石蠟包埋組織進行全自動切片機切片,厚度為5 μm,嚴格按照步驟進行海馬組織Nissl染色,每只染色片在電鏡下隨機選取5 個視野觀察拍照,觀察細胞形態,用Image-Pro Plus6.0 軟件分析尼氏體累積光密度值。
1.2.4 總RNA提取 ( 1)血液總RNA 提取。抗凝管自心臟提取新鮮血液后,輕輕顛倒8~10 次,按照1:1加入PBS 液稀釋后,再取新的離心管按照稀釋后的溶液1:1 加入白細胞分離液液面,低速離心20 min。離心后,待吸管小心吸出棄去分離液上層約0.5 cm上清液后,再小心吸取分離液層,即白細胞層,置于另一新離心管中,加入 2 mLPBS 洗滌液,混勻后室溫 2 000 rpm 離心 10 min,棄上清,加入 1 mLPBS液,移入 EP 管,混勻、室溫4 000 rpm 離心5 min,得沉淀。移液器去除上清液,留下完整管底白細胞團,渦旋或輕彈管壁將白細胞沉淀完全松散重懸,加入1 mLTrizol至沉淀中,吹打及震蕩管壁,直至沉淀明顯溶解。滴加200 μL 氯仿,震蕩15 s,室溫靜置5 min,4℃12 000 rpm 離心15 min,吸取上層水相移入新的EP 管。加入預冷的異丙醇 0.5 mL 沉淀總 RNA,震蕩混勻,室溫或-20℃靜置10 min(最好過夜)。4℃12 000 rpm 離心 15 min 后棄上清。滴加 75% 乙醇(DEPC 處理)1 mL 洗滌1~2 次。4℃ 12 000 rpm離心10 min 后,棄上清液保留沉淀物,倒置于干凈的吸水紙上,空氣自然干燥 10 min。加入20~40μL RNase-free 處理水溶解RNA。
(2)海馬組織總RNA 提取。取出已加入Trizol 試劑的海馬組織,于預先制冷的電動勻漿器冰上勻漿,充分裂解。室溫靜置10 min 后,滴加1/5 體積的氯仿,快速震蕩15 s 后4 ℃12 000 g15 min 離心。將上清層移至新的EP 管滴加1/2 體積異丙醇,充分混勻靜置5min 后4 ℃12 000 g15 min 離心,棄上清,再滴加1 mL75%乙醇,快速震蕩15 s,4 ℃7 500 g5 min離心,棄上清。自然干燥RNA沉 淀 ,加入去RNase水溶解RNA,-80 ℃凍存備用。
(3)總RNA濃度/純度測定。每樣取2 μL,經紫外分光光度計測定OD值,計算OD260/OD280 的比值,比值位于1.8~2.0 之間,表明樣品純度較高,無其他雜質污染。電泳檢測:1%瓊脂糖凝膠電泳檢測其質量。
1.2.5 mRNA 測序文庫建立與測序 所有測序樣本從超低溫冰箱取出后,為防止樣本反復凍融,用裝有5~10 kg 干冰的泡沫盒密封運送至北京諾禾致源科技股份有限公司,進行測序。用帶有 Oligo(dT)的磁珠通過 A-T 互補配對、mRNA 的ploy A 尾結合的方式對檢驗合格的樣品進行富集[4]。
1.2.6 差異基因篩選 按照有氧運動組和模型組基因差異倍數(Fold Change,FC)進行篩選,選擇標準為log2(FC)≥1 或log2(FC)≤-1。
(1)GO(Gene Ontology)分析。GO 分為細胞組成(Cellular Component,CC)、生物過程(Biological Process,BP)和 分 子 功 能(MolecularFunction,MF)3 部分。按照超幾何分布原理,計算挑選出的差異基因同GO 分類中某幾個特定分支的超幾何分布關系,通過假設驗證得出特定P值,判斷其是否在該GO 中富集[5]。
(2)KEGG(Kyoto Encyclopedia of Genes and Ge-nomes)分析。通過Pathway 將生物體內不同基因相互協調發揮其生物學功能進行顯富集分析,可確定差異表達基因參與最主要信號轉導或生化代謝途徑。Pathway 應用超幾何檢驗,以KEGG 數據庫中Pathway 為單位,找出整個基因組差異表達基因中顯著富集的Pathway[6]。
2.1.1 神經行為學評定 從檢測結果看,造模后的MG小鼠比CG 組呈現十分顯著性降低(P<0.001),但隨著運動的實施,ME 組小鼠糖水偏好指數有較大幅度回升,提示有氧跑臺運動可使抑郁小鼠快感缺失的癥狀得以逆轉。強迫懸尾不動時間檢測結果也驗證糖水偏好試驗的檢測結果。ME 組小鼠強迫懸尾不動時間比CG 組低,提示有氧運動能有效減輕抑郁小鼠的絕望行為,這在前期研究成果中也得以驗證[7]。
2.1.2 Nissl染色 海馬組織CA1 區神經細胞尼氏體染色結果顯示,MG 組染色變淺,神經細胞總數減少,出現明顯的尼氏體核固縮,嚴重的還呈現明顯的空泡樣病變,尼氏體累積光密度值明顯降低(P<0.05)。與MG 組相比,ME 組神經細胞核固縮現象減少,神經細胞數目增多,染色清晰,分布趨于均勻,尼氏體累積光密度值明顯增加(P<0.05),提示有氧運動能有效減輕抑郁小鼠的絕望行為,呈現較好的細胞修復現象。
2.2.1 Total RNA的檢測結果 經 1% 瓊脂糖凝膠電泳純度檢測[8],顯示所有樣本均包括28S、18S 和5S條帶,其中28S 和18S 條帶清晰,28S 條帶的亮度較18S 條帶明顯,提示 TotalRNA 完整性較好,可用于后續的實驗研究。
2.2.2 轉錄組測序數據質量結果 6 個樣本的測序結果通過過濾后分別得到 8.28G、8.04G、8.11G、9.15G、9.83G 和7.38G 高 質 量 序 列(Clean reads),且測序錯誤率 均 低 于 0.03%,堿 基 質 量 值Q20 ≥96.97%,Q30 ≥92.28%,完全符合預定測序要求,均可用于進一步分析(見表1)。

表1 各組小鼠血液與海馬組織測序結果匯總Table 1 Summary of Sequencing Results of Blood and Hippocampus of Mice in Each Group
2.2.3 測序錯誤率分布檢測結果 由測序Phred 數值通過公式(Qphred=-10log 10( e))轉化獲取每個堿基測序錯誤率。結果顯示,Phred 數值通過概率模型計算堿基識別(Base Calling)過程中獲取的單堿基錯誤率分布結果符合樣品測序要求。
2.2.4 A/T/G/C含量分布檢測結果 檢查結果顯示,Illu-mina 測序中,反轉錄成cDNA 時6bp 的隨機引物會引起前幾個位置核苷酸組成出現一定偏好性,影響轉錄組測序的均一程度[9]。理論上,普通文庫中A 和T 堿基及G 和C 堿基含量在每個測序循環上應分別對等,整個測序過程基本穩定不變,但對于鏈特異性建庫則會出現GC分離現象[10]。本實驗樣本檢查結果顯示,因隨機引物擴增偏差導致Illumina測序的每個read前6~7 個堿基出現較大波動,但不影響后續定量分析。
2.2.5 差異表達基因篩選 為探究不同組別的不同樣本轉錄組間的差異,針對不同組別小鼠血液與海馬組織間的差異表達基因篩選閾值按照P<0.05,|log2(Fold Change)|>1 為 標 準 進 行 篩 選。結 果顯示,在模型運動組與模型組血液間共鑒定出693個差異表達基因,在上調的166 個基因中新基因有7 個,下調的527 個中新基因12 個。ENSMUSG00000000204(Slfn4,Schlafen family||Schlafen,AAA domain)上調基因中上調倍數最高,位于11 號染色體上,其表達相應干擾素α,并在Toll 樣受體激動劑激活期間被誘導,主要與炎癥反應相關。在下調基因中,下調倍數最高的是ENSMUSG00000049775(Tmsb4x thy-mosin,beta 4,Xchromosome),位于 X 染色體上,與細胞遷移直接相關。模型運動組與模型組海馬組織間共鑒定390個差異表達基因,上調基因266 個(含新基因1 個),下調基因 124 個(含新基因 1 個)。在上調基因中,ENS-MUSG00000027447(Cst3,Cystatin C)上調倍數最高,位于2 號染色體上,其基因編碼的蛋白質是參與神經變性和心血管過程的半胱氨酸蛋白酶抑制劑,可抑制β-淀粉樣蛋白的聚集。在下調基因中,下調倍數最高的是ENSMUSG00000092341(Malat1,metastasis asso-ciated lung adenocarcinoma transcript 1(non-codingRNA)),位 于19 號染色體上,其基因產生長的非編碼RNA,被切割成成熟的功能性轉錄物以及小的細胞質RNA(mascRNA),成熟的轉錄物通過 3’結構穩定并保留與細胞核內,可調控基因的表達與增殖。為評估各差異表達基因在不同組別小鼠血液與海馬組織中的整體分布,以-log10(p-value)為縱坐標、log2(foldchange)為橫坐標構建差異表達基因火山圖(見圖1)。

圖1 各組小鼠學血液與海馬組織差異基因火山圖Figure 1 Volcanic Maps of Differential Genes in Blood and Hippo-campus of Mice in Each Group
考慮到表達模式類似的基因可能共同參與同一代謝過程、細胞通路或具有相似功能[11],測序通過將相同或相近表達模式的基因聚集成類,推測已知基因新功能與未知基因功能。本實驗測序結果顯示,在不同的處理條件下同一cluster 中的基因具有相似的表達水平和變化趨勢。
2.2.6 差異表達基因的GO分析 ( 1)血液組織差異表達基因的GO 分析。為更好地探究差異表達基因涉及的生物學過程,采用GOseq 方法對差異表達基因進行GO 富集分析。通過富集分析,以ME vs MG 組血液組織中的差異表達基因為例,所有差異表達基因中共有634 個基因被富集到7 548 條GO terms 中,其中5 733 條富集到生物過程,716 條富集到細胞組成,1 099 條富集到分子功能。按照富集分析統計學顯著水平,P<0.05 進一步進行顯著性分析,結果顯著性差異表達基因被富集到2 272 個GO terms中,占所有terms 的30.10%,其中1 705 條富集到生物過程,287條富集到細胞組成,280 條富集到分子功能。在顯著差異表達富集到相應條目的基因中,有484 個下調基因,富集于2 094 條GO terms 中,150 個上調基因富集于179 條GO terms 中。其中,下調基因中 1 562 條富集到 BP 中,281 條富集到CC 中,250 條富集到MF中;上調基因中143 條富集到BF 中,6 條富集到CC中,30 條富集到MF 中。
(2)海馬組織差異表達基因的GO 分析。富集分析結果顯示(以MEvsMG 為例),所有差異表達基因中共有333 個基因被富集到977 條GO terms 中,其中639 條富集到 BP 中,197 條富集到 CC 中,141 條富集到MF 中。按照富集分析統計學顯著水平,P<0.05進一步進行顯著性分析,結果顯示顯著性差異表達基因被富集到403 個GO terms 中,在顯著差異表達富集到相應條目中的基因,有115 個基因下調,顯著富集于21 條 GO terms 中,218 個基因上調,顯著富集于 283 條GO terms 中。其中,在下調基因中7 條富集于BP,12 條富集于CC,2 條富集于MF;上調基因中154 條富集于BP,90 條富集于CC,39 條富集于MF。
(3)小鼠血液與海馬組織GO 顯著富集結果對比分析。對比 2 種組織的 GO terms 發現,在分子功能中,血液與海馬組織的7 個基因涉及β-淀粉樣蛋白沉淀(GO:0001540,beta-amyloid binding),分 別 是Itm2b、Atp1a3、Cst3、Apoe、Scarb1 和Msr1 等,這些基因多與機體神經系統病變、血管病變等相關。在生物 過 程 中 ,涉 及 到 運 動 調 控 的 GO terms(GO:0040012,regulation of locomotion)中 包 括10 個 上調基因 與 42 個 下 調 基 因 。 下 調 基 因 分 別是 Ccr7、DUSP10、Ddx58、IL-1β、Mcam、Sdc4 和S1pr1[12-16],大多是參與機體免疫調節與信號轉導通路等[17]。上調基因分別是Ccr2、Ceacam1、Apoe、Angpt1、Lgals3、Gsn、Rtn4 和Nfkbid[18-24]等,大多參與神經系統的炎癥性疾病[25],并與運動關系密切。
2.2.7 差異表達基因KEGG分析 ( 1)小鼠血液差異表達基因KEGG 富集分析結果。對各組小鼠血液和海馬組織的所有差異表達基因進行KEGG 通路分析,結果顯示(以ME vs MG 為例),共計199 個基因富集到14 個KEGG 通路上,其中,26 個基因富集到血小板活化,29 個基因富集到吞噬,24 個基因富集到帕金森病的發病機制,26 個基因富集到阿爾茨海默病發病機制,22 個基因富集到氧化磷酸化過程,16 個基因富集到ECM-受體相互作用,15 個基因富集到造血細胞譜系,14 個基因富集到心肌收縮,4 個基因富集到長期抑郁病理改變,6 個基因富集到NF-kB 信號通路,6個基因富集到Toll 樣受體信號通路,6 個基因富集到TRP 通道的炎癥介質調節,3 個基因富集到TGF-β信號通路,2 個基因富集到 PPAR 信號通路。其他KEGG 富集通路還包括5-羥色胺能突觸、膽堿能突觸、多巴胺能突觸和雌激素等富集通路的差異基因表達,雖不具統計學意義,但基因表達的富集通路也具有一定意義。
(2)小鼠海馬組織差異表達基因KEGG 富集分析結果。海馬組織中共有 340 個基因富集于 16 個KEGG通路,其中82 個基因富集到核糖體,44 個基因富集到氧化磷酸化,41 個基因富集到帕金森病的發病機制,42 個基因富集到阿爾茨海默病的發病機制,58 個基因富集到代謝途徑,3 個基因富集到PPAR 信號通路,6 個基因富集到cAMP 信號通路,3 個基因富集到雌激素信號通路,5 個基因富集到過氧化物酶體,6 個基因富集到吞噬,4 個基因富集到谷氨酸能突觸,2 個基因富集到膽堿能突觸,1 個基因富集到5-羥色胺能突觸,1 個基因富集到多巴胺能突觸,1 個基因富集到TRP 通道的炎性反應調節。其他富集的KEGG通路還包括Wnt 信號通路、ECM-受體相互作用、趨化因子信號通路、MAPK 信號通路和PI3K-Akt 信號通路等,雖然未達到P<0.05 的顯著性統計學意義,但信號通路相關基因差異表達顯著。
(3)小鼠血液與海馬組織KEGG 顯著富集結果對比分析。對比2 種組織KEGG 通路分析顯示,在氧化磷酸化、帕金森病和阿爾茨海默病的發病過程、吞噬、多巴胺能突觸、TRP 通道的炎性反應調節等關聯性較強。對比其差異表達基因有所區別。對比分析結果顯示,KEGG 顯著富集的通路與神經元退行性病變、炎癥等有關。
高通量測序技術及其生物信息學發展為臨床疾病和動植物病變的診斷與康復治療產生深遠影響。在肯定測序技術優勢的同時,在人與動物急慢性疾病的研究仍不夠成熟,尤其是在靶向調控關系的預測和實驗驗證方面存在諸多挑戰。本實驗采用CUMS抑郁造模成效顯著,運動干預后的康復效果突出。實驗測序樣本錯誤率、堿基含量、差異表達基因篩選結果可靠,預測分析其靶基因位點,KEGG和GO分析結果驗證了顯著富集的差異表達基因主要與長期抑郁、抑郁炎癥、細胞凋亡與自噬及其相關信號通路關系密切,確定炎癥、凋亡與自噬誘發小鼠抑郁的病理機制,證實了血液與海馬組織高通量測序結果顯著富集的高度一致性,為臨床采用血液檢測結果反應海馬組織疾病及其干預效果提供借鑒。同時,由于實驗研究測序選擇的實驗組別僅限于空白鼠、模型鼠和運動干預鼠,且實驗設計方法并未采取基因干擾或基因敲減等技術,因此,缺乏具體信號通路誘導作用機制的深入探討,但為后續實驗研究拓寬了思路,奠定良好的實驗基礎。