曾玉琳,蒙裕歡,張 鈺,杜紅麗*
(1.華南理工大學生物科學與工程學院,廣州 510006; 2.廣東省實驗動物監測所,廣州 510663)
大鼠具有體型較大、易于研究以及在某些生理特性方面更接近人類等優點,是多種生物醫學實驗的首選動物模型。其中,Wistar、GK、BN及SD大鼠作為常用的實驗大鼠模型廣泛應用于多種藥物和疾病機制等研究中。Wistar大鼠于1907年由Wistar研究所培育而來,其引進時間較早,遍布范圍較廣,廣泛應用于世界各國實驗室中[1];Goto-Kakizaki(GK)大鼠是1975年由日本東北大學的Goto和Kakizaki等[2]從Wistar大鼠中篩選高血糖個體近交繁殖數代而來,具有高血糖、高胰島素血癥、胰島素抵抗等特性,常用于II型糖尿病的發病機制研究;Brown-Norway(BN)大鼠是Silvers和Billingham于1958年運用此前由野生大鼠培育而成的棕色突變型大鼠近交繁殖而來,其對實驗過敏性腦脊髓炎及自身免疫性復合型腎小球腎炎有抗性,可作為致敏等動物模型[3-4];SD大鼠是1925年由美國的Sprague Dawley農場用Wistar大鼠培育而成,其具有較強的適應能力和抗病能力,廣泛用于營養學及病理學等研究中[5]。
實驗動物的遺傳穩定性對實驗的準確性和可靠性有著一定影響,因此在實驗動物的飼養過程中,對其進行定期的遺傳檢測是必不可少的環節[6]。生化標記基因檢測[7]、免疫標記基因檢測[8]以及毛色基因檢測[9]等傳統的遺傳質量檢測方法存在著精確度不高以及檢測位點少等局限性,這些檢測方法已不再滿足科學發展的需要[10]。隨著基因組學研究的不斷進步,SNP標記開始逐漸被應用于各種實驗動物的鑒定及遺傳檢測中,相比于傳統的遺傳質量檢測方法,利用SNP標記具有操作簡單快速、能鑒別出同源品系以及能進行大規模高通量檢測等顯著優點[11]。然而,在國內外的研究中,應用于大鼠遺傳檢測的SNP標記的研究卻并不多。Saar等[12]利用3 × 106個SNPs對一系列大鼠進行了基因型分析,共發掘了20 238個有效的SNPs;Guichoux等[13]通過對33 305個已知的候選SNPs進行驗證,結果顯示其中66%的SNPs能通用于不同大鼠品系中,并另外發掘了287個新的SNPs;蔡月花等[14]對MIJ和HFJ兩個品系的大鼠進行了SNP分析研究,確定了這兩個品系大鼠在9個位點的基因型。
目前,篩查到國內外廣泛認可的有效遺傳標記依然是實現實驗動物遺傳質量監測技術突破的有途徑之一。因此,開發出能用于大鼠遺傳檢測的SNP標記具有重要意義。本文旨在于利用高通量基因組測序、生物信息技術及一代測序等方法開發出能用于快速鑒定Wistar、GK、BN和SD這四種常用品系大鼠的SNP位點,以補充大鼠遺傳質量檢測方法,并進一步完善常用品系大鼠等位基因信息。
SPF級Wistar大鼠53只,體重170~240 g,1.5月齡;SPF級GK大鼠53只,體重150~220 g,1.5月齡。均購于上海斯萊克實驗動物有限責任公司[SCXK (滬) 2017-0005]。SPF級BN大鼠50只,體重70~150 g,1月齡;SPF級SD大鼠50只,體重80~150 g,1月齡。均購于北京維通利華實驗動物技術有限公司[SCXK (京) 2016-0011]。以上大鼠均雌雄各半。大鼠飼養在符合《中華人民共和國衛生部實驗動物環境設施標準》二級標準的動物房中,恒溫室內金屬鼠籠,進食標準飼料,可自由飲水,大鼠的鼠尾組織取材堅持實驗動物使用的3R原則,于廣東省實驗動物監測所動物實驗設施內進行[SYXK (粵) 2016-0122],倫理審查編號為IACUC2014029。
組織基因組DNA提取試劑盒購自天根生化科技有限公司;引物由上海生工生物工程有限公司合成;DNA聚合酶Taq Mix購自TaKaRa寶生物工程有限公司;PCR擴增產物送于華大基因測序。PCR擴增儀和凝膠成像儀購自美國Bio-Rad公司;DNA電泳儀及電泳槽購自北京六一儀器廠;紫外-可見微量分光光度計購自美國賽默飛世爾科技公司;高速離心機購自德國Eppendorf公司。
1.3.1 全基因組重測序
提取3只Wistar大鼠和3只GK大鼠的基因組DNA于華大基因Illumina HiSeq 2500平臺進行全基因組重測序。
1.3.2 候選SNP的篩查
首先對測序的原始數據(raw reads)進行截短和過濾得到待分析數據(clean reads),然后使用Bowtie 2軟件[15]將clean reads比對到BN大鼠參考基因組(www.ncbi.nlm.nih.gov/genome/?term=Rat)并生成SAM文件,利用Picard軟件[16]去除PCR重復,將SAM文件用SAMtools軟件[17]轉換成BAM文件并進行排序。在Linux系統上,使用SAMtools軟件對上述準備好的BAM文件及參考基因組建索引,使用GATK軟件[18]的Haplotype Caller工具進行SNP檢測并得到相應的VCF文件,最后通過閾值篩選得到最終的VCF文件。
經過整理統計,Wistar大鼠比對參考序列檢測出94 800個純合SNP,GK大鼠比對參考序列檢測出106 019個純合SNP,其中有56 216個SNP為Wistar和GK大鼠所共有,又對這些共有的SNP進行篩查,發現BN大鼠參考基因組、Wistar大鼠和GK大鼠三者基因型互不相同的位點僅有38個,從中隨機挑選了15個作為候選SNP位點(如表1所示)進行后續實驗。
1.3.3 基因組DNA提取與混合池構建
使用組織基因組DNA提取試劑盒提取大鼠鼠尾的基因組DNA。在每種大鼠的DNA樣品中挑10個用于后續單個個體的PCR擴增(分別編號為:BN1~BN10、W1~W10、GK1~GK10、SD1~SD10),而其余40個則用于合成DNA混合池。對于合成DNA混合池的樣品,先用紫外分光光度計分別對每個DNA樣品的濃度測量3次,取平均值作為樣品濃度值,然后用TE緩沖液稀釋并定量至50 ng/μL,體積為20 μL,每10個同品系大鼠的DNA混合為一個DNA池(例如Wistar大鼠,將編號為W11~W20的DNA樣品混合為W-A,將編號為W21~W30的DNA樣品混合為W-B,將編號為W31~W40的DNA樣品混合為W-C,將編號為W41~W50的DNA樣品混合為W-D),混合好的16個池用于后續DNA混合池實驗。
1.3.4 引物設計與PCR反應
提取候選SNP位點上下600 bp序列為模板,使用Primer 6.0分別設計15對引物(如表2所示)。PCR反應程序:94℃預變性5 min,94℃變性30 s,55℃退火30 s,72℃延伸1 min,循環35次后于72℃充分延伸10 min,最后于4℃保存。
1.3.5 單個個體測序及比對
對于每個品系10只大鼠的PCR擴增產物,分別取15 μL進行一代測序,然后利用Lasergene軟件包中的SeqMan對測序結果進行整理與比對。根據四個品系大鼠序列的比對結果對SNP位點進行進一步的篩選:①若同品系的10只大鼠在某一SNP位點的基因型不一致,則不采用該SNP;②若GK大鼠和Wistar大鼠在某一SNP位點的基因型與表1不一致,則不采用該SNP;③對于候選SNP位點上下游序列,若出現能鑒別出某種大鼠的SNP位點,則挑選采用。
注:“AA”、“GG”、“TT”、“CC”為基因型。
Note. “AA”, “GG”, “TT”, and “CC” refer to genotypes.

表2 候選SNP位點對應的引物信息
1.3.6 DNA混合池實驗
對最終篩選的位點進行擴大樣本的DNA混合池實驗,以上述準備好的16個混合池為模板進行PCR擴增目的片段,反應體系與反應程序同上。對PCR產物進行測序,利用SeqMan對序列結果進行整理與比對,并查看測序情況。
以W1~W10,GK1~GK10,BN1~BN10和SD1~SD10為模板,用設計的15對引物擴增目的片段。結果顯示,第7對和第11對引物擴增失敗,其余產物均擴增成功且可用于測序。
擴增成功的產物測序結果顯示,滿足上述篩選要求的位點有SNP4、SNP5、SNP6、SNP9、SNP12、SNP13、SNP14。除此之外,在這些序列中還發掘了其他可以用于快速鑒定的6個位點,分別命名為SNP16、SNP17、SNP18、SNP19、SNP20、SNP21。這13個位點在四種大鼠中的等位基因型如表3所示。
對于上述13個SNP位點,DNA混合池的PCR產物測序結果顯示,除SNP13和SNP16在SD大鼠中出現套峰外(如圖1所示),其他位點均未出現套峰。SNP13在SD大鼠單個個體測序結果中10個個體都是雜合子,因此在混合池測序時出現套峰屬于正常現象,而SNP16在SD大鼠中出現輕微G峰,說明SD大鼠群體中存在少數AG雜合子或GG純合子的個體。
本研究首先利用高通量基因組測序和生物信息技術篩選了一組候選SNP位點,并繼續擴大樣本量以及增加大鼠種類進行測序分型,利用了一代測序對四種大鼠(Wistar、GK、BN、SD大鼠)的候選SNP位點進行進一步篩查與驗證,最終得到了13個SNP位點以用于四種大鼠的快速鑒定,最后利用DNA混合池法驗證了這些位點在群體中的穩定性和用于鑒定的可靠性。

表3 13個SNP位點在四種大鼠中的基因型
注:“AA”、“GG”、“TT”、“CC”為基因型;“—”為堿基缺失。
Note. “AA”, “GG”, “TT”, and “CC” refer to genotypes; “—”refers to base deletion.

注:“W”、“GK”、“BN”、“SD”分別代表Wistar大鼠、GK大鼠、BN大鼠和SD大鼠;A~D分別代表四個DNA混合池。圖1 混合池擴增產物的測序峰圖Note. “W”, “GK”, “BN”, and “SD” refer to Wistar, GK, BN, and SD rats, respectively; A-D refer to the four DNA pools, respectively.Figure 1 Sequencing peak maps of DNA pooling amplification products
從這13個SNP位點在四種大鼠中的基因型可以發現,SNP13可鑒別出Wistar、GK、BN和SD四種大鼠,SNP16和SNP17可鑒別出SD大鼠,SNP18和SNP19可鑒別出GK大鼠,SNP20和SNP21可鑒別出BN大鼠,而SNP4、SNP5、SNP6、SNP9、SNP12和SNP14雖然可鑒別出GK和BN大鼠,但區分不出Wistar和SD大鼠,主要是Wistar大鼠和SD大鼠這兩個品系親緣關系較近的緣故,因此可以利用多個位點配合進行鑒別,例如,SNP4和SNP17結合也可快速鑒別出四種大鼠。此外,增加檢測的SNP位點個數會大大提高鑒別的準確性和可靠性。
混合池實驗顯示,SNP13和SNP16在SD大鼠中出現了套峰。SNP13在SD大鼠單個個體測序結果中10個個體都是雜合子,而SNP16在SD大鼠中出現輕微G峰,說明在SD大鼠群體中存在少數AG雜合子或GG純合子的個體,這些現象是由于SD大鼠作為封閉群在這些位點保持著一定的雜合性。鑒于以上結果,SNP13和SNP16還可以作為SD大鼠封閉群遺傳評估的SNP標記,其他未出現套峰的位點說明了在四個大鼠群體中已趨于穩定,用于鑒定物種具有可靠性。
實驗動物的遺傳質量是衡量其品質好壞的重要因素,使用遺傳特性穩定的實驗動物才能保證實驗結果更加具有可靠性和可重復性[19]。在生物醫學研究中,使用具有明確遺傳背景的實驗動物是非常重要的[20],因此,篩查到能監測實驗動物遺傳背景的標記至關重要。SNP是基因組中最為豐富且最為常見的可遺傳變異,SNP標記也將成為用于大鼠遺傳質量監測的理想遺傳標記[21]。目前應用于大鼠遺傳檢測的SNP標記的研究較少,對其展開研究并篩選能快速鑒定四種常見品系大鼠的SNP位點,以補充大鼠遺傳質量檢測手段,具有進一步豐富大鼠SNP數據庫的重要意義。