楊銀瑩 熊進軍 潘勝德 楊美慶 張紅玲 黃 江 任 崢
貴州醫(yī)科大學法醫(yī)學院 貴州 貴陽 550025
線粒體DNA(mitochondrial DNA,mtDNA)是細胞核外DNA攜帶有編碼蛋白質(zhì)和RNA的基因,是人類基因組的一部分。線粒體DNA具有獨特的母系遺傳特征,不發(fā)生重組,能夠反應一個包含眾多個體的非重組母系的遺傳信息,是人類的遷徙和進化研究中常用的遺傳標記[1]。對于核DNA降解嚴重如陳舊骨骼、牙齒等,以及毛發(fā)等核DNA無法獲得有效分型結(jié)果的樣本,線粒體DNA分析有其獨特的優(yōu)勢[2]。目前國際上對于線粒體DNA的序列分析通常采用全控區(qū)測序的方式[1],使用修正劍橋參考序列(revised Cambridge reference sequence,rCRs)為參考序列,本次實驗研究的區(qū)域主要集中在控制區(qū)。
我國是一個多民族的國家,苗族是貴州人口最多的少數(shù)民族,在貴州有十分重要的地位,擁有其獨特的歷史和文化[2]。而對貴州苗族的DNA遺傳標記研究已經(jīng)很多,但都集中在常染色體上,線粒體DNA的研究極少,用的還是老舊的限制性片段長度多態(tài)性方法[2][3],無法適應現(xiàn)今的檢測平臺和技術(shù)要求。且提供的遺傳信息極為有限,難以滿足法醫(yī)學和人類學研究的需求。
本文研究以貴州苗族為研究對象,通過分析其線粒體DNA,獲得貴州省苗族多態(tài)性信息與法醫(yī)學應用價值,為法醫(yī)個體識別和親子鑒定的證據(jù)價值提供科學的基礎(chǔ)數(shù)據(jù),并獲得貴州苗族線粒體DNA單倍型類群分布情況。
2.1.1 樣本來源基本情況 本實驗所用血痕樣本均來自貴州各地區(qū)無血緣關(guān)系的苗族個體,所有血痕樣本均由貴州醫(yī)科大學法醫(yī)學院/法醫(yī)司法鑒定中心提供。
2.1.2 樣本的采集 血痕樣本采集方法:以知情同意原則為前提,由貴州醫(yī)科大學法醫(yī)司法鑒定中心提供,無血緣關(guān)系的中國貴州苗族203名志愿者的指尖血血痕,-20℃保存。
2.2.1 DNA的提取 使用鹽析法[1]提取血樣DNA,-20℃保存。
2.2.2 線粒體DNA控制區(qū)的PCR擴增 線粒體DNA控制區(qū)的PCR擴增以及測序引物相同,引物序列見表1:

表1 線粒體DNA控制區(qū)的PCR擴增以及測序的引物序列及濃度
根據(jù)TaKaRa LA Taq?DNA聚合酶說明書進行PCR擴增,調(diào)整PCR反體系為25μL,每個反應混合物含有0.25μL的TaKaRa LA Taq(5 U/μl),2.5μL的10×LA Taq Buffer II(Mg2+free),2.5μL的25mM MgCl2(final 2.5 mM),4μL的dNTP Mixture(2.5mM each),引物 M1-F和引物M2-R各1μL,1μL的模板DNA和12.75μL的滅菌蒸餾水。
使用ABI9700型熱循環(huán)儀進行PCR擴增。每次擴增均加入1個2800M DNA做陽性對照和和1個無菌雙氧水做陰性對照。在95℃預變性15min后,94℃變性1min30s,50℃復性1min30s,72℃延伸1min30s,共循環(huán)35個周期,最后繼續(xù)70℃延伸10min。為了提高數(shù)據(jù)的準確度,從正向和反向兩個方向?qū)χ貜蛿U增進行測序。
使用DNAman軟件(http://www.lynnon.com/)對正向和反向序列比對,與修正劍橋參考序列(revised Cambridge reference sequence,rCRs)進行比較,參照國際法醫(yī)血液遺傳學會DNA委員會(ISFG)推薦的命名原則進行命名。
2.2.3 線粒體統(tǒng)計學分析 采用直接計數(shù)法統(tǒng)計單倍型和單倍群頻率,使用公式(1.1)[3]:

(公式中pi表示第i個單倍型的頻率,k表示單倍型的數(shù)量,N表示總的樣本數(shù)量。)
計算苗族mtDNA的單倍型差異度(haplotype diversity,HD)。
基于PhyloTree Build 17[4]使用Haplogrep[1]和EMMA[4]進行單倍群分配。
2.1 單倍型 從203個貴州苗族樣本中,有113個單倍型值觀察到了一次,14個單倍型觀察到了2次,4個單倍型觀察到了3次,1個單倍型觀察到了4次,2個單倍型觀察到了5次,2個單倍型觀察到了6次,1個單倍型觀察到了7次,1個單倍型觀察到了8次,1個單倍型觀察到了9次。單倍型及其頻率見表S1。單倍型差異度(haplotype diversity,HD)為0.9844。
2.1 單倍型類群 這203個樣本被分配到71個不同的單倍群和亞單倍群,見表2。由于單倍群的分配僅依賴于控制區(qū)域的信息,因此準確性不同。單倍亞群頻率最高的是B5a(29個樣本,14.3%),其次是B5a1c1(14個樣本,6.9%),B4k(12個樣本,5.9%),D4e1a3(12個樣本,5.9%),F1(11個樣本,5.4%)和M74a(11個樣本,5.4%)。在單倍群水平上,最常見的是B(70個樣本,34.5%),其次是F(39個樣本,19.2%),M(35個樣本,17.2%)和D(26個樣本,12.8%)。

表2 貴州苗族203個個體的單倍群頻率

B 7 0 0.3 4 5 B 4 1 0.0 0 5 B 4+1 6 2 6 1 2 0.0 1 0 B 4 c 1 b 2 c 1 0.0 0 5 B 4 c 2 4 0.0 2 0 B 4 g 3 0.0 1 5 B 4 h 1 0.0 0 5 B 4 k 1 2 0.0 5 9 B 5 a 2 9 0.1 4 3 B 5 a 1 c 1 1 4 0.0 6 9 B 5 a 1 d 1 0.0 0 5 B 5 a 2 a 1 1 0.0 0 5 B 5 b 2 a 1 0.0 0 5 C 4 0.0 2 0 C 4 1 0.0 0 5 C 4 c 1 b 1 0.0 0 5 C 5 2 0.0 1 0 D 2 6 0.1 2 8 D 2 1 0.0 0 5 D 4 a 4 0.0 2 0 D 4 b 1 1 0.0 0 5 D 4 b 2 b 2 0.0 1 0 D 4 b 2 b 2 c 1 0.0 0 5 D 4 e 1 a 3 1 2 0.0 5 9 D 4 h 1 d 1 0.0 0 5 D 4 k 1 0.0 0 5 D 4 t 1 0.0 0 5 D 5 b 2 0.0 1 0 F 3 9 0.1 9 2 F 2 0.0 1 0 F 1 1 1 0.0 5 4 F 1+1 6 1 8 9 1 0.0 0 5 F 1 a 2 0.0 1 0 F 1 a 1 a 1 5 0.0 2 5 F 1 a 2 3 0.0 1 5 F 1 a 2 a 2 0.0 1 0 F 1 a 4 a 1 0.0 0 5 F 1 c 1 a 1 a 1 0.0 0 5 F 1 d 1 0.0 0 5 F 2 a 1 0.0 0 5 F 2 b 1 1 0.0 0 5 F 3 a+2 0 7 3 0.0 1 5 F 3 a 1 3 0.0 1 5 F 3 b+1 5 2 1 0.0 0 5 F 4 b 1 0.0 0 5

G 2 0.0 1 0 G 2 a+1 5 2 1 0.0 0 5 G 2 a 1 d 1 0.0 0 5 M 3 5 0.1 7 2 M 1 1 a 1 0.0 0 5 M 1 2 a 1 b 1 0.0 0 5 M 1 2 b 1 b 1 0.0 0 5 M 7 1 a 1 a 1 0.0 0 5 M 7 4 a 1 1 0.0 5 4 M 7 b 1 a 1 2 0.0 1 0 M 7 b 1 a 1+(1 6 1 9 2)5 0.0 2 5 M 7 b 1 a 1 a 1 0.0 0 5 M 7 b 1 a 1 a 3 4 0.0 2 0 M 7 b 1 a 1 b 1 0.0 0 5 M 7 c 1 a 1 a 1 0.0 0 5 M 7 c 1 a 3 1 0.0 0 5 M 8 a 2 a 1 1 0.0 0 5 M 8 a 3 a 1 0.0 0 5 M 9 3 0.0 1 5 N 8 0.0 3 9 N 9 a 1 0+1 6 3 1 1 5 0.0 2 5 N 9 a 1 0 a 1 0.0 0 5 N 9 a 1 a 1 0.0 0 5 N 9 a 2'4'5 1 0.0 0 5 R 9 0.0 4 4 R 9 b 1 a 1 a 1 0.0 0 5 R 9 b 1 b 2 0.0 1 0 R 9 c 1 a 6 0.0 3 0 Z 1 0.0 0 5 Z+1 5 2 1 0.0 0 5
在我們發(fā)現(xiàn)的所有單倍型中,其中一些被許多人共享個體,例如單倍型16140C,16183C,16189C,16266A,16519C,73G,210G,263G,523DEL,524DEL(由14個樣本共享)。和單倍型多樣性也低于參考人群。這種情況不是鑒于大多數(shù)苗族人集中在貴州省,這一點令人驚訝。因此,我們收集的一些樣本可能屬于同一母系。
由單倍群分布情況可以看出,苗族個體所屬單倍群主要為B、F和M,與漢族類似,但頻率分布有一定差異。因此想根據(jù)民族特有單倍群來追溯位置樣本種族來源,有一定困難。但主干下屬的分支單倍群,可能與漢族有一定差異。但光憑控制區(qū)測序,無法準確劃分分支單倍群,需借助編碼區(qū)單核苷酸多態(tài)性的分型輔助,或者全線粒體基因組測序才能完成。這一點將在后續(xù)的工作中完成。