劉亞舉,郭利紅,岳俊濤,李 瑾,石美森,李學博
1.河南省許昌市公安局刑事科學技術研究所,河南許昌 461000;2.河南省公安廳刑事科學技術研究所,河南鄭州 450003;3.中國政法大學證據科學教育部重點實驗室,北京100192;4.山東省高校證據鑒識重點實驗室(山東政法學院),山東濟南 250014
Y染色體為男性所特有,具有單倍型連鎖遺傳及父系遺傳等特征,在減數分裂時不與其他染色體發生重組,父代Y-STR基因以穩定的單倍體形式遺傳給子代,因此在男女混合、多名男性混合樣本及親權鑒定的法醫學應用中有獨特的應用價值,并在群體遺傳學、人類遺傳學等領域發揮著重要作用,是常染色體檢測的重要補充。本文選取河南回族、貴州仡佬族和貴州苗族人群的27個Y-STR基因座進行研究,并與其他民族的遺傳關系進行聚類分析,重建系統發生樹,一方面為法醫學鑒定提供參考數據,另一方面進一步探討了各民族的分子遺傳學關系,可用于家族起源、人類進化、遷徙等群體遺傳學研究[1]。
1.1材料 從健康體檢人群中隨機選取1 080例河南回族、297例貴州仡佬族和221例貴州苗族無血緣關系的男性個體,均采集外周血0.1 mL,滴入采血卡(武漢驥騰公司),陰干后常溫保存。本研究經復旦大學生命科學學院倫理委員會批準。通過YHRD(www.yhrd.org)數據庫獲得北京漢族(YA004160)、河南漢族(YA004057)、上海漢族(YA004263)、重慶漢族(YA 004232)、廣東漢族(YA004066)、內蒙古達斡爾族(YA004277)、甘肅東鄉族(YA004178)、甘肅回族(YA004305)、甘肅藏族(YA004043)、青海藏族(YA004181)、湖北土家族(YA004306)、廣西壯族(YA004208)及海南黎族(YA004302)13個群體的27個Y-STR基因座單倍型分布數據(共10 985個)作為對比數據。
1.2方法 根據STRtyper-27Y熒光檢測試劑盒(寧波海爾施基因科技有限公司)說明書,用直擴法(免提取)對血液標本進行PCR擴增。在ABI 9700型熱循環儀上進行復合擴增,反應體系為10 μL,其中PCR Master Mix 5.0 μL、Primer Mix 2.5 μL、純水2.5 μL和1.2 mm直徑血卡。熱循環參數為:95 ℃ 5 min;94 ℃ 10 s,61 ℃ 1 min,70 ℃ 30 s,28個循環;60 ℃ 20 min;4 ℃保溫。取1 μL擴增產物與0.5 μL內標SIZE-500 Plus(寧波海爾施基因科技有限公司)和8.5 μL去離子甲酰胺混合,95 ℃變性3 min后,冰浴3 min,置于3500XL型遺傳分析儀(美國ThermoFisher公司)上行全自動毛細管電泳,采用Data Collection軟件收集數據,采用GeneMarker?HID分析軟件(美國SoftGenetics公司)進行等位基因分型,并采用GeneMapper ID-X v1.4分析軟件(美國Thermo Fisher公司)進行復核分析。每批樣本檢測均采用007(美國ThermoFisher公司)和超純水分別作為陽性對照和陰性對照。
1.3統計學處理 用直接計數法對各基因座的等位基因頻率和單倍型檢出頻率進行計算。基因多樣性(GD)和單倍型多樣性(HD)按公式h=n(1-∑Pi2)/(n-1)(Pi為等位基因或單倍型頻率,n為樣本數)計算;系統鑒別能力(DC)=Ndiff /N,其中Ndiff代表觀察到的單倍型種類數,N代表樣本量[2]。其中雙拷貝基因座DYF387S1和DYS385ab作為單倍型計算。利用YHRD數據庫提供的在線軟件Mega6.0進行AMOVA分析,并計算群體間遺傳距離Rst矩陣。
2.127個Y-STR基因座遺傳多態性 27個Y-STR基因座包括23個單拷貝Y-STR基因座及2個雙拷貝基因座(DYS385ab及DYF387S1,視為4個Y-STR基因座)。3個民族人群的27個Y-STR基因座的等位基因頻率見表1~7。在27個Y-STR基因座中,回族人群共檢出1 064個單倍型,其中1 048種單倍型為唯一單倍型,16種單倍型分別出現2次,HD值為0.999 972 5,DC值為0.985 185 2;仡佬族人群共檢出286個單倍型,其中276種單倍型為唯一單倍型,9種單倍型分別出現2次,1種單倍型出現3次,HD值為0.999 727 1,DC值為0.962 963 0;苗族人群共檢出217種單倍型,其中213種單倍型為唯一單倍型,4種單倍型分別出現2次,HD值為0.999 835 5,DC值為0.981 900 4。回族除DYS391基因座外,仡佬族和苗族除DYS391、DYS437、DYS438基因座外,其余基因座GD值均大于0.5。

表1 回族、仡佬族及苗族人群23個單拷貝Y-STR基因座的等位基因頻率分布

續表1 回族、仡佬族及苗族人群23個單拷貝Y-STR基因座的等位基因頻率分布
注:A代表等位基因;FH、FG、FM分別代表回族、仡佬族、苗族的基因頻率;null代表無效基因;下劃線表示多個等位基因模式。

表2 DYS385ab在回族人群的等位基因頻率分布
注:A代表等位基因;F代表基因頻率;下劃線表示2個以上等位基因模式。

表3 DYF387S1在回族人群的等位基因頻率分布
注:A代表等位基因;F代表基因頻率;下劃線表示2個以上等位基因模式。

表4 DYS385ab在仡佬族人群的等位基因頻率分布
注:A代表等位基因;F代表基因頻率;下劃線表示2個以上等位基因模式。

表5 DYF387S1在仡佬族人群的等位基因頻率分布
注:A代表等位基因;F代表基因頻率;下劃線表示2個以上等位基因模式。

表6 DYS385ab在苗族人群的等位基因頻率分布
注:A代表等位基因;F代表基因頻率;下劃線表示2個以上等位基因模式。

表7 DYF387S1在苗族人群的等位基因頻率分布
注:A代表等位基因;F代表基因頻率;下劃線表示2個以上等位基因模式。
2.23個人群與參考群體間的遺傳距離 通過AMOVA分析,16個人群間的遺傳距離在-0.000 1~0.212 0,相同民族間遺傳距離較小,而不同民族群體間遺傳距離普遍較大。其中河南回族與北京漢族群體間的遺傳距離最小(0.005)、與青海藏族群體間的遺傳距離最大(0.147);貴州仡佬族與重慶漢族群體間的遺傳距離最小(0.005),與青海藏族群體間的遺傳距離最大(0.157);貴州苗族與重慶漢族群體間的遺傳距離最小(-0.000 1),與青海藏族群體間的遺傳距離最大(0.185),見表8。

表8 16個人群Rst值遺傳距離矩陣
注:對稱軸上方為對應的P值,對稱軸下方為Rst值。
Y染色體為正常男性所特有,按遺傳方式的不同分為兩個區:擬常染色體區,約占5%,以類似常染色體的方式遺傳,減數分裂時可以發生交換;非重組區,約占95%,在減數分裂時與其他染色體不發生重組,以單倍型的形式由父親傳遞給兒子,呈父系遺傳[3]。由于其獨特的遺傳學特點,Y-STR可以解決常染色體STR無法解決的問題,如男女混合、多個男性混合樣本檢測及單親親權鑒定。Y-STR在減數分裂過程中不發生重組,序列的改變僅由突變引起,研究不同種族、民族和不同地域之間Y-STR遺傳多態性,對于了解人類的起源、遷移及重構父系進化歷史等方面有著重要的意義[4]。
評估Y-STR鑒別能力的指標是GD,對于連鎖的遺傳標記,不能采用乘積定律,需先計算單倍型頻率,再計算個人識別率[5]。本文27個Y-STR基因座多態性調查結果顯示,回族除DYS391基因座外,仡佬族和苗族除DYS391、DYS437、DYS438基因座外,其余基因座GD值均大于0.5,為高多態性遺傳標記,表明這些基因座在這3個人群中具有較好的遺傳多態性,適合法醫學應用。Y-STR基因座的多態性分布因種族、地域、民族的不同具有明顯的差異,不同地區和民族之間的差異,使得不同種群之間的基因頻率分布資料不宜混用,所以獲取各群體Y-STR基因座的等位基因頻率是必要且有意義的。
本研究對16個群體進行AMOVA分析,并獲得了Rst遺傳距離,結果顯示,河南回族與北京漢族群體間的遺傳距離最小(0.005)、與青海藏族群體間的遺傳距離最大(0.147);貴州仡佬族與重慶漢族群體間的遺傳距離最小(0.005)、與青海藏族群體間的遺傳距離最大(0.157);貴州苗族與重慶漢族群體間的遺傳距離最小(-0.000 1)、與青海藏族群體間遺傳距離最大(0.185)。此外,本研究發現:(1)同一民族的亞群體聚為一類,遺傳距離最小,但由于近代歷史中人口的遷徙和國界等地緣因素,即使是同一祖先的民族間依然具有一定差異,并且隨著隔離時間和地理距離而變化;(2)同一語系的民族遺傳距離也較小,而不同語系的民族表現為遺傳距離較大,漢藏語系的漢族和其他民族之間群體間的 AMOVA分析,差異有統計學意義(P<0.05)。 需要指出的是,在對各地人群Y-STR基因座的等位基因頻率資料收集的過程中發現,在法醫學發展比較好及其鄰近地區的Y-STR基因座資料比較全面,部分地區、部分民族的Y-STR基因座資料比較欠缺,并不能明顯反映出遺傳差異。因此,在法醫發展相對落后及部分民族群體中的遺傳學資料比較匱乏的地區,應該在調查研究中投入更大的精力,建立本地區、本民族的基因分布頻率資料,為法醫學應用和民族的起源、進化、遷徙研究提供相對科學的基礎數據[3-6]。
綜上所述,河南回族、貴州仡佬族和貴州苗族人群的27個Y-STR基因座的基因多態性普遍較高,適用于法醫學個體識別和親權關系中,為本地區構建該民族Y-STR數據庫奠定了基礎,對進一步的研究具有參考意義;本研究應用多種統計分析方法,對河南回族、貴州仡佬族、貴州苗族人群與其他13個群體的遺傳關系進行了分析,所得結果與各民族起源和遷徙史基本一致,進一步證實了這些民族的遺傳關系,為今后研究這些民族的起源、進化和遷徙史等人類遺傳學研究提供了基礎性數據。