孟 孟,張軼輪,李 敏,劉二珍,劉照俊,李成濤,沈星輝,邊英男
(1.哈爾濱醫科大學 組織學與胚胎學教研室,黑龍江 哈爾濱 150081;2.司法鑒定科學研究院 上海市法醫學重點實驗室 上海市司法鑒定專業技術服務平臺,上海 200063;3.內蒙古科技大學 包頭醫學院,內蒙古 包頭 0140603; 4.四川大學 華西基礎醫學與法醫學院,四川 成都 610041)
在Y 染色體上,除位于兩端的一小段擬常染色區(pseudoautosomal region, PAR)外,約95%的區域在減數分裂過程中不與X 染色體發生重組,因此稱為非重組區(non-recombining Y,NRY)或Y 特異性區(male-specific region,MSY),這些非重組區會一代一代由父親遺傳給兒子,具有高度的保守性和特異性[1]。基于這種特殊的遺傳方式,人類Y 染色體的多種遺傳標記被廣泛應用于與男性相關的司法實踐中,如男女混合斑檢驗、男性家系排查、大規模災難受害者的身份識別,以及父系溯源等,具有重要的法醫學應用價值[2]。
Y 染色體上有五類多態性遺傳標記,其中短串聯重復序列(short tandem repeats,STR)和單核苷酸多態性(single nucleotide polymorphism, SNP)是目前法醫學中被廣泛應用的兩類遺傳標記[3-4]。Y-STRs 是由2~6 個堿基作為核心區域串聯重復形成的一類具有長度多態性的DNA 序列, 重復次數基本在6~40 之間。核心區域的堿基結構和重復次數不同構成了Y-STRs 的遺傳多態性。 Y-SNPs 是基因組中特定部位單個堿基序列的變異而引起的DNA 序列多態性,表現為二等位基因、三等位基因或四等位基因,以二等位基因最常見,應用最廣。 Y-SNP 與YSTRs 相比具有極低的突變率(約為1/3×10-8),并且幾乎不會出現回復突變[5]。Y-SNPs 具有迭代累加的特性, 如當一個父系祖先的SNP 位點上發生了A突變,那么這個祖先的所有男性后代的SNP 位點上都會保留A 突變,若這個群體中的某一個體的SNP位點又發生了B 突變,則這一個體的所有男性后代將同時具有A 和B 突變。 Y-SNPs 上發生的突變隨著人類的遷移和繁衍, 逐漸擴散到世界的各個區域,這些突變遵循時間順序,因此Y-SNPs 可用來推斷共同父系生物地理祖先,追溯人類父系進化史[6]。基于Y-STRs 和Y-SNPs 的遺傳特點,本文將從混合斑檢測、親權鑒定、家系排查、個體識別及族源推斷這五個方面介紹Y 染色體在法醫學的應用。
Y 染色體在強奸案中混合斑男性成分的檢測,輪奸案中不同男性個體混合物的分析及少精子或無精子的混合斑中DNA 檢測具有重要作用[7]。 常染色體STR 由于易于分型及信息量豐富而被率先用于混合取證樣品的DNA 分析[8]。然而常染色體DNA分析存在以下弊端:(1)當分析混合有不同體液的樣本,如精液-陰道分泌物混合斑,唾液-陰道分泌物混合斑及其他同時含有男女DNA 成分的混合斑時,使用常染色體STR 分析常常不能得到完好的分型結果[9-11];(2)當混合斑中男性精子遠低于女性陰道上皮細胞成分時(比例為1∶25~1∶50),由于PCR的優勢擴增,常染色體STR 分型技術往往會掩蓋男性DNA,因此只能檢測到女性成分[12];(3)當精液樣本老化(取材時間>48 h)、精子拷貝數低、生物證據樣本發生污染或降解時亦無法獲得完整的常染色體STR 分型[13]。 Y 染色體特異性DNA 標記為男性所特有,PRINZ 等[14]報道了即使男女成分比例為1 ∶2 000 時,Y-STR 分型也不會受女性陰道上皮細胞的干擾。HANSON 等[15]開發了一種稱為Y 染色體靶向預擴增(Y-TPA)的系統,該系統通過巢式PCR方法預擴增多個Y-STR 基因座,擴增產物再通過使用市售的第二代Y-STR 擴增試劑盒如AmpFlSTR〇RYfiler〇RPlus kit 或PowerPlex〇RY23 System 進 一 步擴增,能從性交6~9 d 后收集的樣本中檢測到YSTRs 分型結果。
此外,Y-STR 分型在生物學上未檢測到精子的性侵犯案件(手指插入或陰莖插入但犯罪者為少精癥或無精癥)中也能檢出陽性結果。 2012 年,TRABUIO[16]使用Yfiler 試劑盒檢測在手指插入和陰莖插入但沒有檢測到精子的外陰拭子中,發現大約三分之一的外陰拭子產生陽性結果(3~17 個等位基因)。 在陰莖插入12 h 內采集的外陰拭子中大約40%可檢出六個或更多等位基因的Y-STR 譜,但在12 h 和24 h 之間檢測的三個樣品中只有一個成功獲得類似的分型結果。 該研究結果認為,在類似的性侵案件中,應在性侵發生后的12 h 內采集外陰拭子樣本。 2015 年,MCDONALD 等[17]用Yfiler 試劑盒檢測來自47 例手指和/或陰莖插入案件的樣本,而這些案件均是在事件發生后48 h 內進行的體檢,并且在精子洗脫后未檢測到精子。 在這些樣本中,30%至少產生一個Y-STR 分型, 每個分型包含三個或更多的等位基因,21%至少產生一個Y-STR分型,每個分型包含十個或更多的等位基因。 這項研究將該類案件中采集樣本的建議時限從12 h 增加至48 h[18]。
通過Y-STR 分型技術可以從混合斑中鑒定男性成分,同時對于多個體來源的混合斑的個體識別,亦有明顯的使用價值。 有研究報道通過將常染色體試 劑 盒AmpF?STR〇RNGMSElectTM分 別 與 包 含23位點的Y-STR 試劑盒PowerPlex Y23 和17 位點的Yfiler 試劑盒結合分析的方法,發現Y-STR 分型結果為最終結果的判定增加了高達21%的額外信息量,使用Y 染色體分析檢測到多個男性成分的可能性大約是僅僅使用常染色體STR 分析的三倍[19]。 類似的結果在PURRS 等[20]的一項研究中也報道過。2014 年,HAN 等[21]報道采用激光捕獲顯微切片技術(LCM)和低體積PCR 技術(LV-PCR)可以實現對3供體來源的精子進行分離和檢測。
親權鑒定是指利用人類基因組中具有多態性的遺傳標記,對兩份或多份檢材的身源者是否存在某種親緣關系進行鑒定。常染色體STR 基因座是目前親權鑒定運用最廣泛的遺傳標記[22],而Y-STR 基因座的差異可以證明非親子關系,具有比常染色體基因座更高的排除概率[23]。 例如要判斷一男孩與其已死亡的假定父親是否有血緣關系,由于無法獲得該假定父親的遺傳信息,則無法通過常染色體檢測來做父權鑒定,此時只要獲得該父親的任一男性親屬的Y 染色體STR 分型,就可以判斷該男孩與該死亡假定父親的親緣關系。這是因為Y 染色體呈絕對的單倍型遺傳,那么該假定父親與其男性親屬享有共同的單倍型,進而通過鑒定Y-STR 單倍型是否匹配來判斷該男孩與該已亡父親的生物學關系[24-25]。由于Y 染色體獨特的父系遺傳的方式,可在某些親權鑒定或其他父系血緣關系的鑒定中作為補充鑒定的遺傳標記使用[26-27]。 一個三聯體鑒定的案例報道表明,當出現1~2 個常染色體基因座不符合遺傳規律時,若被檢胎兒為男性,而此時又能確定該被檢父與孩子的生父來自不同父系,應盡可能增加Y-STR 的檢驗[28]。 在另一例全同胞兄弟關系涉及同一父系鑒定的案例表明,通過常染色檢測計算出的累積全同胞關系指數即使達到認定標準,亦可通過增加檢測Y-STR 而使結論更可靠,若YSTR 檢測有分型不一致的基因座,可進一步檢測Y-SNP 而判斷其是否來自同一家系[29]。 總之,補充檢測Y- SNP 同樣能夠為親權鑒定提供有效信息。
家系排查是指將從案發現場提取的生物檢材中獲得的嫌疑人的Y-STR 分型與某一地區的YSTR 數據庫進行比對,找到與嫌疑人存在親緣關系的家系。人類Y 染色體為男性特有,呈父系、連鎖單倍型遺傳, 故同一家族中男性個體的Y-STR 分型結果理論上完全一致(除非突變),這使Y-STR 家系排查法在眾多重大案件偵破中彰顯了其獨特價值。2016 年,我國警方就是通過Y-STR 單倍型進行家系排查成功破獲特大連環謀殺案-白銀案[30]。 目前,全國多個省市、地區,已經建立一定規模的YSTR 數據庫。 然而,Y-STR 基因座的突變給家系排查帶來問題,特別是當前檢驗的Y-STR 基因座數量日益增多,并且包含較多高突變率Y-STR 基因座的情況下更易凸顯。
Y-STR 基因座突變率不同,常用的Y-STR 基因座的突變率多在2‰~3‰左右。 2010 年,BALLANTYNE 等[31]對186 個Y-STR 基因座進行了研究,在2 000 多對父子樣本共352 999 次減數分裂中,共觀測到在120 個基因座上的924 次突變,得出所有基因座每代的突變率變化范圍從3.78×10-4到7.44×10-2。 張廣峰等[32]比較了三種不同的Y-STR 分型體系(Yfiler、Y filerR〇Plus、快速突變Y-STRs)在家系遺傳過程中所展現出的變異程度,家系中兩名男性個體相隔10 次減數分裂時,其中Yfiler、Y filerR〇Plus、快速突變Y-STR 單倍型不一致的概率分別為7.35 %、91.2 %、100 %。 結果顯示同一家系不同男性個體的Y-STR 單倍型具有一定的多樣性,并且與Y-STR 單倍型包含的基因座數量和基因座突變率有關。 這提示包含不同Y-STR 基因座組合的Y-STR 單倍型在世代遺傳過程中的變化程度差異較大,在親權鑒定和家系排查過程中, 檢測到的Y-STR 分型體系中若包含快速突變基因座時,應注意其發生突變的情況,有時還會存在兩步甚至多步突變,因此不要輕易認定其來自不同家系。
插入/缺失(Insertion/Deletion,InDel)和SNP 為二等位基因,具有擴增片段短、突變率低的優點,然而大部分SNP 分型技術對設備要求較高,耗費較大,劉亞舉等[33]建議將Y 染色體InDel 位點和YSTR 融合為同一熒光復合擴增系統,以此來規避家系排查中Y-STR 突變的問題。 為了滿足國內Y染色體數據庫建設規范和需求,各公司紛紛推出針對中國人群的試劑盒。 閱微基因推出了一款MicroreaderTMY Prime Plus ID System[34],該試劑盒利用成熟的6 色熒光標記技術,對37 個常用Y 染色體STR 基因座、1 個國人特有的Y-Indel 進行復合擴增。 2018 年,Thermo Fisher 公司推出了一款新型Y 染色體建庫試劑盒-Yfiler Platinum PCR 擴增試劑盒[35]。 該試劑盒包含38 個Y-STR 和3 個適合中國人群的Y-Indel,單倍型識別能力更高。3 個YIndel 位點可以幫助進行初步篩選,在家系調查中,3個Y-Indel 位點如果有一個不匹配,就可以判斷這兩個圖譜來自不同家系,這個結果也可以用來檢查家系調查是否準確。 如果3 個Y-Indel 均相同,接下來就可以通過其他Y-STR 位點進行進一步篩選。LIU 等[36]基于我國國內的Y-STR 數據庫進行分析,建議對于Yfiler 試劑盒檢測出的不匹配基因座個數,小于等于2 時認為兩名個體來源于同一家系的可能性大;對于YfilerR〇Plus 試劑盒檢測出不匹配基因座的數目小于等于4 時,認為這兩個圖譜有較大可能來自于同一家系。
綜上,利用Y-STR 基因座進行父系親權鑒定和男性嫌疑人的家系排查,當Y 染色體基因分型并不完全一致時,即使有2 個Y-STR 基因座分型不同,也不要輕易排除其來源于同一父系家系的可能[37]。Y-STR 家系排查法能有效縮小案件排查范圍,但并不能實現個體識別,對罪犯的最終確定還要運用常染色體STR 檢測,同時可通過ABO 血型等多種方法綜合判斷[38]。
現主流商業Y-STR 試劑盒有AmpFLSTRR〇YfilerR〇PCR Amplification PCR 擴增試劑盒,GoldeneyeR〇DNA 身份鑒定系統30Y 等。然而這些Y 染色體試劑盒在屬于同一父系的個體間的區分能力上存在局限性。 BALLANTYNE 等[31]在2010 年集中觀察了186 個Y-STR 基因座的突變率,將13 個突變率(11.9‰~77.3‰)明顯高于其他的基因座(DYF387S1,DYF399S1,DYF403S1a/b,DYF404S1,DYS449,DYS 518,DYS526b,DYS547,DYS570,DYS576,DYS612,DYS626和DYS627)命名為快速突變Y-STRs(Rapid-Mutating Y-STRs, RM Y-STRs)基因座。其中93%的Y-STRs 突變率在1×10-4和1×10-3之間,而RM Y-STRs 突變率多在1.19×10-2和7.73×10-2之間。2012 年,BALLANTYNE 等[39]對604 個來自全球51個人群的無關男性樣本進行分析,區分開98.5%的男性,同時證明了RM Y-STR 能夠提供更高的單倍型多樣性和分辨能力(全球604 個男性中僅8 個男性共享了3 種單倍型),而在此樣本中用含有17 個Y-STR 的Yfiler 試劑盒檢測時,結果為85 個男性共享33 個單倍型。 2014 年,BALLANTYNE 等[40]用13 個RM Y-STR 對超過2 500 對父子對進行個體鑒別,鑒別率可達到29%。2016 年,ADNAN 等[41]收集了572 名屬于99 個2~4 代家系的巴基斯坦男性樣本,45%的二階親屬(祖孫、叔侄、半同胞)等可以被13 個RM Y-STR 標記中的一個或多個進行區分,而Yfiler 試劑盒對應的區分力則為14.7%。 同年,我國ZHANG 等[42]用13 個RM Y-STR 成功將1 034 個父子對中的18.96%區別開。
由此可見,RM Y-STR 提高了同一父系遺傳男性個體間的區分能力。 據此,RM Y-STR 組合無論在多態性還是個體識別能力方面均明顯強于目前常用的Yfiler 系統。 2016年,Thermo Fisher Scientific 公司[43]推出了27 個基因座的Yfiler〇RPlus 六色熒光標記復合擴增試劑盒, 其中加入了7 個快速突變的Y-STR基 因 座(DYF387S1a/b,DYS449,DYS518,DYS570,DYS576,DYS627)。 OLOFSON 等[44]用Yfiler〇RPlus試劑盒檢測551 名男性樣本并與Yfiler 試劑盒作比較,由于引入了7 個快速突變基因座,具有更高的個人識別能力,而由于RM Y-STR 基因座突變率較高,對親緣關系的鑒定上Yfiler〇RPlus 試劑盒的效能就相對較弱。 Y-SNP 由于擴增片段短, 在降解DNA 中亦可獲得較完整分型,故將Y-SNP 與YSTR 分型結果結合,可應用在來自不同地理區域的人員參與的大規模災難如飛機墜毀、海嘯或恐怖襲擊的個體識別案件中[45]。
Y 染色體由于其嚴格的父系遺傳特性而被認為是研究全球男性智人的遷徙歷史的最佳來源[6]。如前所述,與常染色體和X 染色體不同,Y 染色體95 %非重組區的信息能完整保存并遺傳給下一代[46]。 在人類進化中,一些穩定的突變如Y-SNP 在Y 染色體上累積,并且由于其非重組特征而永久連鎖遺傳。 因此,這些突變可用來追溯后代的共同父系祖先。 如果在某些雄性個體中發現相同的突變,這些突變就構成了一種單倍型[47]。 群體之間差異最大的遺傳物質是Y 染色體單倍群,全世界的Y 染色體單倍群構成了一個劃分不同人群的譜系[48]。 目前,人類學及考古學等不同領域研究人類起源、人口的遷移路線及混合比例中均存在一些一致性看法,例如三類基因組(常染色體、線粒體和Y 染色體)均指出,現代人起源于東非[49-51]。同時,從Y 染色體單倍群也可以看到非洲國家的高單倍型多樣性[52-53]。
2002 年,國際Y 染色體命名委員會(Y Chromosome Consortium, YCC)發表了第一個統一命名的系統發育染色體圖。2003 年,Y-DNA 系統發育圖出現在Mark A. Jobling 和Chris Tyler-Smith 的文章上[6]。該系統發育圖以245 個Y-SNP 為基礎,展示了153個單倍群之間的關系,并把全世界的Y-SNP 類型分為代號為A-T 的20 種主干單倍群,Y 染色體的根部類群是A 型,僅存在于非洲,其次是B 型,也在非洲,C 以后的單倍群(C-T)是從B 分化出來的[6]。所以從Y 染色體看,現代人起源于非洲。 2005 年,家譜DNA 公司創建了Y 染色體系統發育樹。同年,國際基因家譜學會(ISOGG,https∶//isogg.org/tree/index.html)成立,其創建的Y 染色體樹的列表可以通過上傳數據后而不斷被更新。 2008 年,KARAFET等[54]報道了一個修訂的Y 染色體樹,含有600 個Y-SNP 標記,包含311 個不同的單倍群。2011年,ZHONG 等[55]和YAN 等[56]指出O-M175、C-M130、D-M174 和N-M231 是東亞4 個主要單倍群,約占東亞全部男性的93%。 而O-M175 是東亞最大的單倍群,近75%的中國人及超過50%的日本人都可以歸到這一類型下,O1a-M119、O2-M268 及O3-M122 是O-M175 分出3 個主要的下游單倍群。 隨著Y 染色體樹的不斷更新和修訂,2018 年,O2-M268 和O3-M122 在ISOGG 中分別被修正為O1b和O2[57]。
自20 世紀90 年代以來,人類學界爭論最激烈的話題是東亞地區現代人的起源問題。 2001 年,KE等[58]對來自東南亞、大洋洲、西伯利亞和中亞的163個人群的12 127 例男性樣本進行了3 個Y-SNP 的突變檢測:YAP(Alu 序列插入)、M89(C→T 突變)、M130(C→T 突變)。 結果顯示一萬多分樣品都攜帶的這3 種突變型中的一個。 而這3 個突變型均來自約3.5 ~8.9 萬年前起源于非洲的另一個突變-M168T[59]。從父系角度看,現存的東亞人群都是走出非洲的后裔,是支持現代人非洲單一起源的強有力的遺傳證據。 現代人到達東亞后的遷徙路線也是當時的研究熱點之一。 1999 年,SU 等[60]通過19 個YSNP 來研究東亞人群,研究結果顯示東亞南方人群比北方人群的多態性更加顯著,北方人群只擁有南方人群單倍型的子集,認為東亞地區現代人起源于非洲,而后從南方進入東亞,遷移至北方。 2005 年,SHI 等[61]對東亞多個O3 樣本進行了更系統的研究,也發現南方群體中的O3-M122 的多樣性高于北方,支持O3-M122 的南方起源。2006 年,XUE 等[62]使用貝葉斯全似然法對中國、蒙古、韓國和日本的27 個群體近1 000 份樣本的45 個Y-SNP 和16 個Y-STR 位點進行分析, 發現東亞北方群體的基因多樣性要高于南方。 但SHI 等[63]認為這種北方高于南方的多樣性是由于近期的人群混合所造成,同時由于長期地理隔離所造成的群體內部的瓶頸效應對基因多樣性的估算也有較大影響。
目前廣泛使用的專用Y-SNP 基因分型方法,主要基于毛細管電泳和SNaPshot 單堿基延伸原理,僅能夠對數十個SNP 進行平行分析[64-65]。 有很多報道使用PCR 擴增開發了幾種多重基因分型系統以確定Y-SNP 單倍群[66-67]。 然而,除了程序耗時,分析基因座的數量也是有限的,從而限制了Y-SNP 單倍群樹的分辨率。 基于大規模平行測序(massively parallel sequencing,MPS )的下一代測序(next generation sequencing,NGS )技術具有從多個樣品中對數百至數千個SNP 進行基因分型的能力,在單個實驗運行中具有高覆蓋度[68]。 迄今為止,兩種主要的NGS 系 統,Ion Personal Genome Machine (PGM)(Thermo Fisher Scientific Inc., Waltham, MA, USA)和MiSeq (Illumina Inc., San Diego, CA, USA)普遍分布于法醫實驗室[69-70]。MPS 通過有限的DNA 資源實現高分辨率Y 染色體單倍群劃分,成為了人類法醫學研究的新寵兒。 2015 年,RALF 等[71]利用Ion Torrent PGM 平臺對530 個Y-SNP 進行平行基因分型,該平臺能夠對432 個全球Y 單倍群進行分類,涵蓋了整個Y 樹的分支。 2017 年,QIAN 等[72]和GAO 等[73]將二代測序(NGS)、毛細管電泳和焦磷酸測序技術結合為“NGS+”,設計了針對中國人群的74Y-SNP MPS 系統, 將100 個來自四川漢族人群區分到18 個單倍群,這個新的Y-SNP 單倍群樹幾乎涵蓋所有中國Y 單倍群,可用于中國人群的單倍群劃分。 課題組同時開發了一種新數據驅動決策規則-FSindex, 用于估計每個檢索到的譜系的可能性, 并能夠從錯配的Y-STR 單倍型中正確鑒定譜系。 2018 年,WANG M 等[74]又根據之前的研究設計了一個包括165 個Y-SNP 的MPS 系統,用ION S5 XL 系統分析了測序性能、靈敏度及基于MPS-SNP對案例類型樣本的分析能力。 結果顯示,只有4 個Y-SNP 呈現缺失的基因型, 并且5 個SNP 傾向于被指定為雜合子,而其他SNP 的結果與從其他YSNP 分型工具獲得的結果完全一致。 這個MPS YSNP 系統提供了一個便捷的從樣本到單倍群的工作流程, 有利于父系譜系分類和法醫譜系搜索,為MPS 技術在SNP 分析中的應用提供了支持。
Y 染色體遺傳標記由于其獨特的遺傳特性而在法醫實踐中具有很大的應用潛力。 同時,Y 染色體遺傳標記亦面臨著現實的挑戰,比如家系排查過程中,由于STR 和SNP 復合單倍型仍處于前期探索階段,其準確率在不同研究中有較大的差異,因此要應用于實踐仍需針對特定的區域和人群做詳細的研究,從而推進STR 和SNP 復合單倍型進一步解決家系精準定位的問題。隨著Y 染色體單倍群進化樹將不斷被完善,將人類學研究中的族源推斷應用于司法實踐中,可為縮小嫌疑人的排查范圍提供線索。 此外,多拷貝Y-STR、新型Y 染色體遺傳標記的篩選、混合斑男性成分的檢測,不同男性個體混合物的分析等相關研究都是目前法醫學研究上的熱點,這些方向的研究進展也將極大促進其在司法實踐中的應用。