林漢光,鄺文健,許傳超,唐劍頻 (廣東醫科大學法醫學系,廣東東莞 523808)
短串聯重復序列(STR)多態性高、信息量大,是目前法醫DNA 檢驗最常用的遺傳標記,廣泛應用于親權關系鑒定和個體識別。雜合度高、等位基因分布均衡、突變率較低的遺傳標記具有更高的法醫學應用價值;但STR 基因座在不同群體的等位基因分布及其突變率存在顯著差異,調查STR 的群體遺傳學數據,可為法醫學應用提供基礎。本研究對廣東東莞漢族群體的20 個STR 基因座的多態性和突變率進行統計分析,并探討廣東東莞漢族與其他地區漢族的遺傳學差異,為該地區漢族人群的法醫遺傳學及群體遺傳學研究提供依據。
根據知情同意權原則,用FTA 血樣采集卡采集東莞漢族群體無關個體3 337 人(男性1 699人,女性1 638人);1 865個家系,共計減數分裂3 703次。文獻獲取其他16 個群體的20 個STR 基因座數據:中國漢族、南方漢族、廣東漢族、韶關漢族、華東漢族、寧波漢族、太原漢族、淮安漢族、云南漢族、云南壯族、云南傣族、云南哈尼族、云南苗族、新疆哈薩克族、東北朝鮮族、沅陵土家族[1-14]。
1.2.1 DNA 提取與分型 應用Chelex 法提取各樣本的基因組 DNA;根據試劑盒操作說明,用PowerPlex?21 試劑盒(Promega 公司)復合擴增各基因組 DNA 以下 20 個 STR 基因座:D3S1358、D1S1656、D6S1043、D13S317、Penta E、D16S539、D18S51、D2S1338、CSF1PO、Penta D、TH01、vWA、D21S11、D7S820、D5S818、TPOX、D8S1179、D12S391、D19S433、FGA;擴增產物用ABI3130XL 遺傳分析儀(Thermo-Fisher Scientific 公司)檢測。
1.2.2 數據分析 采用Powerstates 軟件分析計算各基因座的等位基因頻率、隨機匹配概率(Pm)、個體識別概率(DP)、多態性信息量(PIC)、非父排除概率(PE)、雜合度(H)等遺傳學參數。采用直接計數法統計各基因座突變次數,并除以減數分裂次數計算突變率;利用二項分布法計算95% 可信區間(CI);用Arlequin v3.5 軟件分析群體間等位基因頻率分布差異,檢驗Hardy-Weinberg 平衡律。
本研究所有樣本均獲得良好的STR 分型,經檢驗,東莞漢族20 個STR 基因座基因型頻率分布均符合Hardy-Weinberg 平衡律。20 個STR 基因座的Pm介于0.014 0~0.217 0,DP 介于0.783 0~0.986 0,PIC介于0.544 8~0.906 0,PE 介于0.304 3~0.806 9,H 介于0.611 0~0.905 6,系統累積PE 和累積DP 分別達0.999 999 997 3和0.999 999 999 999 999 999 999 999 969,其遺傳學參數見表1。與我國其他地區16 個群體[1-14]比較,本群體等位基因頻率分布除與廣東漢族無明顯差異外,與其他群體比較差異均有統計學意義(P <0.05或0.01)。
20 個STR 基因座共觀察到84 次突變,其中81次1 步突變、2 次2 步突變、1 次3 步突變,見表2。所分析的群體中TH01 和TPOX 未觀察到突變,FGA 和D12S391 基因座的突變率較高。

表1 東莞漢族20 個STR 基因座遺傳學參數

表2 廣東東莞漢族20 個STR 基因座突變情況及突變率 (減數分裂n=3 703)
經過群體遺傳學調查,東莞漢族20 個STR 基因座中,D3S1358(16.1)、Penta E(12.2、18.2、24.4、25.4、28.3)、D18S51(16.1,21.3)、D2S1338(19.3,24.2)、CSF1PO(15.2)、Penta D(8.1,9.2,12.2)、TH01(9.1)、D21S11(28.3,35.1)、D7S820(12.1)、FGA(21.3)共10 個基因座上觀察到19 種等位基因在其他16 個群體均未見報道[1-14]。20 個STR 基因座的Pm 介于0.014 0~0.217 0,DP 介于0.783 0~0.986 0,PIC 介于0.544 8~0.9 060,PE 介于0.304 3~0.806 9,H 介于0.611 0~0.905 6。文獻認為DP≥0.9、H≥0.7 的基因座具有高鑒別能力[15]。本研究結果發現 TPOX、TH01、D3S1358 和CSF1PO 的DP<0.9、PE<0.5,其多態性和鑒別能力稍低,其中TPOX 的DP、H、PE 數值最低,與文獻報道其他漢族群體的數據相近[1-8]。其余16 個STR 基因座在東莞漢族群體均有較高的鑒別能力,其中Penta E 的Pm 值最小,DP、PIC、PE、H 數值最大,其鑒別能力最高。分析國內其他群體發現,該基因座在我國人群的遺傳學研究中的應用價值較高。本文結果發現,20 個STR 基因座所構成分型系統的累積非父排除概率和累積個體識別概率分別達0.999 999 997 3和0.999 999 999 999 999 999 999 999 969,說明20 個STR 基因座在東莞漢族群體中有較好的法醫學應用價值。
比較我國其他16 個群體的等位基因分布[1-14],結果顯示東莞漢族與廣東漢族等位基因頻率分布無明顯差異[3],與其他8 個漢族等位基因頻率分布的差異不顯著[1-2,4-9],與7 個少數民族均存在差異[10-14],其中與云南壯族和苗族、新疆哈薩克族、沅陵土家族的差異較大[10-12,14]。結果表明STR 的等位基因頻率分布具有一定的群體特異性,法醫學實踐進行匹配概率和父權指數等計算時,有必要采用本群體的頻率數據。
20 個STR 基因座84 次突變中,含81 次1 步突變、2 次2 步突變、1 次3 步突變,觀察結果遵循逐步突變模式。本研究觀測到2 次減數分裂同時在2 個基因座發生突變,與文獻報道中國漢族人群的數據相似[16]。本研究觀察到62 次父源性突變、11 次母源性突變、11 次來源未確定突變,父、母源性突變比率達5.6:1,高于國內大多群體[16,18-20]。東莞群體中FGA的突變率最高,其次為D12S391,分析結果與文獻報道的西南漢族群體相似[17],與南方漢族、廣東及其他群體存在差異[18-20]。結果說明,為STR 基因座更好地應用于法醫學實踐中,有必要研究不同群體的STR突變率。