郭屹凡,熊林威,張苗爽,李競一
(華中農業大學,湖北武漢 430070)
家雞的快慢羽基因是一對位于Z 染色體上的等位基因,由于其伴性遺傳的特點,可以用于商品雞出雛時鑒別雌雄,避免通過翻肛的方式來進行性別鑒定。翻肛不僅耗時費力,還需要一定的技術要求和經驗,同時還會對幼雛造成應激[1],而快慢羽鑒別雌雄技術難度較低,所以被廣泛使用。對于家禽育種工作來說,在慢羽純系的培育過程中,需要使用測交來區分慢羽純合子與雜合子公雞,因此,尋找合適的分子檢測手段來區分慢羽純合與雜合,不僅可以代替繁瑣的測交過程,也可以節約育種的時間與成本,對家禽行業具有重要意義。
2008 年,Elferink 等[2]研究表明,K*K 基因為Z 染色體上的一大段串聯重復,重復由PRLR 和SPEF2 基因之間的基因間區、兩個基因的部分重復以及其融合基因(dSPEF2-dPRLR)構成,白少川等[3]也發現了PRLR 和dPRLR 分別與dSPEF2和SPEF2 的5’ 末端以“頭碰頭” 方式連接。
Elferink 等[2]最先設計了兩種引物用于判斷慢羽雜合與純合基因型,即通過定量檢測基因組上融合基因dSPEF2/dPRLR 拷貝數的差異,使用熒光定量PCR 的方法,根據拷貝數差異判斷純合型與雜合型。然而此方法雖然理論上能用來判斷慢羽的純合型與雜合型,但并不能保證定量檢測出來的拷貝數都為0 或1,往往會出現0.5 等數據難以判斷其基因型,即檢出率不高。羅成龍等[4]利用SNP 數據庫中的137 個SNP 在欣華雞的Z染色體上進行了關聯研究,其中兩個SNP(Gal-Gal6,chrZ:10238838bp 和chrZ:11247500bp)與羽毛表型顯著相關,但并未在其他我國地方雞群體中驗證其關聯性。2014 年,韓文朋等[5]發明了一種快慢羽基因型鑒別方法,對重復片段下游約390kb 處一個SNP 位點(GalGal6,chrZ:11139133bp)設計了一對引物進行PCR,使用Taq Ⅰ內切酶對擴增產物進行酶切,通過檢測酶切后的片段長度由此判斷基因型,但該方法也未在我國地方雞群體中驗證其適用性。總的來說,現在的快慢羽檢測方法均有一些缺點,因此,本研究旨在利用公開數據庫中全基因組數據開發新的能在全球各品系中準確區分快慢羽基因型的檢測方法。
在本研究中,筆者從全基因組數據中尋找出與K*K 或K*N 連鎖程度較高的分子遺傳標記,對篩選出的關聯SNP 利用KASP 法在我國地方雞群體中檢測其基因型與快慢羽的關聯性,預期開發對快慢羽基因型進行檢測的新方法,為快慢羽的標記輔助選擇提供技術支持。
試驗選擇湖北孝感安陸市欣華生態畜牧有限公司的496 只蘆花母雞和湖北荊門京山市神地農業科貿有限公司的179 只黑羽公雞,根據這些公雞與黑羽母雞隨機交配的結果,通過后代雛雞的性別(翻肛鑒別)以及快慢羽表型對其快慢羽基因型進行反推。
試驗使用1.5mL 含檸檬酸鈉抗凝劑的離心管進行血樣收集,每只雞使用采血針在翅中采集血液200μL 與15μL 4%濃度的檸檬酸鈉充分混勻后放入冰盒中保存至實驗室。使用DNeasy Blood and Tissue 試劑盒(QIAGEN)提取所需樣本的DNA。
以提取的DNA 為模板,將配制好的反應體系(表1)放入PCR 儀中進行反應,預變性94℃5min,第一輪循環14 次(變性94℃15s,退火68℃15s,且每次循環溫度降低1℃,延伸72℃30s),第二輪循環25 次(變性94℃15s,退 火55℃15s,延 伸72℃30s),終延伸72℃5min。體系所用引物見表2。每批次的檢測均附加慢羽對照和快羽對照以及陰性對照(空白對照)。反應完成后使用1.5%瓊脂糖凝膠電泳觀察成像。

表1 10μL PCR 體系
1.4.1 生物信息學分析
對本實驗室前期采集自保種場的20 只洪山雞和19 只鄖陽大雞血樣所提取的DNA 進行基因組重測序,并從NCBI 的SRA 數據庫中下載了1136 個家雞個體的基因組重測序數據,所有1175 個測序反應均使用Illumina 平臺。對測序結果利用BWA[6](比對至GalGal6 參考基因組)、SAMtools[7]、GATK[8]、Lumpy[9]、IGV、VCFtools等軟件進行生物信息學分析。
使用vcftools 工具合并gatk(SNP)與lumpy(SV)的結果文件,分為W 染色體上的區間(4989932~5160560)和Z 染色體上的區間(10111794~11300060),其中分析的Z 染色體范圍為快慢羽基因上下游共1.2Mb 區間。
1.4.2 W 與Z 染色體測序深度比值及性別分析
通過gatk 結果文件判斷其在上述對應區間的測序深度,公雞在W 上的區段理論測序深度為0,母雞W 和Z 測序深度比值理論為1∶1。根據測序深度結果,將W 染色體的測序深度與W 和Z 染色體測序深度之和的比值作為判定依據。如果值小于0.01,判定為公雞;值在0.4~0.6 判定為母雞,刪除比值位于上述區間外的個體。
1.4.3 快慢羽關聯分子標記的篩選
將上一步得到的結果文件中的純合突變型賦值為1,雜合子賦值為0.5,純合野生型賦值為0,無法判斷的個體用 “.” 表示。然后使用以下公式計算得到每個SNP 的absAFdif(等位基因頻率差異的絕對值)值=(“快羽母雞+快羽公雞*2” 的基因頻率-“慢羽母雞+慢羽公雞*2” 的基因頻率)。上述公式中,“快羽母雞” “快羽公雞” “慢羽母雞” “慢羽公雞” 被代入對應樣本賦值(1,0.5 或0)進行求和作為分子;樣本總數(同樣是公雞乘以2)減去基因型無法判斷的個體數作為分母;兩者相除得到基因頻率;最后通過兩個基因頻率的相減并取絕對值得到absAFdif。之所以將公雞乘以2 是因為公雞的Z 染色體數量為母雞的2 倍。每個SNP 位點的absAFdif 為一個0~1 的值,值越接近1 則該分子標記與K 基因關聯度越高。
1.4.4 lumpy 基因分型結果的校正
因為lumpy 軟件無法準確區分公雞的慢羽純合與雜合,因此,我們使用igv 查看了172 個個體的原始bam 文件,以獲得快慢羽重復片段上下游連接區域的read 數量,K*K 純合子個體的read比對到參考基因組上時,來自重復片段中間接頭的read 跟重復片段上游接頭和下游接頭的read 三者的理論比例是1∶1∶1,所以中間read 與上下游read 的比例應為1∶2。對于雜合子來說這個比例為1∶4。當比值在1∶2.5~1∶3.5 時無法準確判斷其基因型,將其排除。
1.4.5 測序深度質控
在上述lumpy 基因分型結果校正過程中,我們發現51 個lumpy 結果顯示為快羽公雞中有8個樣本含有重復片段,即lumpy 判斷的結果存在誤差,我們懷疑這些誤差可能與測序深度較低有關,于是我們去除了測序深度低于5 的個體。
根據LGC Genomics 公司開發的KASP 基因分型技術[10],按表3 配制好體系后置于CFX384實時定量PCR 儀中進行反應,預變性94℃15min,第一輪循環9 次(變性94℃20s,退火延伸61℃60s,且每次循環退火溫度降低1℃),第二輪循環25 次(變性94℃20s,退火延伸55℃60s),終延伸72℃60s,然后儀器記錄熒光量,每個樣本設置兩個重復。根據預實驗的結果篩選出來的KASP 引物見表4。

表4 針對兩個候選快慢羽關聯SNP 的KASP基因分型引物序列
結合179 只公雞的血樣提取DNA 后進行PCR 基因分型得到的凝膠電泳成像結果以及后代反推的基因型結果,得到互相吻合的慢羽純合32個,慢羽雜合89 個,快羽31 個,共142 個。496 只母雞的血樣提取DNA 后進行PCR 基因分型得到凝膠電泳成像結果,其中慢羽189 個,快羽274 個,無結果33 個。
共選用1175 個個體,排除216 個個體(9 個無法判斷性別的個體,185 個測序深度低于閾值的個體以及26 個無法判斷基因型的個體)后,剩余357 個快羽母雞個體,414 個慢羽母雞個體,80 個快羽公雞個體,107 個慢羽公雞個體,在重復片段上游500kb 到重復片段下游500kb 的區間內篩選出的12079 個分子標記。
在獲得基因分型結果后我們沒有對全基因組數據進行filter,目的是保證關聯程度較高的突變不會因為質控被篩除掉,但由圖1 可知,雖然排名前三個體(灰色部分)的absAFdif 值更高,但其錯誤率高達98%以上,即幾乎所有樣本都無法獲得該位點的基因型,所以我們將它們排除掉,選擇了圖1 亮黃色部分absAFdif 值的8 個SNP 作為最初候選標記。在本研究的地方雞群體中對這些候選標記進行預實驗后,最終確定了2 個SNP位點作為候選分子標記(圖1 亮黃色部分中absAFdif 值排名第1 和第3,均位于K*K 重復片段的內部,以下簡稱為SNP1 與SNP3)。根據預試驗結果,由于這兩個SNP 在母雞群體中沒有多態性,所以后續研究僅針對公雞樣本。

圖1 959 個個體重測序數據的Z 染色體基因型分析結果與分析
由圖2 結果可知,SNP1 位點(chrZ:10706144bp)的KASP 結果相較于SNP3 位點(chrZ:10706643bp),其區域分離更為明顯,檢出率更高,重復性更好,然后我們將其中部分樣本進行校準后得到結果見圖2b。

圖2 針對兩個候選快慢羽關聯SNP 的KASP基因分型結果
此次KASP 共檢測了142 個個體,篩除無法判定(undifined)個體和無結果(no call)個體,獲得了確定基因型結果的有129 個,檢出率為91%。其中結果與已知快慢羽基因型相匹配的個體有100 個(77.52%),即利用SNP1。根據測交結果把142 個公雞個體分為3 類,其中18 個快羽純合個體有15 個吻合,其余3 個的KASP 結果為雜合子,準確率83.3%;其中30 個慢羽純合個體有21 個吻合,其余2 個的KASP 結果為快羽純合子、7 個為雜合子,準確率為70%;其中81 個雜合子個體有64 個吻合,其余6 個的KASP 結果為快羽純合子、11 個為慢羽純合子,準確率為79%。
我們從1.19Mb 的區間中找到了12079 個突變,由于結合了gatk 和lumpy 軟件的結果,且沒有使用任何針對突變的質控手段,所以理論上應該包含該區間內所有可能的突變(在一千多個世界主流的蛋雞、肉雞、地方雞、觀賞雞、紅原雞范圍內)。而且為了提高結果的可信度,將性別判斷、快慢羽基因型判斷可靠度不高以及測序深度不高的個體盡量排除。但結果顯示,關聯度最高的突變僅為0.68(即SNP1,位于重復片段內部),筆者嘗試從進化的角度解釋慢羽突變與周圍突變關聯度不高的原因,上述所有突變可被分為兩類,一是位于重復片段外部,二是位于重復片段內部。前者可能在K*K 突變形成之初與K*K緊密關聯,但由于K*K 在全球范圍內的廣泛應用,通過大量重組事件的積累,以至于我們檢測不到緊密關聯的突變。而重復片段內部的突變可能也會受重組的影響,即K*K 其中某一個拷貝與K*N 之間的重組,從而使K*K 的兩個拷貝之間存在多態性,關聯程度降低,如ev21 插入僅存在于其中一個拷貝[11];也可能在K*K 突變形成之初,這兩個拷貝就存在著多態性,即K*K 的串聯重復片段來自于非同源的片段插入而不是同一拷貝的重復,一個相關的線索來自于轉座子的插入可能引起基因組的重復[12],這意味著可能是ev21 的插入引起的K*K 重復片段,而不是反過來。如果K*K 內部發生過重組,則可以對兩個拷貝內部的突變分別進行分析,以找到重組發生的位置,有助于我們篩選可用的分子標記。但在二代測序的數據中難以區分重復片段內的突變來自于兩個拷貝的哪一個,長讀長測序技術可能解決該問題。還有一種可能,K*K 突變是多來源的,該突變并不一定只發生了一次,這樣所有K*K 等位基因之間一開始就充斥著多態性。
距離慢羽基因被第一次報道已經超過了100年[13],恐難以再對K*K 形成之初的情景進行還原。但本研究結果至少說明了在K*K 重復片段的內部和周圍,在全球各種快慢羽品系中都與之緊密關聯的分子標記是不存在的,下一步需要在更小范圍的樣本中搜索可用的分子標記,如我國的黃羽肉雞、優質蛋雞等。如本研究在2 個不同品種的我國地方雞群體(179 只公雞與496 只母雞)驗證了數個SNP,其與快慢羽的關聯程度都不是太高。但不排除其實在各自群體中存在連鎖程度很高的突變,只能通過對該品種內(而不是中外各個雞種)進行基因組層面的篩選才能發現。本研究計算了羅成龍等[4]和韓文朋等[5]在各自實驗群體中檢測出來快慢羽關聯SNP 在本研究中959 個全基因組測序樣本中的absAFdif 值,分別為0.086774(galGal6,chrZ:10238838bp),0.294473(galGal6,chrZ:11247500bp)和0.336827(gal-Gal6,chrZ:11139133bp),雖然這些SNP 的absAFdif 值不高,但這些研究利用上述SNP 在各自群體中檢測快慢羽基因型的結果都較為準確,意味著需要在親緣關系較近的群體內部搜索關聯程度高的突變。從進化角度講可能性是很高的,因為同一個品種內的所有K*K 等位基因的共同祖先可能并不是那么久遠,也就是說重組事件發生的相對較少,如可能是數十年前由某個國外品種導入了慢羽基因,因為國外雞種對我國本地雞種基因滲入的事件常有發生[14]。
本研究的KASP 結果顯示,利用SNP1 檢測公雞快慢羽基因型的準確率為77.52%,而具體來看,對快羽純合個體檢測的準確率較高,而對慢羽雜合和慢羽純合的檢測準確率略低。后者正是實際育種工作中需要的準確率,因此,該SNP 尚不能滿足實際生產需要。但本研究所采用的KASP 基因分型新方法確實具有耗時短、通量大、檢出率高等優點。
總的來說,本研究通過前沿的基因組與生物信息技術,以及充分利用共享資源數據、新興檢測技術來服務育種實踐思路具有廣闊的前景,也響應了習總書記對 “解決農業 ‘卡脖子’ 問題”的號召,并加快實施農業生物育種科技項目,早日實現重要農產品的種源自主可控。
本研究對1175 個樣本進行生物信息學分析,獲得超過1.2 萬個突變位點,并從中篩選出與重復片段關聯程度最高的8 個SNP 位點,進一步通過預試驗確定了2 個檢測效果最理想的SNP 位點后,通過142 羽公雞樣本得到1 個效果最好的分子標記SNP 位點(位于Z 染色體10706144bp處)。與這些公雞的測交結果相比,基因型吻合的個體比率為77.5%。該準確率距離實際育種工作中的要求還有一定差距,我們將繼續改進分子標記的篩選范圍,從而尋找到品種特異的更合適的分子標記。