馬 偉, 孫志勇, 劉 陽, 徐 強, 楊小麗, 陳思怡, 李培富
(寧夏大學農學院/寧夏優勢特色作物現代分子育種重點實驗室, 銀川 750021)
隨著生活質量的提高,人們對稻米品質的要求也越來越高,亟需培育出更加優質的水稻新品種滿足市場需求。蛋白質作為稻米中含量僅次于淀粉的第二大干物質,一般含量在8%左右,對稻米的外觀品質、加工品質和食味品質都有很大影響[1]。因此,通過分子輔助標記方法挖掘出與稻米蛋白質含量相關的基因,對稻米品質改良具有重要意義。
分子輔助標記方法在植物分子育種中被廣泛應用。奉杰等[2]以玉米骨干自交系ZNC442和SCML0849為親本構建的131份F2∶3家系為材料,基于簡化基因組測序方法對該群體進行基因型鑒定,利用ICIM軟件的完備區間作圖法對粒長、粒寬、百粒重等性狀進行QTL定位,定位到23個與粒長相關QTLs,29個與粒寬相關QTLs,20個與百粒重相關QTLs。彭強等[3]以V20B/CPSLO17遺傳背景衍生的150份重組自交家系作為作圖群體,在3種環境下分別進行糙米粒重性狀QTL檢測及其遺傳效應分析,定位到6個與糙米粒重相關的QTLs。
目前,已克隆多個與蛋白質含量相關的基因。OsGS2為谷氨酰胺合成酶基因,Singh等[4]研究發現,OsGS2和OsGS1;1的表達可以提高水稻植株的耐旱性。Lgc-1為低谷蛋白含量基因,Kusaba等[5]研究發現,Lgc1通過RNA沉默抑制glutelin基因表達來降低稻米中谷蛋白含量。OsHT1為調控賴氨酸和組氨酸轉運蛋白合成的基因,Guo等[6]研究發現,OsLHT1在營養器官向生殖器官的氨基酸轉運過程中對籽粒產量、營養品質和功能品質具有重要作用。Wakasa等[7]研究發現,OsBip1是參與內質網腔中種子貯藏蛋白等分泌蛋白折疊的關鍵伴侶蛋白的調控基因,OsBiP1的嚴重抑制或過表達不僅改變了種子表型和胚乳細胞的胞內結構,而且降低了種子貯藏蛋白含量、淀粉積累和粒重。Fang等[8]研究發現,LNUE1編碼丙氨酸轉氨酶OsAlaAT1基因的合成,調控水稻的氮素利用率、產量和稻米品質。OsGluA2為谷蛋白A2前體蛋白基因,Yang等[9]研究發現,OsGluA2通過增加籽粒存儲蛋白含量和氨基酸總量,正調控籽粒的蛋白含量,導致蛋白體Ⅱ的數量和體積都升高,提高了稻米的營養品質。因此,通過GWAS(Genome Wide Association Study)發掘與蛋白質含量相關的基因,研究其表達機制,對水稻分子育種具有重要意義。

表1 參試水稻種質名稱及來源信息Table 1 Name and source information of tested rice germplasm
本試驗以139份西北早粳稻核心種質資源為材料,2021年于海南種植,每份材料種植兩行,單株移栽,每行10株,行長1.2 m,行距0.3 m,株距0.1 m,進行常規田間管理。
1.2.1表型測定
采用北京東孚久恒JDMZ100稻米出米率檢測儀檢測出米率、LTJM-2099精米機加工稻谷得到精米,采用北京東孚久恒JSWL200大米食味計測定稻米蛋白質含量,3次重復。
1.2.2SNP標記方法
對139份水稻種質資源進行DNA提取和質控,建庫測序,測序深度為10×,用基因組比對軟件BWA將所有139份水稻過濾后的Clean Reads比對到日本晴參考基因組上,通過突變分析軟件GATK檢測全基因組中所有的潛在多態性SNP(Single Nucleotide Polymorphism)位點,再根據最大缺失率(0.05)、最小等位基因頻率(0.01)等條件進一步過濾,篩選出具有高可信度的SNP位點。
使用Origin2021b軟件對139份水稻種質資源的蛋白質含量進行表型數據分析。
對139份種質資源的蛋白質含量進行描述性統計,結果表明,139份種質資源蛋白質含量均值為10%,變異系數為16.86%,范圍在7%~17%之間。
對139份種質資源的蛋白質含量進行方差分析,結果(表2)表明,在0.05水平下,不同品種間的蛋白質含量有顯著差異。

表2 139份種質資源蛋白質含量方差分析Table 2 Variance analysis of protein content of 139 germplasm resources
使用Origin 2021b軟件分析139份種質資源蛋白質含量頻率分布,作頻率分布直方圖(圖1),結果表明,139份種質資源的蛋白質含量主要分布在8%~12%之間。其中,蛋白質含量在9%~10%之間的有39個品種,蛋白質含量在10%~11%之間的有37個品種。

注:從上到下,從左到右,依次為FarmCPU曼哈頓圖、QQ圖,GLM曼哈頓圖、QQ圖,MLM曼哈頓圖,QQ圖。圖2 FarmCPU、GLM、MLM模型Fig.2 FarmCPU,GLM,MLM model
使用R包MVP進行全基因組關聯分析[10],包含了三種模型:FarmCPU、一般線性模型(GLM)和混合線性模型(MLM)。將親緣關系矩陣和主成分作為協變量加入模型進行校正,減少親緣關系、群體結構的影響。全基因組水平顯著閾值設置為1/markers數[11],對稻米蛋白質含量進行GWAS分析。設置閾值-log10(P)為5.7,篩選與稻米蛋白質含量顯著相關的SNPs位點。
本試驗共定位到3個與蛋白質含量顯著相關的SNPs位點(表3),分布在1號、3號、6號染色體上,-log10(P)在5.79~6.36之間,貢獻率在15%~17%之間。其中1號染色體上的位點在LOC_Os01g19600(11105219~11108548)上游,該基因是一個轉座子蛋白基因;3號染色體上的位點在LOC_Os03g28120(16163989~16167050)下游,該基因是一個鉀離子通道蛋白基因;6號染色體上的位點在LOC_Os06g48440(29302715~29312084)上,該基因是一個反轉錄轉座子蛋白基因。

表3 全基因組關聯分析顯著SNP位點Table 3 Significant SNP loci in genome-wide association analysis
根據全基因組水平顯著閾值篩選出與表型顯著相關的位點,LD(連鎖不平衡),將位點向上下游延伸50 kb的范圍定義為候選區間,挖掘候選基因。由表4可知,共關聯到32個與蛋白質含量相關的基因,分布在1號、3號、6號染色體上。其中包括1個已克隆的基因[OsCMO(LOC_Os06g48510)];31個未克隆的基因,包括17個反轉錄轉座子蛋白基因,3個轉座子蛋白基因,3個三角狀五肽重復結構域基因,Kelch基序家族蛋白基因(LOC_Os01g19480),鋅離子結合蛋白基因(LOC_Os03g28140),鉀離子通道蛋白基因(LOC_Os03g28120),果膠酯酶基因(LOC_Os03g28090),Ring-H2鋅指蛋白基因(LOC_Os03g28080),OsFBX94-F-box構域蛋白基因(LOC_Os03g28130),RPM1抗病蛋白基因(LOC_Os06g48520)等,這些候選基因的功能有待進一步驗證。
本試驗通過對139份核心種質資源的蛋白質含量表型數據進行全基因組關聯分析,共定位到3個與蛋白質含量顯著相關的SNP位點,關聯到32個候選基因。關聯到1個已克隆的基因OsCMO(LOC_Os06g48510),該基因是一個膽堿單加氧酶基因,對水稻耐鹽性至關重要,過表達OsCMO會增加水稻對鹽脅迫的耐受性,轉基因株系中甜菜堿含量增加[12]。潘麗娟等[13-14]研究發現,OxCMO基因在水稻幼苗組織中的表達受高鹽、低溫和干旱等脅迫的上調誘導表達,表明該基因可能在抵御非生物脅迫中發揮重要作用。關聯到31個未克隆的基因,包括17個反轉錄轉座子蛋白基因,3個轉座子蛋白基因,3個三角狀五肽重復結構域基因,Kelch基序家族蛋白基因,鋅離子結合蛋白基因,鉀離子通道蛋白基因,果膠酯酶基因,Ring-H2鋅指蛋白基因,OsFBX94-F-box結構域蛋白基因,RPM1抗病蛋白基因等。轉座子對基因的表達和功能有重要影響,林悅龍等[15]研究發現,反轉錄轉座子是許多植物基因組中的重要成分,反轉錄轉座子的復制和移動可以作為沉默子或終止子讓插入區域的正?;虬l生表達沉默或者翻譯提前終止,進而使基因功能失活;也可以直接作為鄰近基因的啟動子、增強子或者通過改變基因的剪接模式以及產生甲基化等來調控相應基因的表達與功能行使。何虎翼等[16]研究發現,轉座子是植物產生變異的重要來源,不同的轉座子通過不同的轉座機制插入宿主基因組,影響基因表達和功能。Wang等[17]研究發現,五肽重復序列蛋白參與葉綠體或線粒體基因的轉錄后調控,包括RNA成熟,編輯,內含子剪接,轉錄物穩定和翻譯起始,對植物的光合作用,呼吸作用和發育及其環境響應具有深遠的影響。Yousefi等[18]研究發現,鋅離子結合蛋白參與調控植物的高溫、干旱和鹽脅迫。Haque等[19]研究發現,鉀離子通道蛋白基因過表達植株在鹽脅迫下始終表現出生長優勢。Nie[20]研究發現,RPM1抗病蛋白在白粉病病原體感染的先天免疫機制中起重要作用。綜上所述,本試驗關聯到的32個與蛋白質含量相關的基因,對水稻的生長發育有重要影響,為今后稻米品質改良提供參考信息。