
中圖分類號:S562 文獻標志碼:A 文章編號:1001-4330(2025)05-1084-08
0 引言
【研究意義】棉花是纖維是天然紡織原料,棉籽也是油料和蛋白質的重要來源。剝殼后棉籽的棉仁中含油量高約 30%~40% [1],其中包括不飽和脂肪酸和飽和脂肪酸[2]。棉籽油還可加工成生物燃料,已成為重要生物能源之一[3]。因此根據不同的用途,提高棉籽含油量與改良脂肪酸組分含量是棉花育種的目標之一。【前人研究進展】目前,連鎖作圖法和關聯分析法均可用于解析植物數量性狀遺傳的基礎,通過篩選與目標性狀緊密連鎖的分子標記,將其應用于分子標記輔助選擇,可提高選擇效率,加快育種進程[4]。全基因組關聯分析(Genome- wideassociation study,GWAS)較連鎖作圖具有精確度高,不需專門構建群體和分析同一位點的多個等位基因等優勢[5]已廣泛用于水稻[]、玉米[7]、大豆[8]和小麥[9]等作物的復雜表型性狀研究中。基于SSR的關聯分析,發掘了一些與種子油分相關的優異等位變異及典型材料:Yuan等[1使用包含77,774個基因座的棉花80KSNP芯片,對三種環境下的196個種質資源進行了全基因組關聯研究,共發現47個SNP標記和28個候選數量性狀位點(QTL)區域與7種棉籽營養成分顯著相關,包括蛋白質、總脂肪酸和5種主要脂肪酸組成。Zhao等1利用8個環境中503個陸地棉自交系材料的S0C表型數據和兩組基因型數據(包括179個SSR標記和11,975個SNP)進行全基因組關聯研究。檢測到16個顯著SSR標記和26個顯著SNP。在6、10、12、13、15、17和24號染色體上共鑒定出8個覆蓋多個顯著標記的SOC相關QTL。在這些QTL中鑒定出12至70個基因。Liu等[12]將1712對SSR引物用于作圖群體的基因分型和構建圖譜。基于該圖譜和多環境表型數據,檢測到15個粗油分、8個亞油酸、10個油酸、13個棕櫚酸和12個硬脂酸含量 ΩQTL 。【本研究切入點】棉花纖維的高價值使其成為以往棉花育種的主要目標,而對棉籽質量包括含油量的考慮較少。在育種計劃中,需要挖掘更多優異變異位點,開發具有高含油量的栽培品種,同時將其所需的產量和纖維品質保持在可接受的水平。【擬解決的關鍵問題】以245份自然群體棉花品種為材料,選用145個均勻分布于26條染色體且多態性高的SSR標記,分析4個環境下棉花種子油分含量的表型與基因型的關聯度,挖掘優異等位變異位點。
1 材料與方法
1.1 材料
群體材料包括從育種單位收集的245份棉花材料(新陸早系列棉花品種73份,新陸中系列棉花品種79份,海島棉系列棉花品種63份,新彩棉系列棉花品種11份,骨干親本 13+6 份)。試驗材料是從育種單位收集并且進行典型單株的選擇、鑒定、自交純化及繁種獲得。
2018~2019 年將245份自然群體棉花品種種植在新疆石河子( E85.94°,N44.27°, 和新疆庫爾勒( ′E86.06°,N41.68°) ,共2年2點4個環境:2018年石河子、2018年庫爾勒、2019年石河子、2019年庫爾勒。種植材料以隨機區組設計播種,2個重復,石河子的行間距離為 0.44m ;庫爾勒的行間距離為 0.38m ,所有環境中的株距為0.1m 。試驗田肥力均一,化控一致,地膜滴灌,隨機區組設計,1膜4行,行距 (28+50+28)cm+55 cm,株距 9.5cm ,行長 5m ,穴播,每個材料種2行,設2個重復,常規田間管理。
1.2 方法
1. 2.1 基因組DNA的提取和SSR基因分型
使用CTAB法[13]從每個品種的新鮮葉片中提取基因組DNA。145個SSR標記選自已發表的494個全基因組SSR標記[14] 。
1.2.2 油分性狀測定
用近紅外光譜分析法[15]測量棉花的種子油分含量,隨機選擇100個帶殼的健康種子來測量四個環境中每個品種的SOC,重復2次,測量地點為石河子大學農學院,測量儀器為PERTEN近紅外分析儀。
1.3 數據處理
1.3.1 表型數據
使用SPSS25.0統計分析表型數據,包括極值、均值、標準差和變異系數,利用R語言繪制245份棉花材料在不同環境下頻率分布直方圖和相關性分析。使用QTLIciMapping4.1.0.0軟件估計不同環境間SOC的廣義遺傳力 (H2) 。
1.3.2 群體結構
采用STRUCTURE2.3.4軟件對群體結構進行估計,計算模擬的亞群劃分數K值條件下的參數,模擬 K 值從 1~10 ,迭代次數為3;將MCMC(Markovchainmontecarlo)開始時的不作數迭代(Lengthofburninperiod)設為10O00次,再將不作數迭代后的 MCMC 設為10 000 次[16-17],其余參數采用軟件默認的設置。根據
計算
,并依據
值選擇1個合適的 K 值[16],得到該 K 值對應的 Q 矩陣。
1.3.3 連鎖不平衡
使用TASSEL2.1軟件計算共線性、非共線性SSR位點組合間的LD水平及支持概率,繪制連鎖不平衡分布圖。
1.3.4性狀和標記的關聯
采用軟件TASSEL2.1進行基因型數據生成親緣關系矩陣(K矩陣),結合基因型數據、各個環境的表型值,利用STRUCTRE軟件生成Q矩陣,采用混合線性模型(Mixedlinearmodel,MLM)進行性狀和標記之間的關聯分析,減少來自種群結構和相對親緣關系的誤差。
采用FDR法[18]對 P 值矯正并計算標記位點對表型變異貢獻率。
1.3.5挖掘與自然群體油分性狀關聯優異位點
在已獲得關聯位點的基礎上,統計分析與表型性狀顯著關聯的位點等位變異。將與目標性狀關聯的等位變異位點同已經發表的棉花文獻中報道定位QTL比較,篩選出共有 QTL 。
2 結果與分析
2.1 種子油分含量表型數據變化
研究表明,種子油分含量SOC在4個環境中存在廣泛的表型變異,變異范圍為 13.41% ~21.98% ,2018年庫爾勒環境的SOC變異幅度最大,最小值和最大值相差 8.57% ,變異范圍為
13.41%~21.98% ,而2019年石河子環境的SOC變異幅度最小,最小值與最大值相差 5.5% ,變異范圍為 12.17%~19.67% ;SOC的廣義遺傳力為96.98% ,種子油分含量遺傳較穩定,但是環境因子仍對其有影響。2018年石河子和2019年庫爾勒環境下表型相關性最低為0.64,2018年庫爾勒和2019年石河子環境下表型相關性最高為是0.84。表1,圖1
表1油分性狀在4個環境下的表型變異
Tab.1 Phenotypicvariationofoiltraitsinfourenvironments

圖1 種子油分含量頻率分布直方圖和相關性
Fig.1Seed oil content frequency distribution histogram and correlation

2.2 群體結構
研究表明,145對核心SSR標記用于群體遺傳結構的分析, ΔK 在 K 取3時出現拐點,245份自然群體棉花品種可被分為3個亞群,亞群1包含30個品種,其中新陸早系列棉花品種占 76.67% ,新陸中系列棉花品種占 20% ,新彩棉系列棉花品種占3.33% ;亞群2包含33個系列棉花品種,新陸早系列棉花品種占 93.94% ,海島棉系列棉花品種占3.03% ,新彩棉系列棉花品種占 3.03% ;亞群3包含182個系列棉花品種,新陸早系列棉花品種占10.44% ,新陸中系列棉花品種占 40.11% ,海島棉系列棉花品種占 34.06% ,新彩棉系列棉花品種占4.95% ,骨干親本占 10.44% 。圖2~3
圖2基于Structure分析 K 值與
)值和 ΔK 值折線 Fig. 2Lines graph of K value with
)value and ΔK value based on structure analysi

注: A:K 值與Mean
值折線圖;B:△K值隨 K 值變化 Notes: A :Line chart of K valueand Mean lnP(K) ;B:Line chart of ΔK changingwith K values
圖3 基于145對SSR標記的245份自然群體棉花品種群體遺傳結構Fig. 3 Population genetic structure map of 245 natural population cottonvarietiesbasedon145pairsofSSRmarkers

2.3 連鎖不平衡分析
研究表明,使用145個SSR標記對該種群的連鎖不平衡(LD)進行分析,自然群體棉花的基因組內連鎖不平衡位點數較多,但是位點的分布在每條染色體上均是不均勻的。在156對SSR標記的41905種位點組合,共線性(同一連鎖群)和非共線性(不同連鎖群)組合中均有連鎖不平衡位點存在,當 R2gt;0.1 時,存在LD位點的組合數占總組合數的 1.30% ,當 Plt;0.01 時,概率統計顯著的不平衡成對位點的比例占總組合數的11. 46% ,比例較小,自然群體中存在一定程度的連鎖不平衡。圖4
2.4 種子油分含量的關聯性
研究表明, 2018~2019 年共檢測到34個與種子油分含量相關聯的位點,其中34個(23.45% )標記與SOC在 Plt;0.05 水平上相關。16個標記在 Plt;0.01 水平上顯著相關。表型變異解釋率為 1.83% 到 8.7% ,平均為 5.70% ,貢獻率最高的是 HAU4483b 。表2
2.5 研究位點比較
研究表明,獲得的9個標記位點均與棉花纖維產量和品質相關,分別為HAU3071(FE)、NAU3346(FL)、NAU3736(FE)NAU3827(LY)、NAU3774(FU,BW,MV,LW)、DPL0062(LWFU-HML,FU,MV)、MUSS422(FU,SFC)、BNL2449(BW,FUHML,MV,FE,LP,FU)、NBRIHQ526730(SI,FE)。表3
3討論
3.1 群體結構分析
群體結構的評價是進行關聯分析的前提條件,由于群體結構的存在會引起關聯分析假聯,合理和準確地劃分群體結構將會增加群體內的遺傳相似性、群體間更高的遺傳分化,同時很大程度上也會降低關聯分析的誤差[19]。MLM模型考慮了親緣關系矩陣作為隨機因子,從而能夠更準確地評估基因型與表型之間的關聯,減少了由于親緣關系引起的假陽性結果。MLM模型在處理復雜數據時具有更高的靈活性,能夠更全面地考慮各種潛在的影響因素。同時采用隨機效應和固定效應相結合的方式,使得MLM模型在估計參數時更加高效,能夠更準確地估計基因型的效應值和顯著性水平。研究在數據處理過程中采用STRUCTURE軟件中的混合線性模型(MLM)以校正基于群體結構的多位點基因型數據,245份試驗材料劃分為3個亞群,將計算每個材料歸入各個亞群的概率Q值作為協變量納人SSR標記與表型性狀變異的回歸分析中。
UpperR^2.000.900.800.70r 0.600.50H 0.400.200.100.00LowerPvaue0.010.0010.000
表2 與種子油分含量關聯的SSR位點

Tab.2 SSRlocusassociatedwith
Tab.2 SSRlocusassociated with

注:P_FDR:標記與表型相關性的 P 值的顯著性; R2 :標記對 表型變異的解釋率; * 表示在0.05水平的顯著性; ** 表示在 0.01水平的顯著性 Notes:P_FDR:Significant relationship between marker and phenotype; R2 :phenotypicvariationexplainedbymarker;*:significant at the0. 05levels; ** :significantat theO.O1levels
表3試驗研究與已報道位點的比較結果
Tab.3 Comparative results of this study with reported sites

注:FE:纖維伸長率,FL:纖維長度,LY:皮棉產量,FU:纖維整 齊度,BW:鈴重,MV:馬克隆值,LW:單鈴皮棉重,FUHML:纖維上 半部平均長度,SFC:短纖維含量,LP:衣分,SI:籽指 Notes:FE:Fiberelongation,FL:Fiberlength,LY:Lintyield, FU:Fiberuniformity,BW:Boll weight,MV:Micronairevalue, LW:Lintweight,FUHML:Fiberupperhalfmeanlength,SFC: Shortfiber content,LP:lintpoint,SI:Seed index
3.2 挖掘與棉花油分性狀關聯的優異位點
研究通過對245份自然群體棉花品種4個環境下的產量和纖維品質性狀關聯分析,共檢測到34個與種子油分含量相關聯的位點。其中有9個標記已經在前人研究中報道。HAU3071和NAU3736在研究中對表型變異的解釋率分別為6.82% 和 6.38% ,在前人研究中均與棉花纖維伸長率相關;NAU3346在研究中對表型變異的解釋率為 6.65% ,在前人研究中與棉花纖維長度相關;NAU3827在研究中對表型變異的解釋率為6.30% ,在前人研究中與皮棉產量相關;NAU3774在研究中對表型變異的解釋率為 6.54% 和4.47% ,在前人研究中與纖維整齊度、鈴重、馬克隆值和單鈴皮棉重相關;DPL0062在研究中對表型變異的解釋率為 4.98% ,在前人研究中與單鈴皮棉重、纖維上半部平均長度、纖維整齊度和馬克隆值相關;MUSS422在研究中對表型變異的解釋率為 6.90% 和 6.06% ,在前人研究中與纖維整齊度和短纖維含量相關;BNL2449在研究中對表型變異的解釋率為 4.83% 和 4.76% ,在前人研究中與鈴重、纖維上半部平均長度、纖維整齊度、馬克隆值、纖維伸長率、衣分和纖維整齊度相關;NBRI業 110526730 在研究中對表型變異的解釋率為5.00% ,在前人研究中與棉花伸長率和籽指相關。
4結論
245份試驗品種被劃分為3個亞群結構;通過對4個環境下自然群體材料關聯分析,獲得與種子油分含量性狀相關的等位變異位點34個。表型變異解釋率為 1.83% 到 8.7% ,平均為5.70% ,貢獻率最高的是 HAU4483b 。
參考文獻(References)
[1]許紅霞,楊偉華,王延琴,等.我國油用棉子質量狀況分析 [J].中國棉花,2009,36(7):2-3. XU Hongxia,YANG Weihua,WANG Yanqin,etal.Analysis on the quality of oil cottonseed in China[J].China Cotton, 2009,36(7):2-3.
[2]LiuQ,Singh S,Green A.Genetic modification of cotton seed oil using inverted-repeat gene-silencing techniques[J].Biochemical Society Transactions,2000,28(6) :927 -929.
[3]MeneghettiSMP,MeneghettiMR,SerraTM,etal.Biodiesel production from vegetable oil mixtures:cottonseed,soybean,and Castoroils[J].Energyamp;Fuels,2007,21(6):3746-3747.
[4]賈秀凌.陸地棉 SSR 標記遺傳圖譜構建與纖維品質性狀 QTL定位[D].重慶:西南大學,2014. JIA Xiuling. Construction of upland cotton SSR marker genetic map and QTL mapping of fiber quality traits[D]. Chongqing: Southwest University,2014.
[5]HuangXH,Han B. Natural variations and genome-wide association studies in crop plants[J]. Annual Review of Plant Biology,2014,65:531-551.
[6]YanoK,YamamotoE,AyaK,etal.Genome-wide association studyusing whole-genome sequencing rapidly identifies new genes influencing agronomic traitsin rice[J].Nature Genetics, 2016,48(8):927-934.
[7]YangN,LuYL,YangXH,etal.Genome wide association studies using a new nonparametric model reveal the genetic architecture of 17 agronomic traits in an enlarged maize association panel[J].PLoS Genetics,2014,10(9):e1004573.
[8]HanYP,ZhaoX,LiuDY,etal.Domestication footprints anchor genomic regions of agronomic importance in soybeans[J]. NewPhytologist,2016,209(2): 871-884.
[9]劉凱,鄧志英,張瑩,等.小麥莖稈斷裂強度相關性狀QTL 的連鎖和關聯分析[J].作物學報,2017,43(4):483-495. LIU Kai,DENG Zhiying,ZHANG Ying,et al. Linkage analysis and genome- wide association study of QTLs controlling stem - breaking-strength-related traits inwheat[J]. Acta Agronomica Sinica,2017,43(4):483-495.
[10]Yuan YC,WangXL,WangLY,et al.Genome-wide association study identifies candidate genes related to seed oil composition and protein content in Gossypium hirsutumL[J].Frontiers in Plant Science,2018,9:1359.
[11]Zhao W X,Kong X H,Yang Y,et al. Association mapping seed kernel oil content in upland cotton using genome-wide SSRs and SNPs[J].Molecular Breeding,2019, 39(7):105
[12]LiuDX,LiuF,ShanXR,et al.Construction ofahigh-density genetic map and lint percentage and cottonseed nutrient trait QTL identification in upland cotton (Gossypium hirsutum L.) [J].Molecular Genetics and Genomics,2015,290(5):1683- 1700.
[13]Li X M, Yuan DJ, Wang HT, et al. Increasing coton genome coverage with polymorphic SSRs as revealed by SSCP[J].Genome,2012,55(6):459-470.
[14]Nie X H,Huang C,You C Y,et al. Genome? wide SSR - based association mapping for fiber quality in nation-wide upland cotton inbreed cultivars in China[J].BMC Genomics,,2016,17: 352.
[15]田博宇,黃義文,周大云,等.不同形態棉籽中油分含量快 速無損近紅外檢測方法的建立[J].棉花學報,2023,35(4): 325-333. TIAN Boyu,HUANG Yiwen,ZHOU Dayun,et al. Development of a rapid non-destructive method for the detection of cottonseed oil content by near - infrared spectroscopy[J]. Cotton Science, 2023,35(4):325-333.
[16]Evanno G,Regnaut S,Goudet J.Detecting the number of clusters of individuals using the software STRUCTURE:a simulation study[J].Molecular Ecology,2005,14(8):2611-2620.
[17]Falush D,Stephens M ,Pritchard JK.Inference ofpopulation structure using multilocus genotype data:dominant markers and 1 alleles[J].Molecular EcologyNotes,2007,7(4):574- 578.
[18]Liu K J,Muse S V. PowerMarker:an integrated analysis environment for genetic marker analysis[J]. Bioinformatics,2005, 21(9):2128-2129.
[19]雷杰杰,邵盤霞,郭春平,等.新疆陸地棉經濟性狀優異等 位基因位點的遺傳解析[J].棉花學報,2020,32(3):185- 198. LEI Jiejie,SHAO Panxia,GUO Chunping,et al.Genetic dissection of allelic loci associated with economic traits of upland cottons in Xinjiang[J].Cotton Science,2020,32(3):185-198.
[20]YuY,YuanDJ,Liang SG,etal.Genome structure of cotton revealed by a genome - wide SSR genetic map constructed from a BC1 population between Gossypium hirsutum and G. barbadense [J].BMC Genomics,2011,12:15.
[21]Guo W Z,Cai C P, Wang CB,et al. A microsatelite-based, gene-rich linkage map reveals genome structure,function and evolution in Gossypium[J].Genetics,2007,176(1):527-541.
[22]YuJW,ZhangK,LiSY,et al.Mapping quantitative trait locifor lint yield and fiber quality across environments in a Gossypium hirsutum × Gossypium barbadense backcross inbred line population[J].Theoretical and Applied Genetics,2013,126(1) : 275 -287.
[23]WangHT,Huang C,Guo HL,et al.QTL mapping for fiber and yield traits in upland coton under multiple environments[J]. PLoS One,2015,10(6):e0130742.
[24]王寒濤.陸地棉遺傳圖譜的構建及其重要農藝性狀的QTL 定位[D].武漢:華中農業大學,2015. WANG Hantao. Construction of upland cotton genetic map and QTL positioning of important agronomic traits[D]. Wuhan: Huazhong Agricultural University,2015.
[25]Du XM,HuangG,He SP,et al. Resequencing of 243 diploid cotton accessions based on an updated A genome identifies the genetic basis of key agronomic traits[J].Nature Genetics,2018,50 (6):796-802.
[26]Guo W Z,Ma GJ,Zhu YC,et al.Molecular tagging and mapping of quantitative trait loci for lint percentage and morphological marker genes in upland cotton[J].Journal of Integrative Plant Biology,2006,48(3):320-326.
[27] Sun FD,ZhangJH,WangSF,et al.QTL mapping for fiber quality traits across multiple generations and environments in upland cotton[J].Molecular Breeding,2012, 30(1): 569 -582.
[28]YuJW,Yu SX,GoreM,etal.Identification of quantitative trait loci across interspecific F2 , F2 :3 and testcross populations foragronomicand fiber traitsintetraploid cotton[J].Euphytica, 2013,191(3):375-389.
Mapping and genetic effect analysis of QTL for cotton seed oil content
DING Shugen1, SHI Yujie1,Abudukeyoumu Abudurezike2,XU Lin2,WU Yuanlong1,LI Zhibo’,LIN Hairong1,ZHAO Zengqiang3,NIE Xinhui1
(1. Key Laboratory of Oasis Ecology/ Agricultural College of Shihezi University, Shihezi Xinjiang 832000, China; 2. Laboratory of Quality and Safety Risk Assessment for Agro -Products, Xinjiang Uyghur Autonomous Region Academy of Agricultural Sciences, Urumqi 83oooo, China; 3. Key Laboratory of Crop Germplasm Innovation and Gene Resource Utilization of XPCC / Cotton Research Institute of Xinjiang Academy of Agricultural Reclamation Sciences, Shihezi Xinjiang 8320oo, China)
Abstract:【Objective】 Based on SSR(Simple sequence repeat) markers,we aim to conduct correlation analysis on cotton SOC(Seed oil content),mine excellent allelic variation sites,and analyze the genetic mechanism ofcotton seed oilcontent traits in the hope of providing a theoretical reference for coton high-oil content breeding.【Methods】145 pairs of SSR markers covering the entire cotton genome were screened to conduct polymorphism scanning on 245 coton varieties;R language was used to draw population phenotype distribution and correlation diagrams,and the mixed linear model of TASSEL software was used to perform correlation analysis,and mine excelent alelic variation sites related to SOC.【Results】34 allelic variation sites related to SOC were obtained ( Plt;0.05 ). The explanation rate of phenotypic variation ranged from 1. 83% to (2 8.7% ,with an average value of 5.70% .【Conclusion】 This study used correlation analysis to 34 sites related to oil content and cotton fiber quality and yield were discovered 9 sites.
Key words:SSR;seed oil content;correlation analysis