董承光,王 娟,周小鳳,馬曉梅,李生秀,余 渝,李保成
(新疆農墾科學院棉花研究所/農業部西北內陸區棉花生物學與遺傳育種重點實驗室,新疆 石河子 832000)
?
新疆陸地棉品種資源的主成分分析和聚類分析
董承光,王 娟,周小鳳,馬曉梅,李生秀,余 渝,李保成*
(新疆農墾科學院棉花研究所/農業部西北內陸區棉花生物學與遺傳育種重點實驗室,新疆 石河子 832000)
對新疆南北疆不同時期選育的84份陸地棉品種連續2年2點14個表型性狀進行相關性分析、主成分分析及聚類分析。結果表明,新疆陸地棉品種主要性狀變異豐富,尤其在籽棉產量、鈴數、始節高等性狀具有較大的變異系數;主成分分析結果顯示前5個主成分累積貢獻率為77.255 %,且第1主成分中的纖維長度、生育期和第2主成分中的衣分、籽棉產量具有較高的得分,反映了這4個性狀在新疆陸地棉品種改良中的重要性;聚類分析結果將84份材料分為4個類群,各類群占總材料的百分比分別為39.2 %、54.8 %、3.6 %和2.4 %,且發現新陸早系列和新陸中系列兩類品種在各類群中都有分布,并相互交雜。研究結果可為育種家親本材料的選擇,優異等位基因挖掘及探索新的育種方向提供依據。
新疆陸地棉;主要性狀;主成分分析;聚類分析
棉花是我國重要的經濟作物之一,棉花產業對中國經濟發展具有十分重要的作用[1]。新疆是我國最大的植棉省區和優質原棉生產基地[2]。尤其近年來棉花生產發展迅速,棉花種植面積穩定在年平均140萬hm2以上,總產保持在250~300萬t,平均單產已達到1800 kg/hm2左右,并創造了667m2產籽棉838.31 kg的世界高產記錄。棉花種植業已經成為新疆及兵團經濟的重要支柱和植棉區農民收入的主要來源[3]。自20世紀70年代至今,已通過新疆自治區品種審定委員會審定的適合新疆南北疆種植的新陸早系列、新陸中系列品種為新疆棉區棉花生產提供了重要的物質保證。國內研究學者以育成品種群體為材料在水稻[4]、玉米[5]、小麥[6-7]等作物方面已開展了較多研究,在棉花方面,眾多研究人員對不同棉區棉花品種及資源進行了主要性狀的分析[8-13],為育種家了解品種的遺傳背景、遺傳多樣性狀況及高效發掘種質資源重要性狀基因打下基礎。新疆南北疆氣候差異較大,且長期形成了“矮、密、早”特殊的栽培方式,因此棉花品種間具有較大的變異,高產、優質品種資源較為豐富,是良好的品種資源群體。本試驗選用來自新疆南北疆不同時期審定的84個陸地棉品種進行2年2點種植,對其主要性狀進行相關性分析、主成分分析及聚類分析,旨在全面了解新疆陸地棉品種的綜合表現,為進一步篩選核心種質,合理利用現有品種,發掘利用新的雜種優勢群體和探索育種方向提供依據。
1.1 試驗材料與處理
試驗材料為84份新疆不同年代審定的陸地棉品種(表1),其中新陸早系列47份,新陸中系列37份。所有材料于2013-2014年分別種植在新疆石河子新疆農墾科學院棉花研究所試驗基地(北疆)與新疆庫爾勒新疆兵團第二師農科所試驗基地(南疆)2個不同環境,各試驗點田間試驗采用完全隨機區組設計,雙行區,株距10 cm,平均行距35 cm,3次重復,以當地常規方法進行田間管理。
1.2 性狀調查及數據處理
按照杜雄明等[14]的棉花種質資源性狀描述規范,田間調查株高、始節高、始節位、果枝數、單株鈴數、生育期等;實收小區籽棉產量折算產量;室內扎花考種單鈴重、衣分、衣指、籽指等;考種結束后分別取各材料的皮棉10~12 g檢測棉花纖維長度、比強度、馬克隆值等。獲得上述各性狀數據后,采用SPSS19.0計算各性狀的平均值(X)、標準差(σ)及變異系數(c.v.)等,并進行各性狀間的相關性分析及主成分分析[15];采用DPS V7.05軟件進行聚類分析,并繪制聚類圖。

表1 84份材料及審定年份
續表1 Continued table 1

序號品種名稱審定年份序號品種名稱審定年份27新陸早28號Xinluzao28200669新陸中22號Xinluzhong22200528新陸早29號Xinluzao29200670新陸中23號Xinluzhong23200529新陸早30號Xinluzao30200671新陸中24號Xinluzhong24200630新陸早32號Xinluzao32200672新陸中26號Xinluzhong26200631新陸早33號Xinluzao33200773新陸中27號Xinluzhong27200632新陸早34號Xinluzao34200774新陸中28號Xinluzhong28200633新陸早35號Xinluzao35200775新陸中30號Xinluzhong30200634新陸早36號Xinluzao36200776新陸中32號Xinluzhong32200735新陸早37號Xinluzao37200777新陸中34號Xinluzhong34200736新陸早38號Xinluzao38200878新陸中35號Xinluzhong35200737新陸早39號Xinluzao39200879新陸中40號Xinluzhong40200938新陸早40號Xinluzao40200980新陸中41號Xinluzhong41200939新陸早41號Xinluzao41200981新陸中45號Xinluzhong45201040新陸早42號Xinluzao42200982新陸中46號Xinluzhong46201041新陸早45號Xinluzao45201083新陸中47號Xinluzhong47201042新陸早46號Xinluzao46201084新陸中48號Xinluzhong482010
2.1 主要表型性狀變異及分析
分別對2013和2014年調查的84份品種的14個表型性狀進行統計分析(表2)。其中2013年各性狀變異系數表現為始節高﹥籽棉產量﹥鈴數﹥始節位﹥子指﹥株高﹥單鈴重﹥衣指﹥果枝數﹥馬克隆值﹥比強度﹥衣分﹥纖維長度﹥生育期,2014年各性狀變異系數表現為籽棉產量﹥始節高﹥鈴數﹥子指﹥始節位﹥株高﹥衣指﹥果枝數﹥單鈴重﹥馬克隆值﹥比強度﹥衣分﹥纖維長度﹥生育期,兩年各性狀變異系數順序較為一致,說明其性狀較穩定,受生態環境的影響較小;籽棉產量、始節高及鈴數兩年的變異系數都較大,說明其性狀變異程度較大、選擇范圍較寬,而衣分、纖維長度及生育期兩年的變異系數都較小,說明其性狀變異程度較小,選擇范圍較窄。

表2 參試材料表型性狀的一般性描述統計
續表2 Continued table 2

表型性狀Phenotypictraits年份Year平均值Mean最小值Min.最大值Max.極差Range標準差SD變異系數(%)c.v.%單鈴重Bollweight20135.714.307.503.200.518.8520145.834.907.202.300.457.70衣指Lintindex20137.846.209.703.500.688.7020147.525.609.103.500.668.74子指Seedindex201310.258.5013.805.300.929.01201411.058.6014.706.101.1010.00籽棉產量Rawcottonyield2013276.27188.24433.36245.1251.3518.592014276.31183.02440.81257.7955.4220.06纖維長度Fiberlength201328.5025.3032.206.901.364.78201429.1726.2032.406.201.234.22比強度Fiberstrength201329.2625.7035.209.501.916.53201432.4228.6038.509.902.056.31馬克隆值Micronaire20134.663.905.401.500.337.1520144.293.604.801.200.307.07
2.2 主要表型性狀間的相關性分析
分別對2013和2014年調查的14個主要表型性狀數據進行相關性分析(表3)。2年結果顯示始節高與生育期,株高、始節位表現為極顯著正相關;

表3 參試材料各性狀間的相關性分析
注:**和*分別表示在0.01和0.05水平上差著異顯。
Note:**and * indicate significant difference at 0.01 and 0.05 (2-tailed).
衣指與衣分表現為極顯著正相關;子指與單鈴重、衣指表現為極顯著正相關,與衣分表現為極顯著負相關;籽棉產量與株高、衣分表現為極顯著正相關;纖維長度與生育期、始節高、單鈴重、衣指、子指表現為極顯著正相關;比強度與單鈴重、纖維長度表現為極顯著正相關;馬克隆值與纖維長度表現為極顯著負相關;籽棉產量與纖維長度、比強度兩年都表現為負相關性。分析結果表明,各性狀間表現為較復雜的相關關系,其中產量性狀(籽棉產量)與農藝性狀(株高、衣分)表現為正相關性的居多,與纖維品質性狀(纖維長度、比強度)表現為負相關性的居多。
2.3 各表型性狀的主成分分析
對14個表型性狀的2年平均值進行了主成分分析(表4),以特征值大于1為標準提取主成分,結果顯示,前5個主成分的累積貢獻率為77.255 %。其中第1主成分中纖維長度、生育期及始節高具有正向較大特征向量值,主成分值越大越好;第2主成分中衣分、籽棉產量及株高具有正向較大特征向量值,主成分值越大越好;第3主成分中果枝數、比強度、籽棉產量具有正向較大特征向量值,始節位、生育期具有負向較大特征向量值,主成分值適中為宜;第4主成分中子指、單鈴重具有正向較大特征向量值,衣分具有負向較大特征向量值,主成分值適中為宜;第5主成分中衣指、衣分具有正向較大特征向量值,株高具有負向較大特征向量值,主成分值適中為宜。
2.4 聚類分析
利用DPS V7.05軟件對兩年平均值表型性狀數據進行對數化轉換,以歐氏距離為遺傳距離,采用類平均法進行聚類分析(UPGMA)。從聚類圖(圖1)可以看出,84份材料可分為4個類群,不同類群品種的表型性狀表現見下表5所示。第一類群包括33份品種,表現為矮桿,果枝數較少類型;第二類群包括46份品種,表現為生育期適中,衣分較高類型;第三類群包括3份品種,表現為生育期較短,始節位較低類型;第四類群包括2份品種,表現為生育期較長,纖維品質優異類型。

表4 參試材料主要性狀的主成分分析

圖1 參試材料基于表型數據的UPGMA聚類圖Fig.1 UPGMA dendrogram based on phenotypic characteristics of materials
表型性狀用于檢測遺傳變異具有直觀簡易的方法,是種質資源收集、保存、鑒定和利用的基礎。本研究以2年2點12個重復的表型數據為依據,對84份新疆陸地棉品種材料進行綜合評價。結果顯示新疆陸地棉品種主要性狀變異豐富,尤其在籽棉產量、鈴數等產量性狀方面變異系數較大,選擇范圍較寬。兩年相關性分析結果進一步證明了產量與纖維品質性狀的負相關性[16-17],且考察始節高度可以預測品種生育期,考察棉鈴大小可以預測纖維品質指標。主成分分析結果顯示前5個主成分累積貢獻率為77.255 %,可以概括原性狀的絕大部分相關信息。其中第1主成分可以概括為主要農藝性狀因子,第2主成分可以概括為產量性狀因子,前2個主成分累積貢獻率達45.662 %,且第1主成分中的纖維長度和生育期分別得分為0.737、0.720,第2主成分中的衣分和籽棉產量分別得分為0.735、0.706,具有較高的得分,進一步反映了這4個性狀在新疆陸地棉品種改良中的重要性。
表型性狀是遺傳與環境共同作用的結果,能較為真實地表現品種間的遺傳多樣性。本研究聚類分析結果將84份材料分為4個類群,各類群占總材料的百分比分別為39.2 %、54.8 %、3.6 %和2.4 %。被聚在同一類群的品種間性狀相似程度較高,遺傳背景可能差異不大。其中第二類群中的新陸中4號是從{岱字棉45×[(KK1543×2依3)×(C-1470×C-460)]}組合中經過多年單株選擇而成的,具有美國和前蘇聯棉花的遺傳背景,而與它遺傳距離較近的新陸早24號(有前蘇聯C6524背景)、新陸中13號(有美國海島棉背景)、新陸中41號(有美國愛字棉背景)、新陸早20號(有美國貝爾斯諾背景)、新陸早25號(有美國貝爾斯諾背景)、新陸早23號(有美棉親緣關系的中棉所27背景)、新陸中15號(有美國海島棉背景)等品種均含有美國或前蘇聯棉花的遺傳背景。第4類群的2個品種新陸早26號、新陸中9號由于生育期較長,纖維比強度較高而聚為一類,但新陸早26號是從新陸早8號的變異單株中選育而成,新陸中9號是從新陸中4號的群體中選育而成,具有不同的遺傳背景。造成這種現象的原因可能是由于早期品種遺傳不純,材料本身存在遺傳異質性,導致從同一系譜中選育而成的品種間遺傳差異較大。

表5 不同類群品種的主要性狀表現及變異程度
艾先濤等[18-19]將北疆新陸早系列品種和南疆新陸中系列品種分別進行了聚類研究,本研究將兩類品種同時種植于南北疆不同環境中進行研究,發現兩類品種在各類群中都有分布,且相互交雜。深入剖析各品種的遺傳背景發現2類品種大部分具有美國、前蘇聯棉花的遺傳背景,育種家為得到較好的育種效果常常利用這些材料進行復雜雜交創制出較好的資源材料,用其作為親本之一再與本地自育品系進行雜交,經多年選育而成適宜本地的品種。在遺傳與環境的共同作用下,使新疆陸地棉品種出現了較為豐富的變異。然而,當前育種家急需選育一批集適宜機采的優異株型、高產、優異纖維品質等性狀于一體的棉花品種,以適應新疆棉花產業的不斷發展。本研究對新疆不同時期育成的陸地棉品種進行綜合評價,可為后續育種家親本材料的選擇,優異等位基因挖掘及探索新的育種方向提供依據。
[1]中國農業科學院棉花研究所.中國棉花遺傳育種學[M].濟南:山東科學技術出版社, 2003.
[2]田笑明,李保成.新疆棉區棉花育種現狀及發展方向[J].中國棉花, 2001, 28(5): 2-4.
[3]田長彥.新疆棉產業可持續發展面臨的挑戰與科技對策[J].干旱區研究, 2001, 18(4):62-67.
[4]楊玉蓉,孫建昌,王興盛,等.寧夏不同年代水稻品種的遺傳多樣性比較[J].植物遺傳資源學報,2014,15(3):457-464.
[5]劉志齋,郭榮華,石云素,等.中國玉米地方品種核心種質花期相關性狀的表型多樣性研究[J].中國農業科學,2008,41(6):1591-1602.
[6]耿洪偉,曲延英,高文偉,等.新疆春小麥品種(系)農藝性狀分析[J].中國農學通報,2009,25(5):151-154.
[7]徐紅軍,穆培源,相吉山,等.新疆春小麥品種主要性狀的主成分及聚類分析[J].西北農業學報, 2013,22(7):100-106.
[8]別 墅,孔繁玲,周有耀,等.中國3大主產棉區棉花品種遺傳多樣性的RAPD及其與農藝性狀關系的研究[J].中國農業科學,2001,34(6):597-603.
[9]徐秋華,張獻龍,聶以春.長江、黃河流域兩棉區陸地棉品種的遺傳多樣性比較研究[J].遺傳學報, 2001, 28(7):683-690.
[10]王芙蓉,張 軍,劉勤紅,等.棉花種質資源纖維品質分析及評價[J].山東農業科學, 2002(2):29-31.
[11]朱青竹, 趙國忠, 馬峙英.不同來源棉花種質資源材料主要農藝經濟性狀鑒定與分析[J]. 棉花學報, 2002, 14(4):237-241.
[12]賀道華,邢宏宜,李婷婷,等.基于表型的棉花遺傳多樣性分析及核心材料的篩選[J].安徽農業科學,2010,38(32):18067-18070.
[13]董承光,李成奇,李生秀,等.棉花種質資源主要農藝性狀的綜合評價及聚類分析[J].新疆農業科學, 2011, 48(3):425-429.
[14]杜雄明,周忠麗.棉花種質資源描述規范和數據標準[M].北京:中國農業出版社, 2005.
[15]李小勝,陳珍珍.如何正確應用SPSS軟件做主成分分析[J].統計研究, 2010, 27(8):105-108.
[16]李成奇,董承光,王清連,等.不同生態環境對陸地棉雜交F2代主要農藝性狀的影響[J].廣東農業科學, 2010,11:21-24.
[17]董承光,王 娟,周小鳳,等.北疆早熟棉主要育種目標性狀的相關性研究[J].西南農業學報, 2014, 27(5):2255-2257.
[18]艾先濤,李雪源,沙 紅,等.南疆自育陸地棉品種遺傳多樣性研究[J].棉花學報, 2010, 22(6):603-610.
[19]艾先濤,李雪源,王俊鐸,等.北疆陸地棉育成品種表型性狀遺傳多樣性分析[J].分子植物育種, 2011, 9(1):113-122.
(責任編輯 李山云)
Clustering and Principal Components Analysis of Xinjiang Upland Cotton Variety Resources (GossypiumhirsutumL.)
DONG Cheng-guang, WANG Juan, ZHOU Xiao-feng, MA Xiao-mei, LI Sheng-xiu,YU Yu, LI Bao-cheng*
(Cotton Research Institute, Xinjiang Academy of Agricultural and Reclamation Science/Key Laboratory of China Northwesten Inland Region, Ministry of Agriculture, Xinjiang Shihezi 832000, China)
To give some message to develop upland cotton variety in Xinjiang, 14 traits of 84 varieties were analyzed by correlation and principle component in 2 places for 2 years, and the varieties were clustered based on principal components factors score. There were rich variations of main traits, and the coefficient variation of raw cotton yield, boll number and height of the first sympodial branch were higher. Principle component analysis indicated that the characteristic vector accumulated contribution rate of 5 principal components were 77.255 %. Fiber length and growth period in the 1stprincipal component, lint and raw cotton yield in the 2ndprincipal component had higher scores. Results reflected the importance of the 4 characters in upland cotton variety improvement. According to 5 principal components factors score, 84 varieties could be divided into 4 categories. And the percentage was 39.2 %, 54.8 %, 3.6 % and 39.2 % respectively. Xinluzao series and Xinluzhong series were distributed in all categories, and mixed each other. The results provided the basis for breeders in parent material choice, excellent allele mining and breeding direction exploring.
Xinjiang upland cotton; Main traits; Principal components analysis; Cluster analysis
1001-4829(2016)08-1798-08
10.16213/j.cnki.scjas.2016.08.008
2015-08-04
國家自然科學基金(31260340);兵團博士資金(2013BB001)
董承光(1978-),山西孝義人,副研究員,主要從事棉花遺傳育種研究,E-mail:dcg318@163.com,*為通訊作者。
S326
A