孫彩玲,曲輝英,呂建華,田紀春*,張永祥,王守義,宋雪皎
基于主成分和聚類分析的山東省區試小麥品種(系)品質的綜合評價
孫彩玲1,2,曲輝英3,呂建華3,田紀春1,2*,張永祥1,2,王守義1,2,宋雪皎1,2
1.山東農業大學農學院,山東泰安271018
2.作物生物學國家重點實驗室,山東泰安271018
3.山東省種子管理總站,山東濟南250000
利用主成分和聚類分析方法,對2008~2009年度和2009~2010年度參加山東省區試的297個品種(系)的小麥品質進行了分析和綜合評價。結果表明,評價小麥整體的品質指標,可以提取三個主成分,第1主成分為蛋白質量因子(含面筋指數、沉淀值、形成時間、穩定時間),第2主成分為磨粉因子(含硬度指數、出粉率、吸水量、白度),第3主成分為蛋白數量因子(含濕面筋含量和籽粒蛋白質含量)。三個主成分的累計方差貢獻率兩年分別為77%和82 %,其中第1主成分的貢獻率兩年分別高達34.453%和36.291%,說明面筋指數、沉淀值、形成時間和穩定時間是影響小麥品質的主要因素。利用主成分分析評價小麥的綜合品質,2009~2010年度96個樣品中的泰農7058、05428、泰山4173、山農71等品種(系)得分較高,說明品質表現突出。同時綜合各主成分的貢獻率、不同指標的特征值大小和可操作性,提出在育種早期面筋指數、沉淀值和硬度指數可間接評價小麥品質。用R型聚類將10個品質性狀聚為四類,其中三類性狀(面粉白度另成一類)所包含的指標和主成分分析的三個主成分所包含的指標基本吻合。在主成分分析的基礎上,對2009-2010年度96個樣品進行了Q型聚類,其中第Ⅲ類群包括的6個品種(系)各類指標較高,結果和主成分綜合評分中得出的品質較好的品種(系)結果一致,進一步驗證了主成分分析可以用于小麥品種(系)品質的綜合評價。
小麥品質;主成分分析;聚類分析;綜合評價
小麥是世界上最重要的糧食作物之一,其種植面積、產量和貿易額均居世界第一位。山東省小麥總產處于全國第二位,其中優良小麥品種起著至關重要的作用[1]。省級區域試驗是政府統一安排的對育成品系產量、品質和抗逆性的多點多年鑒定,是評選和審定品種的必要程序。參加省區試的品系品質狀況既代表了近幾年全省的育種水平,也代表了今后幾年生產上推廣品種的趨勢。山東省在小麥品系的區試審定過程中,除十分重視產量提高外,也十分重視品質指標的考量,特別重視對強筋小麥品種的審定工作。近10年審定并推廣的煙農19、淄麥12、濟南17、濟麥20、山農12和洲元9369等強筋小麥新品種,是山東小麥品質遺傳改良上的重要進展,這些優質小麥品種在山東及我國優質小麥產業發展中發揮了重要的作用,獲得了巨大的社會和經濟效益[2]。
小麥品質是一個綜合概念,主要指營養品質和加工品質兩個方面,加工品質又分一次加工品質和二次加工品質[3]。實驗室評價某個品種(系)優劣的指標可達36項。農業部行業標準(NY/T967-2006農作物品種(系)審定規范小麥)對區試品種(系)選擇了容重、蛋白質含量、濕面筋含量、吸水率、穩定時間、最大抗延阻力、拉伸面積等幾個指標對參試品系進行評價,其中對強筋小麥的基本要求為:容重≥770g/L,蛋白質含量≥14.0%,濕面筋含量≥30.0%,面團穩定時間≥7 min,最大抗延阻力≥350 E.U,拉伸面積≥180 cm2等[4]。山東省也選擇了容重、蛋白質含量、沉淀值、濕面筋含量、穩定時間作為主要評價指標(2008年-2009年山東省小麥新品種區域試驗年報)。由此可知,不論是國家還是省級區試,盡管選擇了數項主要品質,但對某一品種品質評價還是逐項相互比較。前人很少采用統計學方法對多指標進行綜合分析評價[5-8]。
主成分分析是一種多元統計分析技術,是將原來眾多有一定相關性的單個指標組合成一組新的互相獨立的主成分單元,在很少損失原有信息的前提下,通過降維將原來多指標轉換為個數較少的彼此獨立的新指標,揭示變量間的關系,有利于提高多目標育種的親本選配效果和育種水平,在品質鑒定中也有利于提高多指標的評價效果,更好地評價某一品種(系)的品質水平,更好地進行品種(系)分類。當原始變量被換算成新變量后,其結果還可以進一步用于回歸與聚類分析[9-10],從20世紀80、90年代開始主成分分析就已被應用到土壤、水質、食品、作物等各類性狀的綜合評價和分析[11-14],但主成分和聚類分析方法在國家和省區試品質鑒評中應用不多。
本研究以山東省種子管理總站提供的297份小麥區試品種(系)為材料,利用主成分分析和聚類分析研究硬度指數、出粉率、濕面筋含量、面筋指數、籽粒蛋白質含量、Zeleny沉淀值、吸水量、面團形成時間、面團穩定時間、面粉白度等10個品質指標,綜合評價區試品種(系)的品質狀況,為評價小麥品質和優質小麥品種的審定提供參考。
1.1實驗材料
供試小麥品種(系)及抽樣資料、樣品信息均由山東省種子管理總站提供,2008~2009年度201個樣品,2009-2010年度96個樣品,其中2008~2009年材料為種植于山東省農科院作物所和大汶口農科所兩個試驗基地的混合樣品,2009~2010年度材料為種植于長青國家區域實驗站、山東省農科院作物所和泰安市農科院三個試驗基地的混合樣品,試驗地均隨機區組排列,每品種(系)設3個重復,小區面積13.34 m2,不少于6行區,試驗區四周設不少于兩個小區的保護行,大田管理按照當地常規高產小麥管理技術進行,機械收獲晾曬后儲藏作為品質測試材料。
1.2品質指標的測試儀器和方法
籽粒硬度指數:利用硬度指數測定儀按照GB/T21304-2007測定;籽粒蛋白質:Perton7200近紅外分析儀按照AACC39-25方法測定;實驗制粉:用BUHLER試驗磨按照NY/T1094.1-2006方法,磨粉一周后進行品質測試;濕面筋含量和面筋指數:用Perton1500面筋儀按GB/T14608-1993方法測定;Zeleny沉降值:按NY/T1095-2006方法測定;吸水量、面團形成時間和穩定時間:用德國Brebender公司810104型粉質儀按GB/T14614-2006方法測定;面粉白度:用杭州大成儀器公司WSR-Ⅳ白度儀按照GB12097-1989方法測定。
1.3統計分析
主成分分析和聚類分析均采用SPSS13.0統計軟件,主成分分析采用其中的Factor分析過程,因為量綱不同不能比較,所以須將原始變量進行標準化Z值轉化,消除量綱使其具有可比性,Z值的計算公式:Z值大小相同、符號不同其代表的檢測能力一致,因此在進行主成分分析數據標準化之前,用絕對值的方法將Z值處理為正數。聚類分析先進行標準化轉化,以歐氏距離(Euclidean distance)作為關聯矩陣,采用最長距離法(Furthest neighbor)進行R型(不同指標)聚類和Q型(不同樣品)系統聚類,系統聚類后不同類群間的顯著性測驗采用t檢驗(P<0.01)通過Excel表格完成。
2.1兩年區試小麥品質的主成分分析
利用主成分分析方法,將硬度指數(X1)、出粉率(X2)、濕面筋含量(X3)、面筋指數(X4)、籽粒蛋白質含量(X5)、Zeleny沉淀值(X6)、吸水量(X7)、面團形成時間(X8)、面團穩定時間(X9)、面粉白度(X10)等10個指標進行分析,將各指標的特征值、3個主成分的貢獻率與累計貢獻率列于表1,表中各特征根的大小代表各綜合指標(主成分)遺傳方差的大小,各特征根的累計貢獻率表示各有關綜合指標(主成分)對總遺傳方差貢獻的百分率。兩年的分析均提取前3個主成分,各指標對不同主成分的貢獻不同,根據各指標最大負荷量所在的主成分看出(表1),第1主成分包含了面筋指數、沉淀值和形成時間、穩定時間;第2主成分包含了硬度指數、出粉率、吸水量、白度;第3主成分包含了濕面筋含量和籽粒蛋白質含量。2008~2009年度(表中2009年數據)和2009~2010年度(表中2010年數據)的第1主成分的貢獻率分別達到34.453%和36.291%,因其特征向量所凝聚的生物學信息量主要是面筋指數、沉淀值和形成時間、穩定時間之間的綜合關系,故稱第1主成分為蛋白質質量因子,認為是決定小麥品質的首要因子,4個參數同為正值,表明它們之間在遺傳上是正相關關系,另外在4個參數中,穩定時間的特征值最大為0.925,說明在主成分1中其單個指標的貢獻率最大,其次為形成時間;兩年的第2主成分的貢獻率分別為26.887%和30.421%,其特征向量所揭示的生物學信息是硬度指數和出粉率、吸水量、白度的關系,可以稱為磨粉品質因子,其中硬度指數的負荷量最大,說明在主成分2中其單個指標的貢獻率最大,白度的特征向量值為負值,表明與其他參數成負相關關系;兩年的第3主成分的貢獻率分別是15.760%和15.563%,包含濕面筋含量和籽粒蛋白質,可以稱為蛋白質數量因子,兩者之間為正向關系;兩年的累計貢獻率分別為77%和82%,雖然2009的累計方差貢獻率略低,但該分析結果能夠表達該數據的變化趨勢。
比較兩年影響每個主成分指標的特征值,相關方向一致,特征值的大小也比較接近,進一步說明以上分析結果的可靠性。綜合考慮3個主成分的貢獻率、每個主成分中單個指標的負荷量和檢測方法的可操作性,篩選出面筋指數、沉淀值、硬度指數3個指標,在優質小麥育種早期加強選擇,有利于提高穩定時間以及優質小麥的選擇效率和綜合評價的準確性。
根據特征向量可以構建各主成分與小麥品質各指標之間的線性關系,例如2008-2009年度第1主成分與各指標的線性關系為:Y1=0.105X1+0.089 X2-0.211 X3+0.871 X4+0.166 X5+0.817 X6+0.059 X7+0.887 X8+0.925 X9+0.054 X10;2009-2010年度第1主成分與各指標的線性關系:Y1=0.087X1+0.248 X2-0.146 X3+0.853 X4+0.068 X5+0.874 X6+0.116 X7+0.897 X8+0.900 X9+0.190 X10,以此類推,可以分別得出兩年3個主成分的線性方程式。根據主成分的線性方程求得所有參試品種(系)的主成分得分和綜合得分列入表3(僅列出2009-2010年96個樣品的得分,2008-2009年度略,)。計算各個品種(系)的主成分值(因子得分),可充分了解品種(系)的品質特性,權衡每個性狀在某個品種(系)中所處的位置和分量,較為系統直觀地判斷某一品種(系)性狀的優劣,對育種工作和品種(系)評價提供更加科學的依據。綜合得分越高,表明該品種(系)的綜合品質性狀越好(表2),樣品品質的綜合得分和實際表現基本吻合。

表1 小麥品質的3個主成分及特征向量Table 1 Principal component analysis of wheat quality

表2 96個樣品標準化后主成分得分Table 2 Principal component scores of 96 samples after standardization

品種編號No.品種(系)名稱Strain name第1主成分1stprincipal component第2主成分2ndprincipal component第3主成分3rdprincipal component綜合得分Colligate scores綜合排名Rank 27054288.96502.14101.17857.02882 28BD1004.89782.74103.00723.808413 290568521.77640.22620.16441.492485 30山農D0819 Shannong D08194.24063.20780.83323.497720 31濟寧05鑒24 Jining05jian 246.38611.47563.14644.80197 32齊豐3號Qifeng 32.42840.92564.22213.244424 33泰農7018 Tainong 70181.81471.38091.45031.572083 34H70682.51172.23701.44512.163764 35汶農17 Wennong 172.59530.1004-0.28092.826140 36聊9817 Liao 98172.50621.37920.95751.879076 37SN560354.44651.77372.19963.296523 38汶農18 Wennong 182.92484.50441.95303.480921 39泰山4173 Taishan 41738.57722.09552.26806.42193 40山農71 Shannong 718.31501.99773.13536.16894 41SN055387 SN0553872.31402.69661.91502.352656 420464021.48210.70320.55121.094593 43山農044Shannong 0442.60790.54340.96511.950273 44中作155 Zhongzuo 1551.39211.03350.34201.128491 459839-602.77951.16271.31152.055267 460353734.42900.2424-0.09794.304010 47BPT060373.94391.56620.33753.098930 48煙0761 Yan 07612.89443.23941.65292.774443 49煙0717 Yan 07172.47492.38163.01472.653448 50泰山6219 Taishan 62192.72431.4122-0.18592.392255 51衡4399 Heng 43992.93530.84550.49752.238861 52煙農578 Yannong 5782.09363.20851.07452.482951 53濟麥6097 Jimai 60972.63521.45791.56832.036568 5495-11.30121.04680.75451.082494 550553191.95540.99722.47932.018669 56煙99102 Yan 991023.61322.90690.80323.024633 579905122.21731.72762.61682.247760 58SN0558432.29001.90660.82951.903675 59By181.74952.21682.94062.406654 60BPT05362.53412.59570.82802.323957 61山農05-0149Shannong 05-01493.63951.03980.43022.840239 62天泰優麥2號Tiantai youmai 21.55080.31403.49702.747744 63泰農175 Tainong 1751.59031.38162.14751.767777 64魯麥21 Lumai 212.40633.36953.36393.113929 65棗9926 Zao 99264.64651.75882.96703.572919 66淄麥0906Zimai 09063.32522.06903.42323.068531 67淄麥0907Zimai 09073.69171.39681.11402.711945 68泰山6395 Taishan 63951.58511.87592.52112.070765 69墾星一號Kenxing 11.77421.85231.03981.641579 70SN09-302.62810.62680.05772.204763 710553191.46541.06620.96651.205990 72濟旱4085 Jihan 40854.92221.13500.93343.774715 73山農D919 Shannong D9193.45440.88220.46172.693547 74早白987 Zaobai 9873.49263.02341.90122.964634 75山農543096Shannong5430962.97693.22223.15623.121927 76SN7382.59562.06430.24582.254359 77TM2132.35843.30043.29413.049932 78山農0801 Shannong 08012.58363.20100.18362.840938 79德旱1號Dehan 10.52671.36172.00671.581182 80臨072 Lin 0723.45152.67560.92942.825141 81興農9號Xingnong 94.30771.14541.03303.227725

品種編號No.綜合Ra 82菏麥97-28 Hemai 97-281.46450.91810.51301.122792 83德旱06-3Dehan 06-32.10371.00360.38921.597180 84魯麥21 Llumai 212.51193.48192.34142.869237 85煙0836 Yan 08362.38711.74362.87032.425052 86濟麥22 Jimai 222.79332.22232.54692.542550 87聊1709 Nliao 17092.47821.90971.01252.002471 88良星619Liangxing 6190.78851.75550.66341.291988 89H46865.24860.57421.12334.195012 90By201.96330.09850.54831.595681 91汶農15Wennong 151.31830.58580.05261.064995 92青豐2號Qingfeng 21.11450.89392.80442.058266 93山農紫麥Shannong zimai1.84720.54611.03941.395686 94汶農14 Wennong 142.34061.4435-0.03642.018270 95PH9540-551.62511.72300.70121.506784 96泰農2987Tainong 29876.56690.70461.57565.21116品種(系)名稱Strain name第1主成分1stprincipal component第2主成分2ndprincipal component第3主成分3rdprincipal component綜合得分Colligate scores排名nk
2.2區試小麥品質指標的聚類分析
系統聚類分析所得結果很大程度上取決于聚類所采用的遺傳距離聚類方法。本研究以歐氏距離(Euclidean distance)作為關聯矩陣,采用最長距離法分別進行了性狀(R型聚類,圖1)和樣品的聚類(Q型聚類,2009~2010年度樣品,圖2),系統聚類結果可較客觀地根據基因型遺傳差異性與相似性特點。
從圖1可見,在歐氏距離9.66處,籽粒硬度指數(1)、吸水量(2)、出粉率(3)等與磨粉有關的3個性狀距離較近,聚為一類(Ⅰ),濕面筋含量(3)和籽粒蛋白質含量(5)等蛋白質數量性狀聚為一類(Ⅱ),面筋指數(4)、穩定時間(9)、沉淀值(6)、形成時間(8)等蛋白質質量性狀聚為一類(Ⅲ),白度(10)單成一類(Ⅳ),第Ⅲ類性狀恰和主成分分析結果中的第一主成分吻合,第Ⅰ類恰和第3主成分吻合,聚類分析結果與主成分分析結果大體一致,進一步證明了主成分結果中蛋白質質量性狀、磨粉性狀和蛋白質數量性狀對小麥品質的影響順序。
在主成分綜合評分的基礎上,對2009-2010年度96個樣品的綜合得分采用歐氏最長距離法進行了聚類分析,在歐氏距離6.53處,96個樣品被聚為5個類群(表3圖2).其中的第Ⅲ類群的樣品(編號6、27、23、31、39、40)在主成分綜合評價中得分最高為6.38,且和其他四類達極顯著差異(表3),其中的23號樣品泰農7058綜合得分7.87排名第一(表2),該樣品的穩定時間達12.1 min,形成時間達5.2,面筋指數達90,硬度指數達72,在所有樣品中均具有較高的數值,27號樣品05428綜合得分7.02排名第二,認為品質表現突出,綜合品質性狀優良。

表3 96個小麥樣品5個類群的特征Table 3 The characters offive group for 96 wheat sample

圖1 10個指標的R型聚類結果Fig.1 R clustering results of 10 traits

圖2 96個樣品的系統聚類結果Fig.2 Q clustering results of 96 samples
小麥品質是一個綜合性狀,主要由籽粒蛋白質、淀粉和脂類等組分及其特性所決定。傳統的小麥品質評價只是單個性狀的逐一比較,在國家小麥品種(系)審定規范中,雖然小麥品質以蛋白質含量,濕面筋含量,面團穩定時間等作為強、中、弱筋的分類標準,但仍然是單個指標的比較。通過主成分分析,可以了解供試品種(系)品質性狀主成分構成因子及其特征和生物學意義,為品種(系)的客觀評價和選育親本的選擇提供參考依據,進而篩選出不同用途專用優良品種(系)供生產應用[12]。本研究從2009~2010年度96個小麥樣品中篩選出泰農7058、05428、泰山4173、山農71、056487、泰農2987等6個綜合品質性狀優良的優質新品種(系)。
通過對山東省區試小麥兩年的樣品進行主成分分析,提取的三個主成分對應了三類小麥品質因子(蛋白質量因子、磨粉因子、蛋白數量因子),從三個主成分的貢獻率來看,應強調蛋白質量因子是小麥品質評價中的首要因子,磨粉因子也有較高的貢獻率,應引起重視。前人的研究也證明對烘烤品質來說蛋白質或面筋的質比量更重要,當前品質育種應在一定蛋白質含量的基礎上著重改良蛋白質和面筋的質量,沉降值與營養品質和烘烤品質的多數性狀相關顯著或極顯著,是面筋質和量的綜合指標且遺傳力高,可用于早代大量品種(系)的篩選,且此法操作簡單,在缺少粉質儀的研究單位,不失為一種有效的品質檢驗方法[7]。另從本研究的結果看出,磨粉因子相對于蛋白數量因子有較高的作用,蛋白質含量和濕面筋含量一直是業內小麥評價的依據,從本研究來說,磨粉因子里的硬度指數較之于蛋白含量也許有著更為重要的作用。
系統聚類分析既可以揭示品種(系)類群間的遺傳差異與相互關系,又可以了解類群內品種(系)的遺傳相似性[14],采用聚類分析對數據進行處理,可以表征和區分不同品種(系),具有揭示供試品種(系)品質的綜合表現和同一性狀差異分類的特點。兩種方法結合起來能較好的對品種(系)進行評價,更好的了解品質性狀的遺傳相似性與差異性,為品種(系)改良提供客觀依據。
[1]劉愛峰,程敦公,李豪圣,等.近年來山東省主要父本小麥育種材料的品質特性[J].山東農業科學,2010,5:15-20
[2]黃承彥,遲斌,曲輝英,等.山東省小麥品種品質狀況分析[J].山東農業科學,2004,2:12-15
[3]田紀春.優質小麥[M].山東:山東科技出版,1995:2-3
[4]中華人民共和國農業部.農作物品種審定規范(小麥)NY/T967-2006[S].北京:中國農業出版社,2006
[5]馬艷明,范玉頂,李斯深,等.黃淮麥區小麥品種(系)品質性狀多樣性分析[J].植物遺傳資源學報,2004,5(2):133-138
[6]劉艷玲,田紀春.小麥主要品質性狀影響面包烘烤的回歸分析[J].山東農業科學,2004,2:16-19
[7]呂惠珠,韓建林,位國臣,等.小麥品質性狀間的相關分析[J].萊陽農學院學報,2002,4:267-269
[8]楊金,張艷,何中虎,等.小麥品質性狀與面包和面條品質關系分析[J].作物學報,2004,30(8):739-744
[9]陳四龍,李玉榮,程增書,等.花生品種(系)生物學性狀的主成分分析和聚類分析[J].花生學報,2007,36(2):28-34
[10]宋江峰,李大婧,劉春泉,等.甜糯玉米軟罐頭主要揮發性物質主成分分析和聚類分析[J].中國農業科學,2010,43(10):2122-2131
[11]張瑞蓮,袁海波,尹軍峰,等.主成分分析與聚類分析在茶飲料湯色穩定性評價中的應用[J]茶葉科學,2010,30(4):287-294
[12]李德一,張樹文.黑龍江省水資源與社會經濟發展協調度評價[J].農業系統科學與綜合研究,2010,1:75-79
[13]孟慶立,關周博,馮佰利,等.谷子抗旱相關性狀的主成分與模糊聚類分析[J].中國農業科學,2009,42(8):2667-2675
[14]陶愛芬,祁建民,林培青,等.紅麻優異種質產量和品質性狀主成分聚類分析與綜合評價[J].中國農業科學,2008,41(9):2859-2867
ComprehensiveAssessment on Wheat Quality in Regional Test of Shandong Based on Principal Component and Cluster Analysis
SUN Cai-ling1,2,QU Hui-ying3,LV Jian-hua3,TIAN Ji-chun1,2*,ZHANG Yong-xiang1,2,WANG Shou-yi1,2,SONG Xue-jiao1,2
1.College of Agronomy Shandong Agricultural University,Taian271018,China
2.State Key Laboratory of Crop Biology,Taian271018,China
3.Shandong Seed Administration Station,Jinan250000,China
Based on the principal component analysis and cluster analysis,we analyzed and comprehensively evaluated the wheat quality of 297 varieties participated in the regional test of Shandong province in 2008-2009 and 2009-2010.Three principal components were extracted for evaluating the overall wheat quality.The first principal component was protein quality factor(gluten index,sedimentation value and formation time,setting time).The second principal component was milling factor(hardness index,flour yield,water absorption,whiteness).The third principal component was protein quantitative factor(moisture content and grain protein content).The cumulative variance contribution rates of the three principal components were 77%and 82%,respectively.The contribution rate of the first principal component factors were 34.453%and 36.291%in the two years,which indicated gluten index,sedimentation value and formation time,setting time were the main factors affecting the wheat quality.From the evaluation results of 96 varieties in 2009-2010 based on principal component analysis,we found Tainong7058,Tainong05428,Taishan4173,Shannong71 and so on had high quality score, outstanding comprehensive quality traits.While integrated with contribution rates of principal components,the eigenvalues size of different indicators and maneuverability,we proposed that gluten index,sedimentation value and hardness index could evaluate the wheat quality indirectlyin the early breeding program.R-type analysis clustered 10 traits into four categories(flour whiteness into a separate category),in which indicators of three traits coincided with indicators of three components in principal components.Q-type analysis clustered 96 varieties in 2009-2010 based on principal component analysis,the indicators of 6 varieties in the group-Ⅲwere high,which agreed with the results of principal componentanalysis.That further validated the principal component analysis could be used for comprehensive evaluation of wheat varieties(lines)quality.
Wheat quality;principal component analysis;cluster analysis;comprehensive assessment
S324
A
1000-2324(2014)04-0545-07
2013-06-08
2013-08-06
國家轉基因生物新品種培育科技重大專項(2008ZX08002-003、2009ZX08002-017B-03)
孫彩玲(1966-),女,本科,實驗師,研究方向:小麥品質檢測和研究.E-mail:suncailing66@sina.com
*通訊作者:Author for correspondence.E-mail:jctian@sdau.edu.cn