劉寶海 聶守軍 高世偉 劉 晴 劉宇強 馬 成 常匯琳 張佳檸 薛英會 白 瑞
(1.黑龍江省農業科學院 綏化分院,黑龍江 綏化 152052;2.黑龍江八一農墾大學 農學院,黑龍江 大慶 163319)
黑龍江省稻作區是中國最北部的寒地稻作區,也是優質粳米生態區。作為黑龍江主要糧食作物的水稻,2018年種植面積約為378萬hm,約占全國粳稻總種植面積50%,約占全國種植面積3 019萬hm的12.5%,水稻總產量2018年達2 685.5 萬t,約占全國水稻總產量的12.7%,在糧食生產和保障國家糧食安全方面起到了舉足輕重作用。優良新品種的選育和應用為寒地水稻單產提高、總產持續增加、綜合生產能力穩定提升做出了突出貢獻。
育種目標是開展育種實踐工作的前提、依據和指南,其制定的準確與否直接關系到育種工作的成敗。多目標性狀優化問題中,面臨多個優化目標性狀往往是不易兼顧的,幾乎不存在一個解能夠同時滿足優化多個目標的最優函數。求解多目標優化問題實質就是在滿足所有約束條件和各個目標函數條件下的1組最優Pareto解集,同時也需要對解進行評價選擇,常見評價方法有基于效用函數沖突解決理論和理想點法等。隨著VEGA、NSGA和NSGA-Ⅱ等方法相繼提出,利用遺傳算法求解Pareto解集迅速得到廣泛應用,但主要應用于種植結構調整、水資源配置、機械設備制造和調度問題等方面。
水稻育種目標中高產和優質是永恒的主題,進入21世紀以來, 隨著人們生活水平顯著提高,育種目標也從單一高產轉向優質、抗病和高產等復合性狀目標。然而這些目標性狀受遺傳與環境影響,往往是互相矛盾且不易兼顧、難以量化統一協調的。目前,育種家設計育種目標時,較少考慮未來5~10年生產對品種特征的需求,且存在著經驗定性較多而客觀量化較少、性狀單一局限突出而協調統一不足的問題。采用遺傳算法進行多目標優化模型應用,已經被不少學者在多方面使用且效果良好,但應用此方法于水稻育種多目標優化設計,并結合熵權評價法對Pareto解集進行功效綜合評價鮮見報道。本研究參照7個黑龍江省第二積溫帶主推水稻品種的22個農藝性狀變量指標數據值,運用NSGA-II遺傳算法與功效評價法,旨在優化設計適宜黑龍江省第二積溫帶水稻生產需求的育種多目標性狀參數值方案,以期為寒地不同積溫生態區水稻及大豆、玉米等作物新品種的育種多目標優化提供參考。
本試驗在黑龍江省綏化市北林區秦家鎮(46°49′ N,126°57′ E)進行。選擇2015—2019年黑龍江省第二積溫帶‘綏粳號’主推水稻品種,包括‘綏粳4號’(V)、‘綏粳15號’(V)、‘綏粳16’(V)、‘綏粳18’(V)、‘綏粳22’(V)、‘綏粳23’(V)和‘綏粳28’(V)共7 個品種,種子來源于黑龍江省農業科學院綏化分院。V品種2018年種植2.46萬hm,占全省水稻播種面積的0.66%,V、V、V、V、V和V品種2019年分別種植14.36萬、6.32萬、68.21萬、21.92萬、0.25萬和5.38萬hm,各占全省水稻播種面積的3.77%、1.66%、17.93%、5.76%、0.93%和1.42%,7個品種累計占全省播種面積的32.13%。其中V種植面積全省第1位,V是黑龍江省首個香稻品種,其他5個品種均在不同年份被列為黑龍江省優質高產水稻品種植區劃布局主推品種。
1
.2
.1
試驗設計試驗采用田間種植品種比較試驗設計。供試材料于2019和2020年的4月中旬苗床育秧播種,播種量為250 g/m。5月下旬栽插本田,每個品種10行,行長10 m,行距30.3 cm,株距13.3 cm,每穴3株苗。3次重復。田間施尿素200 kg/hm,磷酸二銨120 kg/hm,硫酸鉀75 kg/hm。尿素使用比例為基肥∶蘗肥∶穗肥∶粒肥=5.0∶3.0∶1.5∶0.5,磷酸二銨為基肥施用,硫酸鉀施用比例為基肥∶穗肥=6∶4。生長期水分管理以淺水間歇灌溉為主,8月末停水。田間不施農藥。
1
.2
.2
數據采集采集指標主要包括:株高(x
)、劍葉長(x
)、劍葉寬(x
)、穗長(x
)、穴穗數(x
)、每穗粒數(x
)、每穗實粒數(x
)、千粒重(x
)、著粒密度(x
)、結實率(x
)、實際產量(x
)、谷粒長(x
)、谷粒寬(x
)、長寬比(x
)、堊白度(x
)、堊白米率(x
)、出糙率(x
)、整精米率(x
)、直鏈淀粉含量(x
)、膠稠度含量(x
)、蛋白質含量(x
)和食味品質分值(x
)。數據采集方法為:水稻成熟期,調查供試材料小區中間4行40穴穗數,計算平均穴穗數,按平均穴穗數選取有代表性10穴植株考種,采集株高、劍葉長、劍葉寬、穗長、每穗粒數、每穗實粒數、千粒重、著粒密度和結實率等性狀,選擇小區中間2 行去除行頭0.5 m收獲,自然風干后脫粒測定小區實際產量并折算單產,kg/hm。稻谷收獲儲藏1個月后,利用萬深SC-E大米外觀品質檢測及稻米品質判定儀(杭州萬深檢測科技有限公司)測定谷粒長、谷粒寬、長寬比、堊白米率和堊白度,參照國家標準《優質稻谷(GB/T17891-2017)》測定出糙率、精米率、整精米率、直鏈淀粉含量、蛋白質含量和膠稠度含量。用日本靜岡制機株式會社的QS-4000型高精度近紅外線食味分析儀測定精米食味品質。
1
.2
.3
多目標優化1)確立目標變量關系函數。構建如公式(1)和(2)所示的以實際產量、食味品質分值為因變量,其他指標性狀值為自變量的關系函數。
Y
=b
+b
x
+b
x
+…+b
x
(1)
T
=b
+b
x
+b
x
+…+b
x
(2)
式(1)~(2)中:Y
表示實際產量函數;T
表示食味品質函數;x
為待優化的自變量性狀值;b
為常數項;b
為偏回歸系數;p
表示某個自變量性狀。2)構建多目標優化函數模型。種植水稻品種實際產量目標、精米食味品質目標越大越好,建立的目標優化函數如下述公式(3):
max=[f
(x
),f
(x
)](3)
式(3)中:f
(x
),產量Y
函數;f
(x
),精米食味品質T
函數;x
,待優化的性狀變量。根據種植、加工和消費等主體對品種性狀要求,制定約束條件如公式(4):
s.t.
=lb≤x
≤ub(4)
公式(4)中:lb和ub分別為變量x
的下限和上限約束。3)優化函數模型求解。本研究采用NSGA-II遺傳算法,通過MATLAB編程,實現優化函數模型的求解。運用該算法求解步驟如下:首先,對模型構建中決策變量作實數編碼,其中包括穗實粒數、千粒重、膠稠度含量、蛋白質含量和整精米率等。其次,隨機產生N個個體初始種群,非支配排序后,通過選擇、交叉和變異得到F子群。然后,F開始將父代與子代結合,作快速非支配排序和擁擠度計算,再選取合適個體形成新父代種群。最后,運用遺傳算法基本操作產生新1代子群,依次類推,直到滿足條件為止。
1
.2
.4
優化結果評價利用熵權綜合評價法,結合實際解決問題需要,對最優Pareto解集進行評價,具體步驟如下:
1)設定m
個評價方案,n
個評價指標,各指標原始數據矩陣表示為公式:R
={r
}×(i
=1,2,3,…,m
;j
=1,2,3…,n
)(5)
式(5)中:r
,第i
個評價方案第j
個指標值。2)計算標準化數據如公式(6),確定如公式(7)的標準化數據矩陣P
:(6)
P
={p
}×(i
=1,2,3,…,m
;j
=1,2,3,…,n
)(7)
式(6)和(7)中:P
,第i
個評價方案第j
個指標綜合標準化值;m
,評價單元數量。3)計算評價指標信息熵,可表示為公式:
(8)
式(8)中:e
,第j
個指標的信息熵。4)計算各指標權重,即熵權,可表示為公式:
(9)
式(9)中:ω
,第j
個指標的權重(熵權)。5)計算各指標隸屬函數價值系數值b
,如公式(10)(指標均為正效益)、(11)(指標均為負效益)所示,從而確定功效矩陣B
。(10)
(11)
B
={b
}×(i
=1,2,3,…,m
;j
=1,2,3,…,n
)式(10)和(11)中:b
,第i
個評價方案第j
個指標的價值系數值。6)對Pareto解集方案綜合評價,計算如公式(12)所示:
(12)
式(12)中:CI,第i
個方案第j
個指標評價下的綜合評價指數值。利用IBM SPSS Statistics 25.0軟件,對采集的22 個性狀指標變量平均值數據進行回歸線性分析,確立目標變量關系函數。利用MATLAB(R2017a)軟件編輯源代碼,對篩選出的Pareto解集指標數據進行評價獲取綜合評價指數值(CI)。2019和2020年7 個品種22個農藝性狀的指標值重復性好且變化趨較一致,故本研究主要利用2020年數據進行統計分析。
x
)和谷粒寬(x
)2 個性狀指標差異均達顯著水平(P
<0.05),其他20個性狀間差異均達極顯著水平(P
<0.01)。其中株高(x
)、劍葉長(x
)、著粒密度(x
)、結實率(x
)、堊白度(x
)、堊白米率(x
)和出糙率(x
)在7個品種間的遺傳變異多樣性較豐富,劍葉寬(x
)、千粒重(x
)、谷粒長(x
)、谷粒寬(x
)、谷粒長寬比(x
)、蛋白質含量(x
)和食味品質性狀(x
)在品種間遺傳變異多樣性較小。各性狀指標值在品種間表現的較大差異性和相對穩定性,既利于供試品種特性參數指標充分表達,也能夠保證目標變量函數模型構建可靠性。表1 供試品種農藝性狀指標試驗結果
Table 1 Test results of agronomic characters of tested varieties
品種Varietyx1x2x3x4x5x6x7x8x9x10x11 V186.0f24.0c1.3bc14.6e19.0d104.8c97.0cd26.3b7.2a92.6d9970.2b V289.7e21.0e1.5ab17.6d21.7b113.8b98.0c25.7c6.5b85.2f9019.0c V393.4d27.0a1.5ab17.0d18.3e118.4a96.9cd26.6b7.0a81.9g8333.3d V487.4f22.0d1.4b16.5d20.0c102.8c109.0a26.0b6.2c94.4b10375.0a V5101.9b23.6c1.2c18.9b16.0f100.9d94.1d26.6b5.3e96.1a8217.3de V6108.1a25.2b1.6a21.4a19.0d111.6b102.0b26.8b5.2f86.9e7917.3e V798.5c18.2f1.2c18.0c24.3a103.9c94.0d27.8a5.8d93.4c9989.3b均值Averag95.023.01.417.719.8108.098.726.56.290.19117.3 F364.46??331.77??6.50??131.96??163.35??38.37??52.98??5.23??107.75??1009.83??145.17??品種Varietyx12x13x14x15x16x17x18x19x20x21x22 V15.4b2.7a2.0b0.1g1.0e80.1e71.7b17.5d73.6c6.5b83.0b V25.4b2.6ab2.1b1.2b5.5b81.9d68.4c18.7a71.0e6.6b80.0c V35.2b2.6ab2.0b0.6e4.0c82.4c67.3d17.8bc73.3c6.5b81.0c V45.4b2.6ab2.1b1.0c0.2f84.6a72.8a17.6c74.6b6.7ab80.0c V55.3b2.6ab2.0b0.3f2.5d82.0c71.9b17.9bc74.0bc6.5b84.0a V66.0a2.4b2.4a2.6a6.0a79.2f64.5e18.1b76.5a6.8ab84.0a V75.7ab2.4b2.4a0.8d2.5d83.4b72.3ab17.5d72.0d6.9a85.0a均值Averag5.52.62.10.93.181.969.817.973.66.682.4 F4.01?3.86?23.00??475.67??356.50??158.02??94.75??11.61??53.99??5.50??18.00??
注:V,‘綏粳4號’;V,‘綏粳15號’;V,綏粳16;V,綏粳18;V,綏粳22;V,綏粳23,V,綏粳28。,株高,cm;,劍葉長,cm;,劍葉寬,cm;,穗長,cm;,穴穗數;,每穗總粒數;,每穗實粒數;,千粒重,g;,著粒密度,粒/cm;,結實率,%;,實際產量,kg/hm;,谷粒長,mm;,谷粒寬,mm;,長寬比;,堊白度,%;,堊白米率,%;,出糙率,%;,整精米率,%;,直鏈淀粉含量,%;,膠稠度,mm;,蛋白質含量,%;,食味品質。*和**表示5%和1%水平差異顯著。同列不同小寫字母表示不同品種處理在5%水平差異顯著。下同。
Note: V,‘Suijing 4’;V,‘Suijing 15’;V,‘Suijing 16’;V,‘Suijing 18’;V,‘Suijing 22’;V,‘Suijing 23’,V,‘Suijing 28’., plant height,cm; , flag leaf length, cm; , flag leaf width, cm; , panicle length, cm; , panicles per clump; , grain number per panicle; , filled grain number per panicle; , thousand grain mass, g; , grain density, grain/cm; , seed setting rate,%; , actual yield, kg/hm; , grain length, mm; , grain width, mm; , ratio of length to width; , chalkiness, %; , chalky rice rate, %; , percentage of brown rice, %; , head rice rate, %; , amylose content, %; , gel consistency, mm; , protein content, %t; , taste quality.* and ** indicate significant difference at 0.05 and 0.01 levels.Different lowercase letters in the same line mean significant differences among varieties at 0.05 levels.The same below.
利用表1性狀指標均值數據,分別以產量(Y
)和食味品質(T
)為因變量,其他20個性狀值為自變量,構建多元回歸模型線性方程,見公式(13)和(14),并對f
(x
)和f
(x
)回歸模型方程擬合度分析,其相關系數值均為R
=1.00,說明模型與實際擬合度極好,試驗誤差極小,可解釋全部響應變量的變化。f
(x
)=(13)
f
(x
)=(14)
f
(x
)回歸方程中自變量有劍葉寬(x
)、穗長(x
)、穴穗數(x
)、穗實粒數(x
)、千粒重(x
)、結實率(x
)、出糙率(x
)、膠稠度含量(x
)和蛋白質含量(x
)。f
(x
)回歸方程中自變量有株高(x
)、穗實粒數(x
)、結實率(x
)、谷粒寬(x
)、長寬比(x
)、出糙率(x
)、整精米率(x
)、直鏈淀粉含量(x
)、膠稠度含量(x
)和蛋白質含量(x
)。同時,根據種植、加工和消費等經濟主體對品種性狀的要求,建立制定約束條件如公式(15),公式中x
、x
、x
、x
、x
、x
和x
變量性狀能夠滿足種植者對高產穩產“好種”的要求,x
變量性狀能夠滿足加工企業要求整精米率高降低生產成本“好加工”的要求,x
、x
、x
、x
、x
和x
變量性狀能夠滿足消費者對稻谷外觀和理化指標食味優良“好吃”的要求。(15)
x
及與方案對應的目標函數值f
(x
)、f
(x
)(表2)。在Pareto前沿面上,隨產量指標值增大,食味品質指標值減少,呈向上凸起趨勢,同實踐中產量與品質相互負向影響情況相符合(圖1)。50個方案中產量指標值在7 843.35~12 660.1 kg/hm,食味品質指標在85.15~95.98分,見表2。可篩選出相互干擾而達較高水平優化平衡的育種方案。
圖1 某次運行第1前端個體Pareto分布圖
由表3可知,確定育種多目標優化方案綜合評價指數(CI)排序前10 位代號方案由高到低為20、24、34、35、3、44、10、37、32和4。這10個方案食味品質指標在90.85~93.54分(表2),均達國家1級米標準,且均大于表1中供試品種食味品質分值,但均不是食味品質分值最高的方案。同時,產量指標在9 916.28~10 959.79 kg/hm,均大于供試品種產量平均值(表1),但也均不是產量最高方案。說明這10 個優先方案,達到食味品質分值與產量及其構成因素較高水平優化目標。
表3 基于Pareto最優解的綜合評價指數值及排序
Table 3 Index value and order of comprehensive evaluation based on Pareto optimal solution
排序Order綜合指數CI方案Program排序Order綜合指數CI方案Program排序Order綜合指數CI方案Program排序Order綜合指數CI方案Program10.727920140.628246270.526445400.4192120.725624150.628012280.511141410.4127730.720134160.627718290.509017420.3980840.719535170.590025300.462439430.38952350.71463180.588913310.455511440.38941560.713644190.587827320.45439450.37343070.661210200.554340330.453038460.36983180.659937210.553626340.452948470.36374790.656432220.546614350.448950480.363433100.65444230.543049360.448536490.357343110.645022240.54286370.43965500.35462120.643428250.536716380.437721130.635542260.533719390.430529
由表4可知,10 個優化方案各性狀變異系數值在0.01%~3.17%,說明這些參數值變化既有穩定性,也有差異性。育種實踐過程中,應立足未來5~10年優質、高產和多抗水稻新品種需求,針對產量和品質等性狀指標不易兼顧、難以量化統一協調的瓶頸問題,設計黑龍江省第二積溫帶水稻育種目標方案模型,即選育目標新品種性狀參數值為:食味品質分值≥90.0分,產量9 916.28~10 959.79 kg/hm,株高94.0~96.0 cm,劍葉寬1.4~1.5 cm,穗長16.0~16.1 cm,穴穗數24.3~24.5穗,穗實粒數97.0~102.0 粒,千粒重24.5~24.9 g,結實率≥96%,谷粒長寬比2.4~2.5,出糙率≥81.4%,整精米率≥71.5%,直鏈淀粉含量15%~18%,膠稠度含量76.7~78.7 mm,蛋白質含量6.3%~6.6%。同時,育種實踐中也要兼顧抗倒伏、抗病性指標要求,即水稻倒伏面積≤20%、倒伏傾斜角度≤30°,穗頸瘟病發病面積≤5%。
作物育種目標貫穿著整個育種過程,只有確定了準確合理的育種目標, 才能減少育種工作的盲目性, 增強主動性, 最大限度地利用現有種質資源, 提高育種效率。育種目標既需要科學的前瞻性, 又要有與當下生產需要緊密結合的實用性。就水稻常規有性雜交育種而言,當下實施的育種目標一般需要10年才能穩定下來,其呈現效果也將直接影響品種應用前景。據統計,2015—2019年黑龍江省優質高產水稻品種種植布局主推品種共69個,其中2013—2019年黑龍江省審定品種有40 個,約占全部主推品種的58%,占這期間全省206個審定品種的19%,剩余81%的品種極有可能因其性狀指標不能滿足生產需要而不能大面積推廣。因此,只有以當下優良品種為基礎,面對未來市場產業化生產需求,制定明確、合理的育種目標,適時推動育種實踐,才能減少育種工作的盲目性和失效性,有利于集聚有限的資源,提高育種工作效率。
遺傳算法是一種模擬生物進化和遺傳變異機制的概率優化方法,目前不少學者已經將智能算法與多目標優化相結合進行模型應用。遺傳算法中有主要目標法、理想點法、線性加權法、最大最小法及目標達到法等多目標優化方法,這些方法各有優劣。使用多目標遺傳算法可以獲得無窮多個非劣解,如何從中選擇出最符合實際需求的方案需要進行系統客觀的評價。本研究提出一種將智能遺傳算法與功效評價相結合的寒地水稻育種多目標優化評價方法,采用NSGA-II遺傳算法對主要目標函數進行優化模型求解,根據實踐需要選擇某次Pareto解集后,利用熵權功效評價法對Pareto解集進行評價,能夠獲得符合優化問題實際需要的育種目標優化方案,完善了寒地水稻育種目標設計理論與方法。也可用于寒地不同積溫生態區水稻新品種的育種多目標優化設計。
優選方案結果的實用性和可行性,關系到尋優結果是否具有實際推廣價值。同時也需要對多個目標性狀進行權衡利弊綜合評價。本研究獲得的黑龍江省第二積溫帶水稻育種目標方案模型,尤其是設計的10 個優化方案16 個目標性狀參數值范圍,與2018年黑龍江省種植推廣面積最大的‘綏粳18’性狀參數均值對照,株高增加6.6~8.6 cm,穗長減少0.4~0.5 cm,穴穗數約增加4穗,穗實粒數減少7~12粒,千粒重減少1.1~1.5 g,結實率增加1.6%以上,谷粒長寬比增加0.3~0.4,出糙率約減少3%,整精米率約減少1%,直鏈淀粉含量約減少2%,膠稠度含量增加2.1~4.1 mm,蛋白質含量減少0.1%~0.4%,產量變化范圍-459~585 kg/hm,食味品質分值增加10 分以上。10 個尋優方案,較采用傳統經驗定性和單一量化育種目標方案,可避免主觀評價誤差,實現不易兼顧的多目標性狀統籌設計,對于長周期水稻育種實踐具有較強科學性、普遍性和實用性。本研究在建模過程中沒有考慮抗病和抗倒伏等目標性狀,存在一定局限性,同時也沒有利用目前生產上大面積推廣或潛在具有生產推廣可能性的品種,進行模型驗證,今后還有待對此做進一步分析。
本研究面向未來5~10年寒地水稻育種需求,針對目前寒地水稻育種多目標優化設計方法較少,尤其是產量、品質等性狀指標互相矛盾且不易兼顧、難以量化統一協調的問題,以黑龍江省第二積溫帶7個主推水稻品種22個農藝性狀值為參照,運用NSGA-II遺傳算法與和熵權綜合評價法,優化設計出適宜黑龍江省第二積溫帶水稻生產需求的育種目標性狀參數值方案共10個。優化方案顯示,水稻的食味品質分值達90.9~94.5分,較供試品種均值增加8.5~13.0分,產量9 916.3~10 959.8 kg/hm,較供試品種產量均值增加799.0~1 842.5 kg/hm,其他16個性狀參數值均有相應量化調整,可以獲得更加合理的育種方案。綜上,遺傳算法和熵權評價法結合可用于不同寒地生態區水稻新品種多目標科學量化設計并提高育種效率。