999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習算法的冬小麥始花期預報方法

2021-09-04 12:01:36趙艷霞楊榮明
農業工程學報 2021年11期
關鍵詞:模型

徐 敏,趙艷霞,張 顧,高 蘋,楊榮明

(1.江蘇省氣候中心,南京 210008;2.中國氣象科學研究院,北京 100081;3.江蘇省氣象服務中心,南京 210008;4.江蘇省植物保護植物檢疫站,南京 210036)

0 引 言

小麥赤霉病防治時期不同,用藥效果差異較大,始花期是其最佳防治期。在小麥揚花6.0%~37.5%時施藥,病指防效可達72.0%~79.0%;過早或過遲用藥,病指防效均低于 45.0[1-4]。赤霉病是威脅小麥產量和品質的重大流行性病害,而且已成為小麥生產可持續發展的重要影響因素之一[5-6],因此,開展小麥始花期預報研究對赤霉病精準防治具有重要意義[7]。

以意大利山洪預警系統為例,歐盟一些國家所建設的山洪預警系統主要包括三個方面的內容:一個可視化的便于操作的平臺;具有不同功能的模塊,包括服務器優化計算分析模塊,實時數據接收和存儲模塊,雷達數據管理和處理模塊;綜合形成預警信息的決策信息生成系統。在監測預警系統建設中,歐盟非常重視基礎工作,例如建立相對比較詳細的自然和社會經濟數據庫,開展降雨與流量的耦合監測和分析,進行山洪災害事件現場調查和數據整編入庫等。

兩種針刺工藝路線主要區別在于進入預刺之前,PPS含基布濾料會作為夾心層鋪在凈氣面(底層)上,然后迎塵面 (面層)纖網會鋪在PPS基布上,形成三層結構,PPS無基布濾料在進入預刺之前不會有放卷PPS基布在兩層纖網中間,針刺環節只會發生纖維與纖維之間的抱合。由于無基布濾料沒有基布作為加強層,在針刺工藝參數設置上,會適當降低針刺密度,增加針刺深度,增加針刺機工作輥速度,增加梳理機喂入量,以降低對纖維的損傷,同時保障纖維之間的抱合力。

根據冬小麥生長發育與氣象條件之間的關系及自身的生理特性,國內外學者針對其生育期監測預測開展了系列研究,方法主要有 3類:一是通過冬小麥生育期模型進行預測,二是通過衛星遙感監測資料提取冬小麥關鍵物候期,三是通過統計預報法或經驗進行預測。生長模型充分考慮了冬小麥生長發育的生理過程,因此在本地化應用之前需要大量的試驗數據為基礎,對敏感參數進行校正,還要針對研究區域的氣候特征和冬小麥品種等,調試出不同品種的模型參數,而冬小麥品種繁多,所以作物模型在實際應用中還存在一定難度和限制[8]。遙感技術的發展為大面積監測作物關鍵物候期提供了新的手段[9],如2016年楊琳等[10]利用MODIS NDVI數據提取了冬小麥返青期、抽穗期、成熟期的普遍期,由于采用動態閾值法提取物候期需要人為設定閾值,并且沒有考慮閾值的空間變化,會影響物候提取的精度。20世紀80年代起,中國農業氣象工作者在作物發育期預報方面總結了積溫法[11]、溫濕法[12]等統計預報方法,還總結了平均間隔法、物候學法等經驗預測法,統計方法和經驗法較前 2種方法相對簡單易算,但由于影響生育期的多重因子之間存在較為復雜的非線性關系,在一定程度上限制了預報精度的提升。前人的研究為冬小麥生育期預報研究奠定了基礎,但在預報精度、實際應用可操作性等方面還有待改進,而且專門針對冬小麥始花期預報方法的研究尚未見詳細報道。因此,本文將利用機器學習算法在客觀度量各預報因子重要性的基礎上,考慮因子間的非線性作用,建立始花期預報模型,擬進一步提高預報精度,且具有可行性。

1)MOR方案和MY方案的模擬的結果在雨帶的走勢上與實況十分吻合,都成功模擬出東北—西南走勢的雨帶,但在雨帶的位置上,MOR方案模擬的效果要更接近實際情況;對于最大累積降水量的模擬,MOR方案和MY方案的最大累積降水量都超過實際情況,但相比于MOR方案,在最大累積降水量的模擬上,MY方案效果與實際更為接近。

結合上述“地平線歐洲”和“地平線2020”比較分析,可以看出“地平線歐洲”的四大重大轉變同中歐科技合作的共識契合度高,是支持未來中歐科技合作的有力政策執行工具。對歐科技合作中,中國科技界可以在中歐科技合作共識基礎上,結合中國科技發展自身利益需求,充分利用“地平線歐洲”這一歐盟科技政策執行工具,特別是該計劃下的資金、資源和政策,推動和實現雙方在共同利益領域互利互惠的科技合作。啟示建議如下:

1 資料與方法

1.1 數據資料

冬小麥生育期觀測資料和氣象觀測資料均來自于江蘇省氣象局,其中,江蘇省冬小麥生育期觀測資料普遍始于20世紀80年代初期,觀測站點共10個:昆山、如皋、興化、大豐、盱眙、濱海、淮安、沭陽、贛榆、徐州。冬小麥播種期、出苗期、三葉期、分蘗期、越冬期、返青期、起身期、拔節期、孕穗期、始穗期、抽穗普遍期、始花期、開花普遍期、乳熟期等,均由專業的農業氣象技術人員按照《農業氣象觀測規范 冬小麥》(QX/T 299-2015)觀測所得,一般發育期在下午觀測,開花期在上午觀測,其中抽穗與開花期每日觀測,穗期和花期是以觀測的總株(莖)數進入發育期的株(莖)數所占的百分率確定,當第一次進入開花期的株(莖)數百分率≥10%時,該日期記錄為始花期。

氣象數據為各站點生育期觀測年份對應的逐日氣象觀測資料,主要包括平均氣溫(℃)、≥0℃活動積溫(℃)、最低氣溫≤0℃的累計日數(d)、降水量(mm)、降水日數(d)、日照時數(h)、日照百分率≥60%的日數(d)。

2.3.2 基于BP算法建立始花期預報模型

在大數據時代的背景下,機器學習算法在預測模型構建及特征變量重要性評估等方面開始凸顯優勢[13],已成為現代農業氣象科研和業務發展的重要工具[14],如隨機森林、神經網絡等,這些算法不要求樣本數據滿足特定的分布形式,具備解決高維變量的能力[15],已在玉米發育程度自動識別[16]、大豆精細識別[17]、梨花花期預報[18]、油菜花期預報[19]、赤霉病病穗率預測[20]中進行了較好地應用。本文采用隨機森林算法、反向神經網絡算法、多元線性回歸算法分別建立冬小麥始花期的預報模型,并對模型精度進行較為全面的比較。研究結果可為優選較合適的算法建立冬小麥始花期預報模型提供依據,同時也為進一步提高預報精度提供了新思路。

1.2 資料預處理和區域劃分

始花期數據采用日序法轉換為數值型數據,即1月1日、1月2日、1月3日……分別為1、2、3……,其余類推。由于江蘇南北跨度較大,氣候條件的差異影響著始花期的遲早,按照氣候相似性原則,結合農業區劃,以淮河灌溉總渠和長江為界線,分為蘇北、蘇中、蘇南3個區域,文中搜集到10個觀測站點,按照所在地區,徐州、贛榆、淮安、沭陽、濱海可作為蘇北地區的代表站點,大豐、如皋、興化、盱眙可作為蘇中地區的代表站點,昆山可作為蘇南地區的代表站點。

1.3 方法介紹

1.3.1 隨機森林算法

藥士歉然一笑,回道:“小姐錯了,孕者脈相為滑脈,即脈往來流利,應指圓滑,呈連珠滾玉盤之狀,并非是兩個脈。此女子脈相特殊,體內如有兩顆心臟,同跳同止,頻率一致,但她的心子,確實只有一顆,這種怪相,我也從來未曾遇見過。”

隨機森林(Random Forest,RF)算法是以決策樹為基分類器的一個集成學習模型{H(x,θk);k=1,…},{θk}表示獨立同分布的隨機變量,輸入特征變量X時,每一棵樹只投一票給其認為最佳的分類結果。所謂決策樹[21],是單個分類器,是一種從無次序、無規則的訓練樣本中推理出決策樹表示形式的分類規則的方法,相當于一種布爾函數。RF的分類結果由每棵樹投票中得票數最多的類確定[22],最終分類決策模型見公式(1):

式中H(x)表示隨機森林模型;hi(x)表示每個決策樹分類器;Y為目標變量,即始花期;I(hi(x)=Y)為指示性函數,采用R語言進行編程計算。

隨機森林的樣本數據集由影響始花期的氣象因子、播種期日序、始花期日序構成。首先采用隨機抽樣的方法,按照一定比例確定訓練集和測試集;然后通過自助法從原始樣本集采樣得到構建N棵樹所需的N個子集,每次未被抽到的數據稱為袋外數據,用來進行內部誤差估計和特征變量重要性評價。選用“精度平均減少值”,含義等價于“均方差增加值”(Increase in Mean Square Error,IncMSE)[23]作為特征變量重要性的評價指標,IncMSE值越大,說明該變量越重要,反之則相對不重要。通過特征變量重要性排序,可篩選出對始花期影響較大的變量,刪除一些和始花期無關或者冗余的特征變量,從而簡化特征數據集,使得預測模型更精確。

1.3.2 反向神經網絡算法

反向傳播(Back Propagation,BP)神經元網絡算法是基于 Delta 學習規則[24],利用梯度搜索技術,通過反向傳播來不斷調整網絡的權值和閾值,最終實現網絡的實際輸出與期望輸出的均方差最小化。文中采用 3層拓撲結構,即含輸入層、隱含層、輸出層,其中隱含層節點數采用經驗公式法[25]根據輸入層因子個數來設定,訓練過程中,設置模型收斂誤差為0.001,最大迭代次數為1 000次。

2.3.3 基于多元線性回歸算法建立始花期預報模型

多元線性回歸算法[26](Multiple Linear Regression,MLR)是根據自變量的取值來預測因變量的取值。文中采用“步進法”,即需對方程中引入的每個新變量進行檢驗,納入自變量的顯著性概率P值需小于0.05,剔除自變量的概率P值需大于0.1,以此類推,直至方程穩定。采用“德賓-沃森”法檢驗自變量之間的自相關性,若檢驗值接近0或4時,則存在自相關;若越接近2,則不存在自相關;采用容差的倒數(VIF)診斷自變量之間的共線性程度,0<VIF<10、10≤VIF<100、VIF≥100分別表明不存在多重共線性、存在較強的多重共線性、存在嚴重的共線性問題。對整個回歸方程采用F檢驗,若F值對應的Sig值小于0.05,則表明建立的回歸方程有效。

以轉歸為因變量。經單因素Logistic回歸分析,在α=0.10水平上,年齡、性別、肺部疾病史、原患疾病、ILD發生時間共5個指標有顯著性影響,可能作為吉非替尼致ILD死亡的危險因素。見表1。

采用決定系數(Coefficient of Determination,R2)、均方根誤差(Root Mean Square Error,RMSE)和預報準確率(Ratio of Accuracy,RA),對始花期預報模型的精度進行評價,其中決定系數R2是用來衡量預測模型對觀測值的擬合程度,它的值越接近1表明模型效果越好。

式中n為樣本總數,yai、ysi分別表示實際始花期和模擬始花期,、分別表示實際始花期平均值和模擬始花期的平均值。式(4)中Nj表示偏差天數為j天的年數,j表示始花期模擬值與實際值的偏差天數(j≤3 d)。

2 結果與分析

2.1 冬小麥始花期基本特征

從表1可見,10個站冬小麥始花期歷史最遲與最早相差天數都在21 d以上,不同區域間始花期存在差異,蘇北、蘇中、蘇南地區的平均始花期日序分別是120、115、110 d。標準差大小可以表示始花期的離散度,蘇北和蘇中地區始花期的標準差都是 5~6 d,蘇南地區始花期標準差是7 d。有觀測記錄以來歷史極端最早始花期是2002年4月5日,發生在昆山站,歷史極端最遲始花期是2012年5月13日,發生在沭陽站。各站冬小麥始花期存在年際波動,且標準差較大,所以有必要通過建立預報模型對始花期進行預報。從總的變化趨勢來看,濱海、淮安、昆山、如皋有較明顯的提前趨勢,線性傾向率分別為 4.3、3.2、3.2、2.6 d/(10 a);徐州、贛榆、大豐略有提前趨勢,主要集中在 2010年以來;沭陽、興化、沭陽變化趨勢不明顯。采用偏度和峰度檢驗法[26],對各站歷年始花期出現的時間序列進行正態分布性檢驗,首先計算出始花期時間序列的偏度、偏度標準誤差、峰度、峰度標準誤差,然后計算相應的Z評分(Z-score),即偏度Z-score=偏度值/標準誤差,峰度Z-score=峰度值/標準誤差,在α=0.05的檢驗水平下,發現10個站的偏度Z-score和峰度Z-score均在±1.96之間,則表明各站冬小麥始花期資料符合正態分布的特征,說明可以通過建立多元線性回歸模型對始花期進行預報。

表1 冬小麥始花期觀測時段和特征信息Table 1 Observation period and characteristic information of the first flowering stage of winter wheat

2.2 影響始花期的預報因子篩選及其評價

冬小麥在生長過程中需要具備一定的熱量、光照和水分,光溫水條件的匹配程度影響著生育進程的快慢,因此,為了篩選出對始花期有影響且符合生物學意義的氣象因子,將溫度、降水、日照 3類因子均作為預報因子的初選因子。考慮到所選預報因子距離實際始花期應有一定提前量,因此預報因子的統計終止日期設定為 3月末,選用的具體氣象因子見表2。利用建立的始花期預報模型在4月1日對各站的始花期進行預測,由于始花期歷史極端最早日期是4月5日,因此所建立的預報模型可以提前 5 d進行預測;最遲始花期中興化站日期最早,為5月2日,預報模型最早可以提前32 d。另外,考慮到播種期的早晚對生育進程也會有一定影響,因此將播種日序(記為D)也作為預報因子。

表2 影響冬小麥始花期的氣象因子Table 2 Meteorological factors affecting the first flowering stage of winter wheat

以27個氣象因子(表2)和播種日序作為RF算法的輸入向量,樹節點預選的變量個數Mtry根據28個預報因子總數分別設定為7、8、9、10、11,決策樹棵數Ntree設定為600,以始花期為輸出向量,利用RF算法分別對10個站點的輸入向量進行重要性排序,計算各特征向量的IncMSE。在成百上千次的機器學習過程中,并非每一次計算出的變量重要性排序結果都完全一致[27],此時可通過計算 IncMSE平均值來避免個別預報因子排位靠前的偶然性。對每個Mtry參數各計算50次,則各站需計算250次,針對蘇南、蘇中、蘇北3個區域,將各區域內對應站點的IncMSE進行平均,得到IncMSE區域平均值,以此進行各區域預報因子的重要性排序,篩選出重要特征變量再進行 RF建模可降低不重要變量對模型精度的干擾。

1.3.4 模型精度評價方法

從圖1可見,蘇南、蘇中、蘇北地區影響冬小麥始花期的因子中排在前列的重要因子基本一致,排在前五位的均為溫度類因子,分別為上年12月—當年3月日均溫≥0 ℃活動積溫、上年12月—當年3月平均氣溫、上年12月—當年3月最低氣溫≤0 ℃的累計日數、當年3月平均氣溫、上年12月—當年2月日均溫≥0 ℃的活動積溫,這5個因子的IncMSE累計占比在蘇南、蘇中、蘇北地區分別為64.0%、59.3%、64.8%,說明這5個因子對始花期的影響作用最為明顯。選取蘇南、蘇中、蘇北地區代表站點,即以昆山、如皋、徐州為例,計算始花期與各預報因子的相關系數,發現以上 5個因子與始花期存在高相關性,上年12月—當年3月日均溫≥0 ℃活動積溫、上年12月—當年3月平均氣溫、上年12月—當年2月日均溫≥0 ℃的活動積溫、當年3月平均氣溫與始花期呈現顯著的反相關,相關系數絕對值均在0.643以上,通過了0.001的顯著性檢驗,其中上年12月—當年3月日均溫≥0 ℃活動積溫與始花期的相關性最高,相關系數分別為?0.834(昆山)、?0.839(如皋)、?0.781(徐州),上年12月-當年3月最低氣溫≤0 ℃的累計日數與始花期呈現顯著的正相關,相關系數分別為0.790(昆山)、0.742(如皋)、0.643(徐州),這5個因子與始花期的相關系數普遍高于其他預報因子。當IncMSE值出現明顯拐點,可將出現拐點前的特征變量確定為相對重要的變量,可見蘇南、蘇中、蘇北地區降水類和日照類因子對始花期影響的重要性均明顯弱于溫度類因子,從相關系數數值上也反應出了 3類預報因子間同樣的重要性差異特征。結合冬小麥生育期生長發育特點,出苗、分蘗、越冬、返青、拔節、孕穗等生育階段,熱量條件都是最為重要的外界環境因子,溫度過低會抑制其生長甚至造成凍害,溫度偏高則會使得發育期提前。

大部分地區上年12月日照百分率≥60%的日數和當年1月日照百分率≥60%的日數與始花期呈弱的正相關,這可能與該階段小麥處于春化階段有關,春化階段需要有一定的低溫時段,這樣才有利于完成營養生長向生殖生長的過渡,若日照時數較多往往意味著天氣晴朗,氣溫通常會相對高一些,則完成春化的時間相對稍長一些,則易推遲抽穗開花,3月日照百分率≥60%日數與始花期均是呈弱的負相關,因為此時冬小麥處于光照階段,若日照時數多,則利于光合產物積累,易使抽穗期提前,則始花期也相應提前。總體來看始花期與日照長短的相關性明顯弱于氣溫因子與始花期的相關性,這與品種特征有關,因為江蘇大部分地區種植半冬性小麥、小部分地區種植春性品種,半冬性品種對日照長短的反應大多數屬于中等型,而春性品種則屬于反應遲鈍型,即日照時數多少主要影響光合作用,對發育進程的影響相對弱一些[28]。

不同時段降水量與始花期的相關性不同,這與冬小麥生長過程中的水分需求特性總體是一致的[29],12月的降水量與始花期呈弱的負相關,因為此時正值播種出苗期,水分需求量較大,充足的水分利于播種出苗,反之若水分不足則易出現旱情,使得出苗不齊,生長放緩;1—2月冬小麥處于越冬期,需水量小,而此時江蘇也通常處于少雨季,因此該階段的降水量與始花期幾乎不存在相關性;3月的降水量與始花期呈弱的正相關,此時進入春季,暖濕氣流開始活躍,降水開始增多,若降水過多易導致濕漬害,尤其是里下河地區,地勢較為低平,更容易出現濕漬害,影響根系生長,使得小麥發育延遲。

2.3.1 基于RF算法建立始花期預報模型

從IncMSE來看,蘇南、蘇中、蘇北播種期的重要性分別排在第7位、第23位、第11位;從相關系數來看,各地區播種期與始花期基本呈弱的正相關,南部地區的相關性稍高于北部地區,這可能與播期早晚有關,蘇南地區播種期以11月上旬居多,要晚于蘇中和蘇北地區,而蘇南地區始花期通常又早于其他 2個地區,所以蘇南的播種期對始花期的影響相對要稍微大一些。

直接接觸式膜蒸餾實驗結果如圖 1和圖 2所示。由圖 1可知,膜通量隨著實驗的進行逐漸減小,最后膜通量趨于零。這是因為隨著原料液中的水進入透過側,進料側鹽溶液的濃度逐步增大,鹽溶液的蒸汽分壓不斷減小,導致膜兩側的蒸汽壓差下降直至趨于零。與其他膜相比膜1的通量9 h時達到最低點之后膜通量又開始上升,圖 2中膜 1的鹽截率在500 min前穩定在0.999,從500 min后逐漸下降至0.9左右。所以,大約從9 h時鹽截率下降,膜失去部分疏水性,膜通量上升。

綜合考慮IncMSE和相關系數,結合冬小麥生育期生物學特性,篩選出各地區始花期的關鍵預報因子(見表3),其中溫度類因子11個、降水類因子3個、日照類因子4個。同時兼顧人為播種早晚的影響,所以仍保留播種期這一影響因子。

2.3 基于3種算法的始花期預報模型構建和精度對比

操動機構由手動或者電動的方式完成合閘,而合閘能量可以轉變成電磁能和彈簧的位能及重力位能等,可以促動斷路器的動作。提高斷路器結構與傳動機構的機械性能,一旦機構發生故障,就會使斷路器發生拒動,而電磁操動機構是由螺管電磁鐵執行動作,電磁鐵線圈電壓與電流可以說是影響電磁鐵處理能力重要的因素[1]。

以表3中篩選出的影響始花期的重要特征變量為輸入向量,樹節點預選的變量個數Mtry根據預報因子總數19而分別設定為 4、5、6、7、8,決策樹棵數Ntree設定為600,始花期為輸出向量,利用RF算法分別建立10個站的始花期預報模型,為了避免高相關模型的偶然性,均重復建模50次,每次建模均隨機抽取3/4的樣本作為訓練樣本、1/4的樣本作為測試樣本。各站建立的50個始花期預報模型,其模擬值與實際始花期的相關系數存在差異,由于訓練樣本的相關系數均很高,基本都在0.96~0.98之間,所以根據測試樣本相關系數的高低來挑選RF模型,測試樣本相關系數最高的RF模型稱為最優模型,由于參數Mtry設定了5個值,因此每個參數值將得到一個最優RF模型,分別記為RF1、RF2、RF3、RF4、RF5,將篩選出的5個最優模型進行等權重集成,在一定程度上可以減少模型的隨機誤差和高相關的偶然性[30]。

表3 篩選出的影響冬小麥始花期的重要特征變量Table 3 Important characteristic variables affecting first flowering stage of winter wheat

受篇幅所限,以蘇南、蘇中、蘇北的代表站點為例,圖2可見,無論是單個最優模型的模擬值還是最優模型集成后的模擬值,均很好地模擬出了近四十年實際始花期的波動趨勢,波動幅度與實際始花期在極端年份存在一定差異,即對于始花期明顯提前和推遲的極端情況,模擬幅度小于實際變化幅度。

另外,由于篩選出的溫度特征量存在相互重疊的現象,因此在實際計算中嘗試了選取不同溫度特征量的組合進行建模,發現將表2中篩選出的11個溫度因子全部放入時,預報精度相對高一些,這可能與RF算法本身有關。

經歷了家道中落的魯迅厭惡了周圍熟悉的人群,為擺脫這種舊有的人事關系和改變自己的命運,1898年,魯迅前往南京尋求別樣的人生,并先后進入江南水師學堂、江南陸師學堂附設的礦路學堂學習。在此期間,學習的魯迅接觸到維新變法的宣傳刊物《時務報》,作為熱血青年的魯迅,救國救民的壯志開始生根,受惠于維新變法派留學生的變法舉措留學日本。就這樣,魯迅抱著尋求新知、拯救過敏的熱情來到了東京。魯迅進的第一所預備學校是東京弘文學院,并加入了革命團體浙學會,成為一個激進的革命者,且頗為勇敢。從剪辮子事件就可看出,在剪辮之后不僅毫無畏懼,還特地“斷發照相”,以資紀念,并題了一首詩——自題小像,贈給友人許壽裳。詩云:

通常移動式篩分站上的輸送機液壓驅動滾筒結構有兩種:一種結構是液壓馬達+聯軸器(或者減速機)+滾筒,如圖2;另一種是馬達直接通過聯接法蘭和滾筒聯接,如圖3。但這兩種方式都無法解決輸送機軸向尺寸過大的問題,也有一種內藏式液壓滾筒[2],但這種滾筒損壞后維修較為困難。因此在第二種結構形式的基礎上,采用特定的軸承和液壓馬達,設計了一種半內藏式液壓馬達驅動滾筒,如圖4。既解決了輸送機軸向尺寸過大的問題,在維修方面也比全內藏式液壓滾筒簡單方便。

基于BP算法的始花期建模步驟是:首先將篩選出的影響始花期的預報因子(表3)進行歸一化處理,作為輸入層;然后對影響因子數據集進行網絡訓練,隱含層神經元傳遞函數采用非線性變換函數—Sigmoid函數,該函數特點是本身及其導數都是連續的,因而在處理上十分方便,神經節點的變量個數Net根據預報因子總數19而分別設定為37、38、39、40、41,均重復建模20次,每次建模均隨機抽取樣本的 75%進行模型訓練;輸出層神經元傳遞函數采用線性函數 Purelin,訓練函數采用Trainlm,隨機抽取樣本的 25%用于模型測試。計算各站建立的 20個始花期預報模型模擬值與實際值的相關系數,發現無論是訓練樣本還是測試樣本,相關系數差異比較大,同樣按照RF算法中的最優模型篩選思路,根據模擬效果的高相關系數篩選出每個神經節點下模擬效果最好的模型,由于參數Net設定了5個值,因此每個參數值將得到一個最優BP模型,分別記為BP1、BP2、BP3、BP4、BP5,將篩選出的5個最優模型進行等權重集成。

從圖3可以看出,無論是單個最優模型的模擬值還是最優模型集成后的模擬值,均較好地模擬出了近 40 a實際始花期的波動趨勢,但波動幅度均明顯大于實際變化幅度,而且對于始花期較為極端的年份,不同最優模型之間差異也比較大,5個最優模型集成后的模擬效果總體好于單個最優模型。

1.3.3 多元線性回歸算法

在利用多元線性回歸算法建模時,若將表2中所有的因子直接作為自變量進行建模,則自變量之間易出現嚴重的多重共線性問題,而且計算量大、模型準確率偏低,因此在建模前,根據RF算法計算出的IncMSE值,將出現明顯拐點前的特征變量作為多元線性回歸中自變量的初選因子。建立的回歸模型如下:

式中Y為冬小麥始花期,其下標為站名。

始花期預報模型(5)~(14)總體模擬效果均通過了F檢驗,自變量均通過了T檢驗,預報模型自變量個數≥2時,自變量之間的VIF基本都小于10,即不存在共線性問題。各模型始花期歷史擬合值與實際值的相關系數在0.543~0.944之間,均通過了0.001顯著性檢驗,其中昆山站和如皋站相關系數最高,分別為0.944、0.904,對始花期波動特征模擬效果相對較好;盱眙站和沭陽站相關系數最小,分別為0.592、0.543,對始花期極端低值模擬偏差比較大。模擬效果與入選的自變量密切相關,從各模型最終入選的自變量可以看出,均含有溫度因子,尤其是上年12月-當年3月日均溫≥0 ℃活動積溫是最主要影響因子,昆山站入選的自變量有4個,個數最多,其次是如皋站3個,這2個站的德賓-沃森值均接近2,說明預報模型的自變量之間不存在自相關,其余站點的自變量個數僅有1~2個,這與“步進法”中嚴格的自變量篩選標準有關,當原來引入的解釋變量由于后面解釋變量的引入變得不再顯著時,則將其刪除,所以模型中最終只能保留對始花期影響顯著的自變量。

其中公式(5)、(7)、(8)中Tave.winter和Tave.12前面的符號為正號,這與冬小麥生長過程中的生理特性有關,小麥在幼苗階段需要通過一定的低溫時期,即需要經過春化作用,才能正常開花,進而完成營養生長向生殖生長的過渡,是小麥發育過程中一個重要的質變過程[31-32]。公式(5)和(8)中Tave.winter是指冬季平均氣溫、公式(7)中的Tave.12是指12月平均氣溫,這2個因子都處于春化階段,若平均溫度高,說明低溫時段相對偏少,則春化階段需要較長的時間,則易導致開花期推遲。

2.3.4 3種算法的模擬精度比較

如果在中文檢測不出結果,但該研究結果又是該論文的核心內容,則要考慮是否是直接從外文學術文獻中翻譯過來的。方法是將核心壓縮出來的內容翻譯成英文,語法和表達式并不重要,但對其中的關鍵詞和數據翻譯必須準確,翻譯完成后,復制到谷歌(英文版)上搜索。該方法的準確率要看責任編輯的總結能力以及英語翻譯能力。

教學查房是臨床實踐教學的一個重要環節,是醫學生培養的必經過程。通過教學查房,留學生開始進入醫生角色,深入臨床實踐。在腫瘤學教學查房中,教師應不斷提升自身教學水平,應用適應于留學生特點的方式進行教學活動,鼓勵學生積極參與、主動思考,培養學生綜合能力,促進師生協作交流,完善教學中的不足,最終提高留學生教學質量。

通過計算決定系數(R2)、均方根誤差(RMSE)、預報準確率(RA),比較3種算法下的始花期模擬精度。從表4可見,RF、BP、MLR算法下各站的R2分別在0.850~0.932、0.599~0.930、0.295~0.892之間,RF算法下R2明顯整體大于其他2種方法,數值更接近于1,說明 RF算法下的模型對始花期波動趨勢擬合度最好,MLR算法對不同站之間的趨勢擬合度高低差異最大,對于同一個站點,R2數值高低排序為RF>BP>MLR;RF、BP、MLR算法下各站的RMSE分別在3.9~6.5 d、3.5~7.9 d、4.0~6.4 d之間,3種算法下的模型對始花期波動幅度的模擬均存在一定偏差,而且不同站點的偏差幅度有高有低,對于同一個站點,RMSE數值高低排序為BP>MLR>RF,即BP算法下總體的波動幅度模擬偏差更大一些;RF、BP、MLR算法下各站的 RA分別在76.5%~92.5%、60.0%~92.1%、40.0%~85.0%之間,對于同一個站點,RA數值高低排序為RF>BP>MLR,即 RF算法下模型預報準確率最高,大部分站點都在 85.0%以上,BP算法次之、大部分站點在82.0%以上,MLR算法僅有 3個站的預報準確率在82.1%~85.0%之間,其余均在 76.3%以下。因此,綜合考慮3種算法下模型對始花期變化趨勢、波動幅度、準確率的模擬能力,RF算法模擬精度最高,BP算法次之,MLR算法相對低一些。

表4 基于3種算法的冬小麥始花期預報模型模擬精度對比Table 4 Comparison of simulation accuracy of forecasting model of first flowering stage of winter wheat based the three algorithm

3 討 論

預報因子的初步篩選是冬小麥始花期預報模型建立的基礎,RF算法具有篩選重要特征變量的優勢,得出的預報因子重要性排序與預報因子和始花期相關系數的高低相吻合,經過比較,3種算法下,將篩選出的重要特征變量作為預報因子,均可降低不重要變量對模型精度的干擾,從而提高模型模擬性能,因此,特征變量的篩選是訓練始花期預報模型的基礎和提升預報模型精度的有效方法,這與劉峻明等[33]、岳繼博等[34]的研究結論一致。RF和BP兩種機器學習算法的模擬精度要高于MLR算法的模擬精度,因為預報因子和始花期之間的關系并不是簡單的線性關系,而是存在較為復雜的非線性關系,所以MLR算法中入選的自變量個數普遍偏少,過少的自變量無法較好表征對始花期的影響。RF算法收斂規則遵循大數定律、泛化誤差具有收斂性,訓練速度快,且不易產生過擬合;BP算法采用梯度下降的原理,收斂速度慢,易陷入局部極值點,導致神經網絡的分類精度下降,所以RF算法下的建模速度要快于BP算法,且精度更高,但對于始花期極端年份的模擬過于“保守”,而BP算法則存在始花期波動幅度模擬過大的問題。RF算法中的樹節點個數Mtry、BP算法中的神經節點個數Net是這兩種機器學習算法中的重要參數,兩種算法在訓練模型時均是采取了隨機抽樣的方法,每次建立的模型精度存在差異,RF算法下訓練樣本的模擬精度均很高,BP算法下訓練樣本的模擬精度則不穩定,選取每個節點數對應的最優模型,對其預報結果集成能有效提高模型精度、減小隨機誤差。由于冬小麥始花期不僅與氣象因子、播種期有關,實際還與田間管理、肥料的施用、作物品種等因素有關,因此,機器學習算法下的預報結果仍然存在一定的偏差,在實際應用時還需要結合田間實際情況。

綜合而言,文中利用機器學習算法建立始花期預報模型的思路為預報冬小麥始花期提供了新的方法和思路,而且對 RF、BP、MLR三種算法的模擬精度的對比分析結果,可為選用更合理的預報模型提供依據。RF機器學習算法可在冬小麥始花期預測中進行應用,建立的預報模型較BP和MLR算法更具可靠性和準確性。預報結果可為農業部門抓住用藥最佳時機提供指導,增強防治效果,保障小麥質量安全,減少盲目用藥,減輕農藥面源污染。

4 結 論

本文以冬小麥始花期為研究對象,利用隨機森林機器學習算法,以精度平均減少值為評價指標,結合冬小麥生育期生長發育特點,篩選出對始花期影響較為重要的因子,分別利用隨機森林算法和反向傳播神經網絡算法,隨機選取訓練樣本和測試樣本,經過成百上千次的學習,建立最優預測模型,并進行模型模擬精度的驗證;同時還利用多元線性回歸算法進行建模,比較了 3種算法下模型的模擬精度,得到以下主要結論:

1)冬小麥始花期存在較為明顯的年際波動,大部分地區有提前趨勢,各地冬小麥始花期歷史最遲與最早相差天數都在21 d以上,不同區域間始花期存在差異。

2)隨機森林算法重要性度量表明,溫度類因子對始花期影響的重要性明顯大于降水類和日照類,重要性排在前5位的因子是:上年12月-當年3月日均溫≥0 ℃活動積溫、上年 12月-當年 3月平均氣溫、上年 12月-當年3月最低氣溫≤0 ℃的累計日數、當年3月平均氣溫、上年12月-當年2月日均溫≥0 ℃的活動積溫。

3)3種算法建立的始花期預報模型,均可在4月初對冬小麥始花期進行預報,按照歷史上始花期的極端年份,則最遲可以提前5 d預報,最早可以提前32 d預報。RF算法模擬精度最高,BP算法次之,MLR算法相對低一些。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: AV不卡国产在线观看| 91丨九色丨首页在线播放| yjizz视频最新网站在线| 亚洲视频二| 波多野结衣视频网站| 国产菊爆视频在线观看| 天天爽免费视频| 夜精品a一区二区三区| 精品久久久久久中文字幕女 | 中文字幕在线播放不卡| 亚洲天堂精品在线| 免费无码网站| 韩国福利一区| 韩日午夜在线资源一区二区| 国产在线一二三区| 国产美女在线观看| 亚洲日韩精品无码专区| 日韩在线第三页| 欧美中文字幕第一页线路一| 免费无码AV片在线观看国产| 国产色婷婷| 国产成人精品亚洲日本对白优播| 国产精品30p| 在线看AV天堂| 国内精品久久久久鸭| 国产成本人片免费a∨短片| 国产福利一区二区在线观看| 在线免费a视频| 午夜精品久久久久久久无码软件 | 国产美女免费网站| 国产亚洲一区二区三区在线| 天堂中文在线资源| 亚洲成人精品久久| 亚洲美女一区二区三区| 国产日韩av在线播放| …亚洲 欧洲 另类 春色| 亚洲精品人成网线在线| 97国产精品视频自在拍| 国产高清不卡| 国产香蕉97碰碰视频VA碰碰看| 久久无码av三级| 欧美国产另类| 久久国产V一级毛多内射| 国产一级一级毛片永久| 日韩精品久久无码中文字幕色欲| 国产极品美女在线观看| 伊人成色综合网| 国产精品开放后亚洲| 国产激爽大片高清在线观看| 国产91视频免费观看| 好久久免费视频高清| 国产69精品久久| 狠狠ⅴ日韩v欧美v天堂| 亚洲 日韩 激情 无码 中出| 国产成人免费手机在线观看视频| 色综合久久久久8天国| 色哟哟精品无码网站在线播放视频| 国产精品免费露脸视频| 国产永久在线视频| 日韩福利在线观看| 久久久亚洲色| 国产成人三级| 国产精品丝袜视频| 欧美一级黄片一区2区| 欧美不卡在线视频| 精品久久777| 免费国产高清视频| 美女一级免费毛片| 欧美色视频日本| 日韩成人免费网站| 婷婷色一二三区波多野衣| 一级看片免费视频| 久久国产黑丝袜视频| 欧美日韩午夜| 91精品专区| 国产美女91呻吟求| 国产aaaaa一级毛片| 精品国产免费观看| 中文字幕人成乱码熟女免费| 日韩中文字幕亚洲无线码| 亚洲伦理一区二区| 色哟哟色院91精品网站|