






摘 要: 針對(duì)傳統(tǒng)的單模態(tài)數(shù)據(jù)預(yù)測(cè)小麥產(chǎn)量存在精度不高的問(wèn)題,提出一種結(jié)合多源異構(gòu)數(shù)據(jù)和注意力門控機(jī)制的小麥產(chǎn)量預(yù)測(cè)方法。首先引入了特征級(jí)的門控策略,來(lái)捕獲每個(gè)模態(tài)內(nèi)部特征的信息變化;然后利用神經(jīng)網(wǎng)絡(luò)評(píng)估每個(gè)模態(tài)內(nèi)的置信度分?jǐn)?shù),并構(gòu)建模態(tài)間的有效信息獲取模塊;最后設(shè)計(jì)了基于Transformer 的空間和通道注意力門控機(jī)制模塊,將不同模態(tài)之間的有效信息進(jìn)行充分的融合,從而獲得最佳的預(yù)測(cè)特征表示。實(shí)驗(yàn)結(jié)果表明,所提方法與傳統(tǒng)方法相比具有更高的預(yù)測(cè)精準(zhǔn)度,RMSE和MAE分別僅為809 kg/hm2和522 kg/hm2,R2則達(dá)到了0.806,通過(guò)對(duì)河南省近10 年的小麥產(chǎn)量進(jìn)行預(yù)測(cè),得到的三項(xiàng)評(píng)價(jià)指標(biāo)均相對(duì)穩(wěn)定,且展現(xiàn)出了較強(qiáng)的魯棒性。消融實(shí)驗(yàn)也驗(yàn)證了該方法中的不同組件均能有效提高小麥產(chǎn)量的預(yù)測(cè)精度,可為相關(guān)部門制定保障糧食安全管理決策提供有力的數(shù)據(jù)支持。
關(guān)鍵詞: 小麥產(chǎn)量預(yù)測(cè);多源異構(gòu)數(shù)據(jù);注意力機(jī)制;門控機(jī)制;特征融合
中圖法分類號(hào): TP391.4 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1000-2324(2024)03-0444-09
小麥?zhǔn)侨蜃钪匾募Z食作物之一,主要生產(chǎn)國(guó)包括中國(guó)、印度、俄羅斯、美國(guó)和法國(guó)等,每年的總產(chǎn)量均保持在7 億噸左右,但受氣候變化、自然災(zāi)害、病蟲(chóng)害和土地退化等因素影響,產(chǎn)量波動(dòng)較大。據(jù)資料顯示,我國(guó)是世界上最大的小麥生產(chǎn)國(guó),產(chǎn)區(qū)主要集中在黃淮海平原、長(zhǎng)江中下游地區(qū)和西北地區(qū),近年來(lái)小麥產(chǎn)量穩(wěn)定在1.3 億噸左右,產(chǎn)量約占全球小麥產(chǎn)量的18%,是最大的小麥生產(chǎn)國(guó)和消費(fèi)國(guó),小麥已經(jīng)成為我國(guó)糧食安全的基石[1-3]。在全球和中國(guó)小麥生產(chǎn)面臨諸多挑戰(zhàn)的背景下,加強(qiáng)小麥產(chǎn)量預(yù)測(cè)研究,對(duì)于保障糧食安全、促進(jìn)農(nóng)業(yè)可持續(xù)發(fā)展具有重要意義。首先準(zhǔn)確預(yù)測(cè)小麥產(chǎn)量不僅能夠?yàn)檗r(nóng)民提供種植決策依據(jù),通過(guò)合理調(diào)配資源優(yōu)化種植結(jié)構(gòu)避免資源浪費(fèi),還有助于政府制定合理的農(nóng)業(yè)政策和糧儲(chǔ)規(guī)劃,從而確保糧食儲(chǔ)備和調(diào)運(yùn)的安全。其次,小麥產(chǎn)量預(yù)測(cè)也是國(guó)際貿(mào)易的重要依據(jù),有助于穩(wěn)定市場(chǎng)預(yù)期,通過(guò)調(diào)節(jié)國(guó)際市場(chǎng)供需關(guān)系維護(hù)市場(chǎng)秩序和穩(wěn)定全球糧食市場(chǎng),避免價(jià)格大幅波動(dòng),從而確保全球糧食供應(yīng)安全[4-5]。影響小麥產(chǎn)量的因素有很多,其中關(guān)鍵生育期的限制性氣象因子是最主要的因素,包括氣溫、日照時(shí)長(zhǎng)和有效降水等,因?yàn)闅庀笠蜃拥姆植继卣骱妥兓厔?shì)存在空間異質(zhì)性,給產(chǎn)量預(yù)測(cè)工作增加了一定的難度[6-7]。傳統(tǒng)的小麥產(chǎn)量預(yù)測(cè)方法通常依賴于統(tǒng)計(jì)模型和經(jīng)驗(yàn)規(guī)則,僅基于有限的監(jiān)測(cè)數(shù)據(jù)和專家知識(shí)進(jìn)行推斷[8]。這種方法存在著數(shù)據(jù)獲取困難、模型建立復(fù)雜以及對(duì)環(huán)境變化適應(yīng)能力弱等局限性,導(dǎo)致預(yù)測(cè)結(jié)果的準(zhǔn)確性和穩(wěn)定性不盡如人意。后來(lái),隨著機(jī)器學(xué)習(xí)方法[9-10]在預(yù)測(cè)領(lǐng)域的出色表現(xiàn)以及廣泛應(yīng)用,李文輝等人[11]考慮到多種因素對(duì)小麥產(chǎn)量預(yù)測(cè)的影響,提出了一種基于灰色模型和支持向量機(jī)的小麥產(chǎn)量組合預(yù)測(cè)模型,克服了單一模型的缺陷,提高了小麥產(chǎn)量預(yù)測(cè)的精度。Kumar D等人[12]提出使用SVR、決策樹(shù)、隨機(jī)森林和梯度提升回歸器技術(shù)預(yù)測(cè)小麥產(chǎn)量,實(shí)驗(yàn)表明隨機(jī)森林在產(chǎn)量預(yù)測(cè)方面的有效性。劉合兵等人[13]基于河南省的小麥產(chǎn)量數(shù)據(jù)及特征變量構(gòu)建了數(shù)據(jù)集,采用支持向量回歸(SVR)模型解決了小麥估產(chǎn)中的復(fù)雜性、非線性和小樣本等問(wèn)題,取得了良好預(yù)測(cè)結(jié)果。然而,這些傳統(tǒng)方法通常需要手動(dòng)設(shè)計(jì)和選擇合適的特征來(lái)表示數(shù)據(jù),且特征工程的質(zhì)量和選擇對(duì)模型性能有很大影響。
隨著深度學(xué)習(xí)方法在圖像識(shí)別、文本分析以及預(yù)測(cè)領(lǐng)域的廣泛應(yīng)用,能夠自動(dòng)從原始數(shù)據(jù)中學(xué)習(xí)特征表示,不再需要手動(dòng)進(jìn)行特征工程。徐路路等人[14]提出一種基于深度置信網(wǎng)絡(luò)的糧食產(chǎn)量預(yù)測(cè)模型,通過(guò)構(gòu)建多層受限波爾茲曼機(jī)來(lái)預(yù)測(cè)糧食產(chǎn)量,取得了良好的性能。周亮等人[15]提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的小麥產(chǎn)量預(yù)測(cè)方法,能夠有效捕捉到小麥生長(zhǎng)過(guò)程中的關(guān)鍵特征,提高了預(yù)測(cè)精度。隨著信息技術(shù)和農(nóng)業(yè)科學(xué)的發(fā)展,能夠收集到越來(lái)越多的數(shù)據(jù)源,如遙感影像、氣象數(shù)據(jù)、土壤監(jiān)測(cè)數(shù)據(jù)等,通過(guò)有效地融合多種數(shù)據(jù)信息為小麥產(chǎn)量高精度預(yù)測(cè)提供了新的方式。丁凡等[16]人利用無(wú)人機(jī)搭載的多光譜儀獲取冬小麥不同生長(zhǎng)階段的信息,并結(jié)合施氮肥量成功預(yù)測(cè)了冬小麥產(chǎn)量。但是由于無(wú)人機(jī)采集光譜信息區(qū)域較小的局限性,且僅考慮了施氮肥量,所以預(yù)測(cè)精度較低。劉靖宇等人[17]采用極端梯度提升算法對(duì)氣候、土壤和衛(wèi)星等信息進(jìn)行處理,實(shí)現(xiàn)了對(duì)山東地區(qū)冬小麥產(chǎn)量的預(yù)測(cè)。雖然該方法引入了較多的信息,但是所用方法無(wú)法全面挖掘不同數(shù)據(jù)之間的相關(guān)性,導(dǎo)致預(yù)測(cè)精度依然不高。為了進(jìn)一步提高對(duì)小麥產(chǎn)量的預(yù)測(cè)精度,本文以河南省小麥產(chǎn)區(qū)作為研究對(duì)象,提出了一種結(jié)合多源異構(gòu)數(shù)據(jù)和注意力門控機(jī)制的小麥產(chǎn)量預(yù)測(cè)方法(記為:MSAGNet),利用衛(wèi)星遙感影像、氣象和土壤的多模態(tài)信息作為影響小麥產(chǎn)量的多源數(shù)據(jù),通過(guò)門控策略捕獲每個(gè)模態(tài)內(nèi)部特征的信息變化,并利用每個(gè)模態(tài)內(nèi)的置信度分?jǐn)?shù)構(gòu)建出模態(tài)間的有效信息,再利用設(shè)計(jì)了基于Transformer 的空間和通道注意力門控機(jī)制模塊動(dòng)態(tài)融合來(lái)自不同模態(tài)的特征信息,充分挖掘不同數(shù)據(jù)源之間的相關(guān)性和特征變化,獲得最佳的預(yù)測(cè)特征表示,從而有效提高了小麥產(chǎn)量的預(yù)測(cè)精度,最后通過(guò)仿真驗(yàn)證了提出方法的有效性和優(yōu)越性。
1 研究區(qū)域與數(shù)據(jù)處理
1.1 研究區(qū)域
本文選擇河南省冬小麥產(chǎn)區(qū)作為研究對(duì)象,該區(qū)域地勢(shì)平坦,土壤肥沃,非常適宜小麥生長(zhǎng),一般于每年10 月初播種,次年6 月中旬左右收割,播種面積超過(guò)了全省農(nóng)作物種植面積的50 %,主要集中在東北部的安陽(yáng)市、新鄉(xiāng)市、開(kāi)封市、商丘市,以及南部的南陽(yáng)市、周口市、駐馬店市和信陽(yáng)市。河南省小麥種植分布情況如圖1所示。
1.2 數(shù)據(jù)收集
本文收集了2003-2022 年河南省在不同時(shí)空分辨率的多源數(shù)據(jù),包括衛(wèi)星、氣象、土壤以及小麥產(chǎn)量等多源異構(gòu)的多模態(tài)數(shù)據(jù)信息。具體的數(shù)據(jù)描述如表1所示。
衛(wèi)星數(shù)據(jù):高分辨率輻射儀(AVHRR,0.05 °)可以獲取更為準(zhǔn)確的遙感數(shù)據(jù),通過(guò)探測(cè)近紅外波段(640 nm)、中紅外波段(860 nm)和熱紅外波段(3 750 nm)在地面反射率的特征了解地球表面植被覆蓋度和生長(zhǎng)狀態(tài)。其中,近紅外波段和中紅外波段的反射率能評(píng)估植物的光合作用能力和生長(zhǎng)情況,而熱紅外波段的反射率則更能表征地面的熱輻射情況,通過(guò)計(jì)算能夠得到歸一化植被指數(shù),將不同植被類型和不同密度的植被之間的差異量化,使其在0 到1 的范圍內(nèi)變化,高值通常表示植被覆蓋度好,植被健康,而低值則表示植被覆蓋度低或植被狀況不佳[18]。另外,為了能夠獲取更加精細(xì)的地表特征,本文設(shè)置獲取遙感數(shù)據(jù)的空間分辨率為1 km×1 km,設(shè)置時(shí)間分辨率為24 h,這樣更有利于提高小麥產(chǎn)量的預(yù)測(cè)精度。
山東農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版)2024年3期