







摘要:水稻是我國三大糧食作物之一,準確、高效、及時地預測水稻產量對品種選育和優化田間管理至關重要。無人機遙感系統憑借其快速、無損、成本低、通量高等優勢,被廣泛應用在作物病蟲害識別、作物生長監測和作物表型分析等領域。為探究光譜數據在水稻產量估測方面發揮的作用,本數據集利用無人機遙感采集了水稻生長過程中的多光譜圖像。選取106個1 mí1 m的樣本點人工采樣測產,同時在采樣后采集了可見光圖像,實現光譜圖像和產量數據間的關聯。經過人工檢查和整理構建了本數據集。數據采集地點為黑龍江省,無人機在無云、光照充足的條件下進行數據采集,采集時間為2023年7月至2023年8月,共采集試驗田內不同品種3天的多光譜數據和1天的可見光數據。本數據集各項數據完整,可為產量估測研究提供數據支撐。
關鍵詞:無人機;水稻;多光譜圖像;黑龍江
數據摘要:
1 "引言
我國是世界上的農業大國,日益增加的人口導致對糧食的需求量不斷增大,國內的糧食產量不足以滿足國內的需求,需要提高國家的糧食產量生產力[1-2]。水稻作為我國三大糧食作物之一,其產量的變化顯著影響著國內的社會穩定和人民基本生活要求,準確、高效、及時地預測水稻產量對品種選育和優化田間管理至關重要。隨著計算機技術的快速發展,農業信息化進程加快,越來越多的人工智能技術應用到農業生產活動中,也成為眾多專家學者科學估測作物產量的重要手段,充當了傳統農業向現代農業轉變的紐帶。
無人機遙感系統憑借其快速、無損、成本低、通量高等優勢,已在農業領域廣泛應用。在產量估測研究中,通過無人機在成熟期以不同拍攝角度、不同光照環境獲取RGB數據,實現了水稻的快速估產[3],利用高光譜獲取的光譜信息和圖像空間信息聯合建模,提升產量估測的性能[4]。但是RGB圖像獲取仍然困難,且只能在作物成熟后才可以完成估測,高光譜圖像的獲取成本也相對較高,相較而言,多光譜數據獲取便捷且成本較低,在產量估測中得到了大量應用。Fei[5]設計了3個不同水分處理下的冬小麥試驗田,采集了小麥全生育期的多光譜圖像數據,建立了估產模型并確定最佳估產時期;楊俊[6]在試驗田中設置了4個氮肥水平,采集了小麥主要生育時期的RGB圖像建立了估產模型;Marques Ramos等[7]通過隨機森林算法對多光譜指數特征排序,完成特征選擇,提升了玉米產量預測性能;Fu等[8]采集了小麥關鍵生育期的多光譜圖像,以NDVI作為輸入,通過多個機器學習算法建模,分析對比獲得最佳估產模型。也有研究者[9-10]認為單一生育期的數據估測產量效果不理想,因此采集多個生育期的多光譜圖像,分析對比多時相數據與單時相數據的估產效果。但目前多數報道為在不同灌溉水平或不同氮肥控制條件下開展,不同品種的試驗數據的報道較少,且對原始數據集公開發布較少。在相關項目支持下,整理了不同品種下的水稻生長過程中的無人機遙感圖像數據,可供產量估測研究使用,提升算法模型的普適性和魯棒性,推動智慧農業發展。
2""數據采集和處理方法
2.1 "數據采集
本文所整理的數據包括水稻生長過程中的多光譜圖像和用于標注采樣點的可見光圖像數據(表1)。多光譜圖像數據通過無人機搭載多光譜相機獲取,產量數據在水稻成熟后割曬、脫粒、稱重獲得,可見光數據是在田間人工采樣后通過無人機搭載RGB相機采集。
2.1.1 "無人機遙感圖像采集
多光譜圖像是采用大疆M300RTK搭載MS600pro多光譜相機采集,采集日期分別是2023年7月10日、7月29日、8月20日,共計有3天的數據。拍攝時采用二維航線規劃,相機采用垂直地面等時間間隔模式拍照,無人機相關參數設定:航向重疊率80%,旁向重疊率70%,飛行高度30m。為更好地獲取水稻冠層光譜反射率,選擇在無云、光照充足的條件下(北京時間10:00—14:00)采集數據,并且每次在多光譜數據采集前,均需通過標定板進行校準。為了更好地完成產量估測研究,在樣本點收割后,對試驗田再次獲取了1次可見光圖像數據,可見光數據采集是通過搭載禪思P1相機獲取。
2.1.2 "產量數據采集
產量數據是在水稻成熟后獲取,分別在每個試驗區隨機選取數個1"mí1"m的區域采樣,割曬后脫粒稱重,總共獲取106個樣本點產量數據。
2.2 "數據處理
后期根據研究需要對數據進一步處理,采用Pix 4D或大疆制圖等專業軟件對無人機遙感圖像進行合成,根據選取樣本點使用ENVI軟件圈定ROI區域,提取所需植被指數,進而開展相關研究。
3""數據樣本描述
選取4個地塊進行采樣,包括4類水稻品種,在水稻生長過程中,做好常規病蟲害防治,不再進行施肥、灌溉等人為干擾,確保水稻在大田自然環境下生長成熟。本數據集包括三部分:(1)多光譜圖像數據;(2)產量數據;(3)用于標注采樣點的可見光圖像數據。
3.1 "多光譜圖像數據
多光譜圖像數據以*.tif格式存儲,共計14226張,約32.6"GB,分兩級文件存儲。一級文件夾以拍攝日期命名,如“2023-7-10”表示2023年7月10日,
二級文件夾即為拍攝圖像。部分數據示例如圖1所示。
3.2""產量數據
產量數據以Excel格式存儲,共計106條數據,相關指標說明如表2所示。
3.3""可見光圖像數據
用于標注采樣點的可見光圖像數據以*.jpg格式存儲,共計746張,約18.9 GB。數據示例如圖3所示。
4""數據質量控制和評估
本數據集采用無人機專業化設備對田間水稻進行多光譜圖像采集,均在無云和光線充足的條件下采集,且在采集前進行了標定校準,確保數據質量來源的可靠性和數據采集規范性。對于田間樣本產量數據,我們采用雙人工采樣校核,對標記點位進行反復核對,確保取樣點和產量能夠一一對應。
我們以8月20日的多光譜圖像數據為例,通過隨機森林建立產量估測模型,以R2和RMSE作為模型評價指標。模型采用7個特征作為輸入,分別為Green,Red,NDVI,RRI1,PPR,TCARI,MTCI,模型結果顯示R2 = 0.4,RMSE"= 634.91 kg/hm2,可以看出,通過本數據集可以實現產量估測,實測產量與預測產量的關系如圖4所示。
5""數據價值與使用建議
本數據集整理了基于4類水稻品種生長過程中的多光譜圖像以及產量數據,多光譜圖像數據可用于提取水稻生長過程中的植被指數,可作為衡量作物生長狀態的指標。基于多光譜圖像和產量數據可建立產量估測模型,進一步優化田間管理和育種篩選。同時,本文數據有限,模型的精度尚有較大提升空間,因此,數據可作為模型驗證或遷移學習使用,以不斷提升產量估測模型的泛化能力。
數據可用性
中國科技資源標識碼(CSTR):https://cstr.cn/
17058.11. sciencedb.agriculture.00131;
數字對象標識碼(DOI):https://doi.org/10.57760/ sciencedb. agriculture.00131。
限制性獲取。
數據作者分工職責
苑江浩,數據整理匯總與論文撰寫。
鄭作軍,數據采集裝備安裝與數據采集。
初昌明,數據采集與校核。
姚鴻勛,論文撰寫指導。
劉海龍,數據校核與論文撰寫指導。
郭雷風,論文架構設計與論文撰寫指導,提供論
文項目基金支持。
倫理聲明
本文數據不涉及倫理聲明相關的內容。
利益沖突聲明
作者聲明,全部作者均無會影響研究公正性的財務利益沖突或個人利益沖突。
參考文獻
[1] YANG S, HU L, WU H, et al. Estimation Model of Winter Wheat Yield Based on Uav Hyperspectral Data[C]//2019 IEEE International Geoscience and Remote Sensing Symposium. Japan, 2019. https://doi.org/10.1109/IGARSS.2019.8898839.
[2] 陶惠林,馮海寬,楊貴軍,等.基于無人機數碼影像和高光譜數據的冬小麥產量估算對比[J]. 農業工程學報,2019,35(23):111–118.
[3] TANAKA Y, WATANABE T, KATSURA K, et al. Deep learning enables instant and versatile estimation of rice yield using Ground-"based RGB images[J]. Plant Phenomics, 2023, 5: 0073. https://doi."org/10.34133/"plantphenomics.0073.
[4] YANG W, NIGON T, HAO Z, et al. Estimation of corn yield based on hyperspectral imagery and convolutional neural network[J]. Computers and Electronics in Agriculture, 2021, 184: 106092. https:"http://doi.org/10.1016/j.compag.2021.106092.
[5] FEI S, HASSAN M"A, MA Y, et al. Entropy Weight Ensemble Framework for yield prediction of winter wheat under different water stress treatments using unmanned aerial vehicle-based multispectral and thermal data[J]. Frontiers in Plant Science, Frontiers, 2021, 12: 730181. https://doi.org/10.3389/fpls.2021.730181.
[6] 楊俊,丁峰,陳晨,等.小麥生物量及產量與無人機圖像特征參數的相關性[J].農業工程學報,2019,35(23):104–110.
[7] MARQUES RAMOS A"P, PRADO OSCO L, ELIS GARCIA FURUYA D, et al. A Random Forest Ranking Approach to predict yield in maize with UAV-based Begetation Spectral Indices[J]. Computers and Electronics in Agriculture, 2020, 178: 105791. https://"doi.org/10.1016/j.compag."2020.105791.
[8] FU Z, JIANG J, GAO Y, et al. Wheat growth monitoring and yield estimation based on Multi-Rotor Unmanned Aerial Vehicle[J]. Remote Sensing, MDPI AG, 2020, 12(3): 508. https://doi.org/10.3390/rs12030508.
[9] 程千,徐洪剛,曹引波,等.基于無人機多時相植被指數的冬小麥產量估測[J].農業機械學報,2021,52(3):160–167.
[10] 朱婉雪,李仕冀,張旭博,等.基于無人機遙感植被指數優選的田塊尺度冬小麥估產[J].農業工程學報,2018,34(11):78–86.
引用格式:苑江浩,鄭作軍,初昌明,姚鴻勛,劉海龍,郭雷風.2023年黑龍江水稻產量預測無人機遙感圖像數據集[J].農業大數據學報,2024,6(4):"546-551. DOI:10.19788/j.issn.2096-6369.100031.
CITATION:"YUAN JiangHao, ZHENG ZuoJun, CHU ChangMing, YAO HongXun, LIU HaiLong, GUO LeiFeng. Rice Yield Prediction UAV Remote Sensing Image Dataset of Heilongjiang Province in 2023[J]. Journal of Agricultural Big Data,2024,6(4):"546-551. DOI: 10.19788/j.issn."2096-6369.100031.
Rice Yield Prediction UAV Remote Sensing Image Dataset of Heilongjiang"Province"in 2023
YUAN JiangHao1,2, ZHENG ZuoJun1, CHU ChangMing3, YAO HongXun5, LIU"HaiLong4*, GUO LeiFeng1,4*
1."Hebei Agricultural University, Baoding"071001, Hebei, China; 2."Academy of National Food and Strategic Reserves Administration, Beijing 100037, China; 3. Agricultural Technology Promotion Center of Beidahuang Agriculture Co., Ltd. 290 Branch, Suihua 156202, Heilongjiang, China; 4."Agricultural Information Institute of Chinese Academy of Agricultural Sciences, Beijing 100081, China;5."Harbin Institute of Technology, Harbin 150001, China
Abstract:"Rice is one of the three major grain crops in China, and accurate, efficient and timely prediction of rice yield is crucial for variety selection and optimization of field management. UAV remote sensing system is widely used in crop pest and disease identification, crop growth monitoring and crop phenotyping by virtue of its advantages of fast, non-destructive, low cost and high throughput. To explore the role of spectral data in estimating rice yield, this dataset used UAV"remote sensing to collect"multispectral images of rice growth process, 106"sample points of 1"mí1"m were selected for manual sampling and yield measurement, and at the same time, visible images were collected after the sampling to realize the correlation between spectral images and yield data. The dataset of this paper was constructed after manual checking and organizing. The data collection location was Heilongjiang"Province, and the UAV collected the data under cloudless and light-sufficient conditions, and the collection time was from July to August in 2023, and a total of 3"days of multispectral data and 1 day of visible light data were collected with different varieties in the experimental field. The dataset in this paper was complete in all data and provided data support for research on yield estimation.
Keywords:"unmanned aerial vehicle (UAV); rice; multispectral imagery; Heilongjiang
Data summary: