999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于GA-SVR的疫情下各省糧食產量模型研究

2023-05-30 02:04:11童曉星孟梁張凌志
安徽農學通報 2023年6期

童曉星 孟梁 張凌志

摘要 利用ε-SVR(支持向量回歸)的理論,提出了一種大型傳染病對當年各省糧食產量影響的模型,通過選取感染人口占比、近5年播種面積等16個因素,用1961—2020年被戊型肝炎、霍亂、嚴重急性呼吸綜合征(SARS)和新冠肺炎影響的北京等52省(市、自治區)糧食產量數據進行建模,通過GA(貪婪算法)對核函數參數進行局部最優取值,當核函數中的γ值取值0.031、懲罰系數C取值5.0E+4、損失函數參數P取值0.000 98時,模型擬合平均相對誤差0.92%,決定系數0.99。應用該模型對2020年被新冠肺炎疫情影響到的浙江、湖北省,2003年被SARS病毒影響到的甘肅、陜西、廣東省以及1978年被登革熱影響到的廣東省的6組產量數據進行預測,平均相對誤差為3.12%。為衡量大型傳染病對糧食產量的影響程度,對去除感染人口占比和死亡人口占比2個因素后重新建模,新模型擬合平均相對誤差為0.97%,預測平均相對誤差為3.52%,表明大型傳染病對糧食產量有一定的影響,但影響較小。基于GA-SVR的大型傳染病對國內糧食產量影響的模型可有效預測疫情下當年各省糧食產量,為短期內地區糧食產量預測提供了新方法,也為國家宏觀調控提供了新依據。

關鍵詞 支持向量回歸;大型傳染病;當年各省糧食產量;貪婪算法;預測

中圖分類號 T18;S114? ?文獻標識碼 A

文章編號 1007-7731(2023)06-0055-05

2020年初,全球暴發了新冠肺炎疫情,由于新冠病毒傳染力強,導致傳播范圍廣、感染人數多。2020年4月初,全球多國發布申明,為確保本國糧食供給,停止糧食出口。在疫情下,準確預測當年糧食產量可以幫助國家或地區更好地掌握農業生態發展趨勢、保障人們生活的基本要求。雖然當前已有不少糧食預測的方法,如Nerlove模型[1]、系統動力學模型[2]、IPSO-BP模型[3]、時間序列模型等[4],但對于大型傳染病疫情下的地區糧食產量預測的研究仍然較少。

近些年來,隨著人工智能、機器學習技術的發展,SVM支持向量機這種具備較強泛化能力和廣泛適用性的算法已被普遍應用到農業生產預測、分類和圖像識別等領域,如滴灌灌水器流量預測[5],玉米、大豆、水稻識別[6],現代農業氣象分析[7],灌溉耕地研究[8],茶園地形數據研究等[9],而SVM最終解決的是凸二次規劃問題[10],在處理局部極限極值的問題上優于神經網絡。在本次研究課題中,由于新冠肺炎疫情的發生,存在個別地區暴發較嚴重,個別地區暴發較緩和等特點,SVM算法更易得到全局最優解。傳統的SVM算法僅局限于二元分類,ε-SVR是在傳統二元分類的基礎上可對回歸問題進行拓展的算法[11]。

1 理論基礎

1.1 SVR及其核函數

SVM作為一種二值分類模型(非0即1),模型建立在特征空間上的間隔最大的線性分類器之上,為使SVM可對連續性數值作回歸預測,通過多次分類迭代的方式優化后提出了SVR模型。本文經過多次試驗,確定徑向基函數(RBF)為本數據建立模型的最佳核函數。相關計算公式如下:

徑向基分類器的特點是每個基函數的中心對應于一個支持向量,輸出權值都是由算法自動確定。其內積函數類似人腦的神經中樞特性,不同的S參數值相應的分類面差別較大。

Christopher J. C. Burges曾對線性核函數、多項式核函數和徑向基核函數進行了試驗比較,不同的核函數對不同的數據庫各有優劣[12],也有基于UCI基準庫上的數據分析的研究表明徑向基核函數性能略為優良 [13]。

1.2 核函數中重要參數γ、C、P

γ:設置核函數中γ的值,隨著γ的增大,存在對于測試集分類效果差而對訓練分類效果好的情況,并且容易泛化誤差出現過擬合,一般取值在0.01[14]附近。本文通過迭代運算,得出最佳值為0.031。

C:懲罰因子。C表征對離群點的重視程度,C值大時對誤差分類的懲罰增大,C值小時對誤差分類的懲罰減小。本研究中由于樣本較小,而大規模傳染病造成的影響不可忽視性,故C值取值較大,當取值5.0E+4時,模型預測值和原始值的擬合度最高。

P代表SVM中損失函數中的參數b。SVM中的損失函數定義為合頁(hinge)損失函數和正則化項之和,可用以下公式表示:

式中:代表取正值函數。

如果被正確分類,則損失為0,如果未被正確分類,則損失為z,[λω2]為了防止過擬合,進而增強泛化能力,合頁損失函數表示預測不正確的類別([i≠j])累加之和,而參數b代表著損失閾值,b值越高,損失計算越高。

1.3 GA(貪婪算法)

本文通過GA算法實現SVR核函數中γ、C、P的選值,GA算法旨在某個范圍內取最優解,而不是全局最優解,通過對γ分成0~0.001、0.001~0.01、0.01~0.1、0.1~1等4個范圍,C分成0~0.1、0.1~1、1~10、10~100、100~1 000、1 000~1.0 E+4、1.0 E+4~1.0 E+5共7個范圍,P分成0~1.0E-5、1.0E-5~1.0E-4、1.0E-4~1.0E-3、0.001~0.01、0.01~0.1、0.1~1共6個范圍,γ、C、P的默認值分別為0.1、1、0.1,設置GA的第1個節點為改變γ的取值,分別取值0、0.001、0.01、0.1、1,第2個節點為C的7個取值,第3個節點為P的6個取值,這樣平均誤差最小的即為最優的γ、C、P的取值/取值范圍。這里,對C的取值需要特別注意,以往對于C值的取值往往是遍歷、迭代的方法,通常C越大說明錯誤懲罰越高,得出的模型擬合度高,容易出現過擬合的情況,這種情況對于新數據的適用性較低。本文通過GA算法,得出在C在一定閉合區域下的最優解,避免過擬合的現象。

2 糧食產量預測模型

2.1 訓練樣本

本文選取2020年新冠肺炎疫情期間的北京、天津等29個省(市、自治區),2003年SARS期間發生傳播的北京、天津等21個省(市、自治區)糧食產量數據,1961年霍亂發生傳播的廣東省糧食產量數據以及1986年戊型肝炎發生傳播的新疆維吾爾自治區糧食產量數據作為訓練樣本。2020年山東、廣東新冠肺炎病毒感染人數分別達10 165人、12 624人,2003年北京SARS病毒感染人數達2 434人,1961年廣東省霍亂感染人數達4 319人,1986年新疆戊型肝炎感染人數達119 280人,傳染病感染絕對數較大,可驗證模型的廣泛適用性。

2.2 預測樣本

本文選取了2020年新冠肺炎期間的浙江、湖北省,2003年SARS疫情期間的廣東、陜西、甘肅3個省份糧食產量數據以及1978年登革熱疫情流行的廣東省糧食產量數據作為預測樣本。2020年湖北新冠肺炎病例達6.8萬,1978年廣東登革熱病例達2.2萬,比較能驗證模型的適應性。

3 數據預處理與方法分析

3.1 數據預處理

根據現有研究,對于機器學習方法研究糧食產量的影響因素,主要考慮糧食作物播種面積、化肥施用量、糧食作物有效灌溉面積等因素[15-16]。考慮到本文主要是研究疫情下的糧食產量預測,故加入了疫情程度因素和當地務農人數(農村從業人員數)及變化趨勢,近些年糧食產量發展趨勢可涵蓋化肥施用量等其他次要因素。

綜上,本文將主要因素歸為以下4類:①疫情影響力。由于各省份的人口數存在差異,故感染人口和死亡人口2個維度不能準確說明疫情的嚴重性,所以選取了感染人口和死亡人口占年底總人口數的比重作為疫情嚴重程度的指標;②糧食播種面積因素。近些年根據政策播種面積有所變化,帶來的糧食產量影響也是很直觀、明顯的,所以選取了近5年的糧食播種面積;③務農人口。此處用“農村從業人口”來代替,近5年的農村從業人口可更好地反映務農人口變化趨勢;④當地糧食產量。前一年當地糧食產量可作為當年糧食產量預估的最直接依據之一,為了更好地體現糧食產量變化的趨勢,選取了近4年的當地糧食產量數據。

對本模型建立的數據處理如下:①感染人口和亡人口占比2個參數。由于疫情差異,如2003年SARS時期遼寧僅3例,而1986年新疆戊型肝炎發病近12萬例,為體現不同地區疫情影響程度的差異,對該2個參數保留原格式;②糧食播種面積、農村從業人口。以第n-4年的糧食播種面積和農村從業人口作為基準,對第n-3年、第n-2年、第n-1年和當年的數據做歸一化處理(如疫情發生在2000年,則第n-4年、第n-3年、第n-2年、第n-1年和當年分別代表1996年、1997年、1998年、1999年和2000年);③糧食產量。以第n-4年的糧食產量作為基準,對第n-3年、第n-2年、第n-1年的產量做歸一化處理。模型訓練樣本數據見表1。

3.2 方法分析

經過試驗,通過GA算法對核函數參數取值,當γ在0.01~0.1、C在1.0E+4~1.0E+5和P在1.0E-4~1.0E-3范圍內,平均相對誤差最小,再進一步調整,當γ=0.031時,訓練樣本平均相對誤差在2%左右,當γ>0.031并逐步增大時,訓練樣本平均相對誤差仍然在2%左右,但預測樣本平均相對誤差明顯增大,當γ<0.031并繼續減小時,訓練樣本平均相對誤差逐步上升,說明擬合度下降。

對懲罰因子C進行調整,當C<1.0E+4時,訓練樣本平均相對誤差在5%左右,且C越小擬合度越低,當C>1.0E+4并逐步增大時,訓練樣本平均相對誤差逐步減小,當C取值5.0E+4時,訓練樣本平均相對誤差為0.92%,預測樣本平均相對誤差為3.11%,當C取值>5.0E+4且繼續增大時,訓練樣本平均相對誤差略微減小,但是預測樣本平均相對誤差的增加幅度較大,說明預測效果下降。

P代表對損失函數中的參數b,對P進行調整,當P>0.000 98且逐步增大時,訓練樣本平均相對誤差逐步變大,擬合度下降,當P<0.000 98且逐步減小時,訓練樣本平均相對誤差逐步變小,但預測樣本平均相對誤差的增加幅度較大,說明預測效果下降。

4 預測樣本當年糧食產量預測結果

事實表明,當γ=0.031、C=5.0E+4、P=0.000 98時,模型擬合度較好,訓練樣本的平均相對誤差為0.92%,決定系數達0.99,同時預測樣本平均相對誤差為3.11%,滿足對傳染病發生當年的地區糧食產量預測需求,而GA-SVR由于其對少量樣本的案例模型建模,可通過參數優化設置,使其泛化能力較強,所以基于GA-SVR的糧食產量模型可對地區短期糧食產量預測提供準確的參考數據。訓練樣本結果見表2,預測結果見表3。

為了研究大型傳染病是否對當年的糧食產量具有重大影響,本文對于原有樣本去除疫情程度的2個參數(感染人口占比、死亡人數占比)后再次進行建模發現,訓練樣本擬合平均相對誤差為0.97%,預測樣本平均相對誤差為3.52%,決定系數同樣達到0.99。事實表明,該模型對地區短期糧食產量預測同樣具有較好的參考性。含疫情因素和不含疫情因素預測結果見表4。

5 大型傳染病對糧食產量的影響

由于國內大型傳染病樣本有限,屬于小樣本數據分析,GA-SVR方法對于少量樣本擬合、泛化能力均較優秀,通過參數的優化設置,模型建立和驗證得到以下結論:①在γ=0.031、C=5.0E+4、P=0.000 98時,模型可以較好地對樣本數據進行擬合,預測效果也比較好,說明基于GA-SVR的大型傳染病糧食產量模型準確、可靠。②在除去表示疫情程度的感染人口占比和死亡人口占比2個參數后重新建模,新模型仍然可以較好地對建模樣本數據擬合,對目標樣本進行預測,雖然較含疫情參數的模型平均相對誤差略大,但在基于現有國內大型傳染病疫情數據建模,疫情對當年地區糧食產量的影響有限。

該方法可以在大型傳染病疫情環境下,提供當年各省糧食產量預測,為國家糧食宏觀調控提供參考。

6 參考文獻

[1] 李東林,左其亭,張偉,等.基于Nerlove方法的塔里木河流域農業水資源配置模型[J].水資源保護,2021,37(2):75-80.

[2] 王倩,黃凱.基于系統動力學的北京市農業水足跡模擬與影響因素分析[J].系統工程,2021,39(3):13-24.

[3] 胡程磊,劉永華,高菊玲.基于IPSO-BP模型的糧食產量預測方法研究[J].中國農機化學報,2021,42(3):136-141.

[4] 李桐,董維紅,張琦琛,等.基于時間序列模型的黑龍江省糧食水足跡分析與預測[J].排灌機械工程學報,2020,38(11):1152-1159.

[5] 郭霖,白丹,王新端,等.基于支持向量機的滴灌灌水器流量預測模型建立與驗證[J].農業工程學報,2018,34(2):74-82

[6] 梁繼,鄭鎮煒,夏詩婷,等.高分六號紅邊特征的農作物識別與評估[J].遙感學報,2020,24(10):1168-1179.

[7] 李穎,陳懷亮.機器學習技術在現代農業氣象中的應用[J].應用氣象學報,2020,31(3):257-266.

[8] 陳曉璐,王彥芳,張紅梅,等.基于ESTARFM NDVI的察汗淖爾流域灌溉耕地提取方法研究[J].中國生態農業學報(中英文),2021,29(6):1105-1116.

[9] 熊皓麗,周小成,汪小欽,等. 基于GEE云平臺的福建省10 m分辨率茶園專題空間分布制圖[J].地球信息科學學報,2021,23(7):1325-1337.

[10] VAPNIK V N.The nature of statistical learning theory[M].New York:Springer,1999.

[11] 冼廣銘,曾碧卿.ε-支持向量回歸機算法及其應用[J].計算機工程與應用,2008(17):40-42.

[12] BURGES C J C.A tutorial on support vector machines for pattern rec-ognition[J].Data Mining and Knowledge Discovery,1998(2):121-167.

[13] 林升梁,劉志.基于RBF核函數的支持向量機參數選擇[J]. 浙江工業大學學報,2007(2):163-167.

[14] 成鵬,汪西莉.SVR參數對非線性函數擬合的影響[J].計算機工程,2011,37(3):189,191,194.

[15] 高心怡,韓飛.基于混合智能算法的支持向量機的糧食產量預測[J].江蘇大學學報(自然科學版),2020,41(3):301-306.

[16] 伍丹華,周禮梅.基于BP神經網絡的糧食產量預測[J].農業工程技術,2020,40(27):51-53.

(責編:張宏民)

基金項目 國家自然科學基金項目(41877425);上海市自然科學基金項目(21ZR1446800)。

作者簡介 童曉星(1983—),男,浙江慈溪人,碩士,講師。研究方向:農業電氣化與自動化。

主站蜘蛛池模板: 无码精品国产VA在线观看DVD| 国产精品lululu在线观看| 无码人妻免费| 日韩二区三区无| 制服丝袜一区二区三区在线| 欧美日韩一区二区三| 69视频国产| 亚洲AV无码一区二区三区牲色| 国产69精品久久| 免费在线看黄网址| 中文字幕首页系列人妻| 全部免费特黄特色大片视频| 国产男女免费完整版视频| 丝袜国产一区| 亚洲视频在线青青| 青青青国产精品国产精品美女| 99精品在线看| 狂欢视频在线观看不卡| 国产精品手机视频| 免费人成又黄又爽的视频网站| 青青网在线国产| 午夜视频在线观看免费网站| 免费视频在线2021入口| 国产在线一二三区| 永久成人无码激情视频免费| 777国产精品永久免费观看| 亚洲日韩精品无码专区| 自拍欧美亚洲| 日韩欧美中文字幕在线韩免费| 欧美精品成人一区二区视频一| 久久黄色影院| 国产精品成人AⅤ在线一二三四| 免费看美女自慰的网站| 国产成人精品18| 日韩欧美国产三级| 四虎影视库国产精品一区| 国产一区二区福利| 伊人天堂网| 亚洲欧洲日产国码无码av喷潮| 国产91精品调教在线播放| 亚洲国产清纯| 久久久国产精品无码专区| 综合人妻久久一区二区精品| AV片亚洲国产男人的天堂| 98超碰在线观看| 亚洲高清无码久久久| aa级毛片毛片免费观看久| 一级毛片不卡片免费观看| 亚洲天堂成人在线观看| 成年A级毛片| 欧美精品在线免费| 色综合久久无码网| 99在线观看国产| 香蕉久久国产超碰青草| 日本不卡在线视频| 青青青草国产| 久久a级片| 97国产成人无码精品久久久| 国产成人综合久久精品尤物| 国产精品视频公开费视频| 无套av在线| 波多野结衣AV无码久久一区| 国产一区三区二区中文在线| 国产精品999在线| 免费a级毛片18以上观看精品| 欧洲成人在线观看| 国产亚卅精品无码| 青青久久91| 亚洲日韩第九十九页| 亚洲va在线∨a天堂va欧美va| 欧美成人免费一区在线播放| 国产精品网址你懂的| 午夜毛片免费看| 欧美日韩第二页| 国产综合亚洲欧洲区精品无码| 国产又粗又猛又爽| 久久超级碰| 超清无码熟妇人妻AV在线绿巨人| 91亚洲影院| 国产无人区一区二区三区| 欧美一区二区自偷自拍视频| 久热中文字幕在线|