999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于梯度提升回歸樹模型的煙草產(chǎn)量預(yù)測方法

2023-09-27 03:43:06李明釗李熠胥
云南化工 2023年9期
關(guān)鍵詞:煙草產(chǎn)量模型

李明釗,李熠胥,王 佳

(1.紅云紅河煙草(集團(tuán))有限責(zé)任公司昆明卷煙廠,云南 昆明 650106;2.昆明理工大學(xué)自動化系,云南 昆明 650500)

煙草起源于美洲、大洋洲及南太平洋的某些島嶼,自哥倫布發(fā)現(xiàn)美洲大陸之后,開始逐漸傳播到世界各地。煙草遍布亞洲、美洲、非洲及東歐的廣大地區(qū),是中國及其他許多國家的重要經(jīng)濟(jì)作物[1],其利稅是國家和地方政府財政收入的重要來源之一。據(jù)統(tǒng)計,全國煙草行業(yè)在1993年便已創(chuàng)稅500億元,居各行業(yè)之首,并在后續(xù)年份持續(xù)上升。2010年達(dá)到5000億元,2021年實現(xiàn)13581億元,創(chuàng)歷史新高,為國家和地方財政增收、經(jīng)濟(jì)發(fā)展作出積極貢獻(xiàn)。此外,中國煙草的生產(chǎn)量占世界總量的三分之一以上,因此,為科學(xué)規(guī)劃煙草種植,對煙草產(chǎn)量的預(yù)測顯得尤為重要,可以為生產(chǎn)管理者提供決策支持。

目前,已有部分學(xué)者建立數(shù)學(xué)模型對煙草產(chǎn)量進(jìn)行預(yù)測。曾志三[2]等利用灰色預(yù)測模型預(yù)測福建省寧化縣的煙草產(chǎn)量,為科學(xué)規(guī)劃煙草種植提供依據(jù);劉曉宇[3]建立多元二次回歸模型,對黑龍江煙草產(chǎn)量進(jìn)行預(yù)測,并為黑龍江煙草生產(chǎn)提供相應(yīng)的對策建議;張慢慢[4]基于氣候因素建立與烤煙產(chǎn)量關(guān)系的多元回歸和BP神經(jīng)網(wǎng)絡(luò)模型,對河南省烤煙產(chǎn)量進(jìn)行預(yù)測,并對烤煙經(jīng)濟(jì)性狀進(jìn)行綜合分析;張?zhí)5]等基于植煙區(qū)土壤樣本的主成分分析,利用支持向量機(jī)回歸算法邵陽縣70個植煙區(qū)的煙草產(chǎn)量進(jìn)行回歸預(yù)測,為煙草產(chǎn)量的預(yù)測提供了一條新思路。通過文獻(xiàn)調(diào)研可知,建立數(shù)學(xué)模型對煙草產(chǎn)量進(jìn)行預(yù)測的相關(guān)研究較少,基于此本文提出一種梯度提升回歸樹(Gradient Boost Regression Tree,GBRT)模型對煙草產(chǎn)量進(jìn)行預(yù)測。

GBRT作為集成學(xué)習(xí)中的一種預(yù)測模型,其本質(zhì)是以決策樹為基本學(xué)習(xí)器的加法模型,由Friedman[6]首次提出,具有預(yù)測精度高、運算速度快、對異常值的魯棒性強(qiáng)、不容易陷入過擬合等優(yōu)勢,廣泛應(yīng)用于各行業(yè)預(yù)測研究。李津[7]等建立GBRT模型對高鐵區(qū)間晚點恢復(fù)進(jìn)行預(yù)測,幫助提高調(diào)度員決策效率及提升高鐵運營控制水平;陳靜[8]等建立GBRT模型對空調(diào)系統(tǒng)中冷水機(jī)組的能耗進(jìn)行預(yù)測,其預(yù)測精度足以滿足實際應(yīng)用需求;陳巖[9]等建立GBRT模型對風(fēng)力發(fā)電機(jī)溫度進(jìn)行預(yù)測,并與真實值比較,驗證所建模型的有效性。通過文獻(xiàn)調(diào)研可知,GBRT模型在諸多鄰域已得到廣泛應(yīng)用,但在煙草產(chǎn)量預(yù)測方面應(yīng)用較少,因此,本文利用GBRT預(yù)測煙草產(chǎn)量,并通過數(shù)據(jù)仿真驗證模型有效性。

綜上,本文利用GBRT模型對全國煙草產(chǎn)量進(jìn)行預(yù)測。首先,基于梯度提升思想建立GBRT模型;然后,根據(jù)近年來全國煙草產(chǎn)量的真實數(shù)據(jù)設(shè)置獨立因子;最后,通過仿真實驗驗證GBRT模型預(yù)測的有效性。

1 模型建立

1.1 梯度提升

梯度提升建立在集成學(xué)習(xí)Booting思想上,通過將多個基學(xué)習(xí)器進(jìn)行加權(quán)結(jié)合,使弱學(xué)習(xí)器提升為強(qiáng)學(xué)習(xí)器[10]。基于此,若弱學(xué)習(xí)器的生成依據(jù)是損失函數(shù)的梯度方向,則稱之為梯度提升。梯度提升算法首先要給定一個目標(biāo)損失函數(shù),通過迭代選擇一個梯度方向上的基函數(shù)來逐漸逼近函數(shù)局部極小值,以達(dá)到損失函數(shù)最小值。

1.2 回歸樹

GBRT模型的基學(xué)習(xí)器為回歸樹CART[11],其樹生成方法是將特征空間進(jìn)行分支劃分,分支時窮舉每一個特征值的每一個閾值,通過最小化均方差找到分支依據(jù),直到滿足預(yù)設(shè)的終止條件。一棵回歸樹對應(yīng)著輸入空間的一個劃分區(qū)域以及在劃分區(qū)域單元上的輸出值,假設(shè)一棵回歸樹有n個特征,每個特征Si(i∈(1,n))個值,通過窮舉每個特征的每個取值對空間進(jìn)行劃分,直至取到特征j的取值s,使得損失函數(shù)最小。

1.3 GBRT模型

GBRT以弱學(xué)習(xí)器集合的形式產(chǎn)生強(qiáng)學(xué)習(xí)器,并在此基礎(chǔ)上進(jìn)行訓(xùn)練樣本的學(xué)習(xí)及模型預(yù)測。其核心思想是添加新的回歸樹以最小化每次迭代中的目標(biāo)函數(shù),每棵新樹都是在上一棵樹的殘差上進(jìn)行學(xué)習(xí),并沿著損失函數(shù)的負(fù)梯度方向進(jìn)行訓(xùn)練,通過多次訓(xùn)練,最終將弱學(xué)習(xí)器進(jìn)行線性組合,產(chǎn)生一個強(qiáng)學(xué)習(xí)器[12]。

GBRT模型算法步驟如下:

步驟1:訓(xùn)練數(shù)據(jù)集為T={(x1,y1),(x2,y2),…,(xn,yn)},n為正整數(shù)。損失函數(shù)為L={y,f(x)},回歸樹為F(x)。c為常數(shù),表示根節(jié)點的類別。初始化決策樹:

(1)

步驟2:設(shè)m=1,2,…,M表示迭代次數(shù),即生成的弱學(xué)習(xí)器個數(shù)。對樣本h=1,2,…,H,計算損失函數(shù)的負(fù)梯度在當(dāng)前模型的值作為殘差的估計:

(2)

步驟3:{(x1,r1m),(x2,r2m),…,(xN,rNm)}擬合一個回歸樹,得到第m棵樹的葉節(jié)點區(qū)域Rmj,j=1,2,…,J表示每棵樹的葉節(jié)點個數(shù)。

步驟4:對j利用線性搜索,估計葉節(jié)點區(qū)域的值,使損失函數(shù)最小化,計算最佳擬合值:

(3)

步驟5:更新為強(qiáng)學(xué)習(xí)器:

(4)

步驟6:得到最終回歸樹,即每棵樹的葉節(jié)點值相加:

(5)

2 數(shù)據(jù)整理

本文數(shù)據(jù)均從公開數(shù)據(jù)中整理得到,將2017~2021年全國煙草月度產(chǎn)量趨勢顯示于圖1。其中,對1~2月的煙草產(chǎn)量整合,顯示2月的累計產(chǎn)量。此外,將2018~2021年各月度產(chǎn)量與上年同期產(chǎn)量同比增長量趨勢顯示于圖2。

圖1 2017~2021年全國煙草產(chǎn)量趨勢示意圖

圖2 2018~2021年全國煙草產(chǎn)量同比增長趨勢

從圖1中可以觀察出,煙草每年的月度產(chǎn)量走勢大致相同,但同年不同月份間差異明顯。從圖2可看出,不同年份各月度產(chǎn)量與上年同期產(chǎn)量間的差值差異明顯。由此可見,煙草產(chǎn)量與年份、月份及上年同期產(chǎn)量之間存在一定的關(guān)聯(lián)。因此,將煙草產(chǎn)量數(shù)據(jù)的年份、月份及上年同期產(chǎn)量作為獨立因子輸入GBRT模型。

3 仿真結(jié)果

為驗證GBRT模型預(yù)測的準(zhǔn)確度,將GBRT算法所得結(jié)果與2022年全國煙草產(chǎn)量的真實數(shù)據(jù)進(jìn)行比較,對比結(jié)果顯示于表1。此外,為更加直觀地看出GBRT預(yù)測結(jié)果與真實數(shù)值間的差異,將二者的月度趨勢繪制與圖3。

表1 預(yù)測結(jié)果對比

圖3 預(yù)測結(jié)果趨勢對比

由表1及圖3可知,GBRT模型在大多數(shù)月份的預(yù)測與真實數(shù)值誤差不大。除6月與12月預(yù)測結(jié)果偏差較大以外,其余月份的相對誤差基本保持在5%以內(nèi)。此外,全年月度產(chǎn)量整體走勢與真實數(shù)值大體相似,平均相對誤差為5.2%,且全年總產(chǎn)量與真實數(shù)據(jù)之間差異極小,驗證了GBRT模型的有效性。

4 結(jié)論

本文針對煙草行業(yè)產(chǎn)量預(yù)測,綜合考慮年份、月份及上年同期產(chǎn)量等影響因素,建立GBRT模型,預(yù)測全國煙草產(chǎn)量。結(jié)果表明,GBRT模型預(yù)測結(jié)果與真實數(shù)值大體相似,各月度產(chǎn)量平均相對誤差為5.2%,全年相對誤差為0.1%,具有較強(qiáng)的實用性和有效性。

猜你喜歡
煙草產(chǎn)量模型
一半模型
煙草具有輻射性?
2022年11月份我國鋅產(chǎn)量同比增長2.9% 鉛產(chǎn)量同比增長5.6%
今年前7個月北海道魚糜產(chǎn)量同比減少37%
重要模型『一線三等角』
海水稻產(chǎn)量測評平均產(chǎn)量逐年遞增
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
2018上半年我國PVC產(chǎn)量數(shù)據(jù)
聚氯乙烯(2018年9期)2018-02-18 01:11:34
煙草依賴的診斷標(biāo)準(zhǔn)
3D打印中的模型分割與打包
主站蜘蛛池模板: 亚洲第一区精品日韩在线播放| 国产欧美自拍视频| 国产精品流白浆在线观看| 亚洲一区二区三区国产精品| 亚洲天堂在线免费| 狠狠亚洲婷婷综合色香| 黄色片中文字幕| 黄色网站不卡无码| 久久久久中文字幕精品视频| 2024av在线无码中文最新| 国产9191精品免费观看| 精品三级在线| 国产精品久久久免费视频| 国语少妇高潮| 成人91在线| 夜精品a一区二区三区| 在线无码私拍| 天天操天天噜| 成人a免费α片在线视频网站| 免费可以看的无遮挡av无码| 精品国产一区91在线| 在线观看国产精品一区| 亚洲视频影院| 成人亚洲视频| 欧美日本一区二区三区免费| 亚洲高清国产拍精品26u| 91九色国产porny| 黄色免费在线网址| 一级全黄毛片| 欧美一级特黄aaaaaa在线看片| 日韩高清成人| 国产成人精品高清在线| 日韩免费成人| 欧亚日韩Av| 精品91视频| 亚洲欧美日韩另类在线一| 思思热精品在线8| 亚洲欧美成人网| a国产精品| 欧美伦理一区| 专干老肥熟女视频网站| 国产凹凸视频在线观看| 在线免费观看a视频| 亚洲午夜综合网| 欧美丝袜高跟鞋一区二区| 国产精品真实对白精彩久久 | 制服丝袜一区二区三区在线| 精品久久人人爽人人玩人人妻| 国产大片黄在线观看| 麻豆精品在线视频| 欧美激情视频在线观看一区| 色噜噜狠狠色综合网图区| 日韩色图在线观看| 亚洲福利片无码最新在线播放| 91无码网站| 99热国产在线精品99| 欧美日韩理论| 激情亚洲天堂| 韩日免费小视频| 国产在线观看成人91| 97视频在线观看免费视频| 又爽又大又黄a级毛片在线视频 | 成人福利在线视频| 中文字幕在线看视频一区二区三区| 国产成人区在线观看视频| 亚亚洲乱码一二三四区| 精品国产成人av免费| 欧美日本二区| 亚洲精品视频免费| 99久久99视频| 福利一区在线| 不卡国产视频第一页| 亚洲精品福利视频| 久操中文在线| 青青草91视频| 成人免费网站久久久| 国产男女XX00免费观看| 国产亚洲精品自在线| 久久久国产精品无码专区| 成人国产精品2021| 久久影院一区二区h| 国产农村1级毛片|