999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于網格搜索與交叉驗證的SVR 大型拖拉機銷量預測

2022-11-24 07:25:08張楊航李鋒軍張雷雷蘇建新
農業科技與裝備 2022年5期
關鍵詞:模型

張楊航 ,呂 鋒*,李鋒軍,張雷雷,蘇建新

(1.河南科技大學 機電工程學院,河南 洛陽 471003;2.第一拖拉機股份有限公司,河南 洛陽 471004)

農機裝備是“中國制造2025”戰略的十大重點領域之一,是支撐我國農業生產和發展的重要基礎和戰略性產業。 農機裝備市場需求量季節性變化明顯,需求高峰月份與低谷月份的銷量差別巨大。準確預測農機裝備銷量是整個農機裝備企業供應鏈管理中的重要環節,利于企業合理制定生產計劃,可減少需求高峰期“斷供”或積壓過多庫存造成的損失。拖拉機作為各類農機裝備的動力源, 具有適用范圍廣泛的優勢,同時政策補貼力度較大,是農機裝備市場的熱點。 相比于小型拖拉機,大型拖拉機生產難度較大、造價較高且更適于土地流轉后集中連片作業,因此,針對大型拖拉機的銷量預測具有重要意義。

傳統銷量預測研究集中于時間序列模型和回歸預測模型應用研究, 例如移動平均法、 指數平滑法、ARMA 法、多元回歸法,這些銷量預測模型在電商、汽車等多個領域得到了廣泛的應用[1-2]。 與其他產品相比, 大型拖拉機銷量受經濟環境和補貼政策影響較大,時間序列模型僅能識別自身過去或滯后值之間的內在關系,無法確定各影響因素對銷量的影響。 回歸預測模型缺乏數據樣本學習過程,易導致非線性關系模糊、 計算過程復雜,難以取得令人滿意的預測效果[3]。隨著人工智能的發展,基于機器學習的智能預測方法成為近年來的研究重點,如人工神經網絡和支持向量機(Support Vector machine,SVM)[4]。 人工神經網絡模型的預測效果依賴于數據量的大小,而拖拉機月度銷售量的預測更依賴新信息, 如果可用數據較少,則人工神經網絡很難取得良好的樣本外表現[5]。 SVR是SVM 對回歸問題的一種運用, 可有效解決預測中小樣本、非線性等問題,且在高維模式識別中表現出一定優勢,被廣泛應用于電力預測、客運需求預測等領域。

在SVR 預測模型的具體應用中, 懲罰系數C 和核函數參數g 的選取對預測性能具有關鍵性的影響。在機器學習領域,各類啟發式算法因其強大的優化性能而被廣泛應用于模型的參數優化,如Tharwat. A等[6]使用量子粒子群優化算法對SVM 超參數進行優化;Zhou Tao 等[7]使用遺傳算法對SVM 超參數進行優化, 提高了模型預測精度和計算速度;Kapoor. K等[8]使用基于灰狼優化的SVM,得到最佳參數組合,獲得最優二值分類結果。 但是,這些啟發式算法均從隨機的可行初始解出發,采用迭代改進策略,去逼近問題的最優解, 而不是系統地以確定的步驟去尋求答案,因而無法保證收斂到最優點。網格搜索與交叉驗證法可以通過循環遍歷,嘗試每一種可能性,進而找出全局最優點,并在參數較少的情況下,也不存在計算時間過長的問題, 因此被廣泛應用于SVM 的參數優化中。 雷會平等[9]提出一種改進的網格搜索和交叉驗證方法, 建立了復雜水體硝酸鹽濃度的SVR 預測模型,有效提升了預測精度和訓練效率;奚杏杏等[10]使用基于網格搜索與交叉驗證相結合的SVR 模型對血壓進行預測, 結果表明該模型的預測準確率和方根誤差值均明顯優于傳統的機器學習算法;Wang Zhenhe 等使用GS-SVM 作為優化分類器,對蟲害持續時間進行判別, 表現出較好的分類性能。在參考現有研究成果的基礎上, 綜合考慮季節、農業經濟環境和農機補貼政策影響,引入基于網格搜索和交叉驗證的支持向量回歸模型(GSCV-SVR),對大型拖拉機銷量進行預測研究, 以期獲得更高的預測精度。

1 變量選取與數據處理

1.1 變量選取

參考現有研究成果,結合數據可得性,選取如表1 所示的若干變量作為影響因素預測銷量。 其中,第一產業人員從業數量、 農村居民可支配收入指數、農作物播種面積和農機補貼額為每年年末統計數據,采用線性插值法充填為月度數據。主要農作物和柴油價格取上月月初和月末的平均價格。

表1 各變量類別及名稱Table 1 Category and name of each variable

1.2 數據預處理

月份是影響大型拖拉機銷量的重要離散型分類特征, 普通編碼方式會體現特征值之間的大小關系,造成模型預測誤差。為使特征值之間距離計算更加合理,經常對離散型特征使用One-Hot 編碼,將特征數值表示為二進制向量,并將這些向量作為模型訓練特征,以有效提高模型預測精度。 使用One-Hot 編碼方法對月份進行編碼,如圖1 所示。

圖1 各月份的ONE-HOT 編碼Figure 1 ONE-HOT code for each month

為消除不同維度數據間的量綱差別,需對除月份之外的數據進行歸一化處理:

2 基于網格搜索與交叉驗證的SVR

2.1 支持向量回歸

SVM 是按監督學習方式對數據進行二元分類的廣義線性分類器,SVR 是SVM 由分類問題到回歸問題的推廣,是SVM 的重要應用分支。 設樣本集為(xi,yi),i=1,2,3,K,n, SVR 通過非線性映射將回歸數據映射到高維空間,在高維空間構建回歸函數:

式中,ω 為權向量;b 為偏置量;φ 為核函數, ω和b 可以通過求解最優分類面函數的最小化獲?。?/p>

式中,C 為懲罰系數;ξi和為松弛變量;ε 為取值為任意正數的偏差。

使用拉格朗日乘子法計算得到:

由于輸入特征與銷量數據間呈現高度的非線性關系,特選擇徑向基核函數(RBF)進行回歸數據的高維映射,表示為:

式中,K(X,X′)為滿足 Mercer 條件的核函數;g為核函數參數。

計算得到SVR 模型為:

2.2 改進的網格搜索與交叉驗證

K 折交叉驗證法將訓練數據等分為K 個子集,選擇任一子集作為測試集,其他子集作為訓練集進行交叉驗證, 重復K 次, 找到均方誤差最小的參數組合,并將得到的最優參數輸入到SVR 模型中,具體如圖2 所示。

圖2 交叉驗證詳解圖Figure 2 Detail figure of cross validation

網格搜索法即采用窮舉搜索的方式,在指定的參數范圍內按步長依次對參數組合進行搜索。本研究提出一種改進的網格搜索法,即通過不斷收縮網格大小和步長來達到更高精度并有效提高搜索效率。改進的網格搜索與交叉驗證法具體步驟如下:

第一步:設定參數和的取值范圍[2N,2N],設定初始步長為M,獲得一個粗網格,網格中的節點即為給定范圍內所有可能得到的參數組合。

第二步:對所有參數組合使用交叉驗證法進行評價,找到均方誤差最小的參數組合(Ci,gi)。

第三步:選取參數組合(Ci,gi)相鄰兩個節點間的網格作為新的參數組合選擇范圍,并設定搜索步長為,再次進行交叉驗證,找到新的均方誤差最小的參數組合(Ci,gi)。

第四步:若(Ci,gi)在交叉驗證中均方誤差滿足精度要求,儲存(Ci,gi)至 SVR 模型,反之則轉到第三步,直至(Ci,gi)在交叉驗證中均方誤差滿足精度要求。

網格搜索與交叉驗證法以參數均方誤差最小化為目標,以參數范圍為約束條件,遍歷每個可能的參數組合,避免了局部最優解的存在,可有效提高參數優選的準確性。

GSCV-SVR 大型拖拉機銷量預測模型流程如圖3 所示。

圖3 GSCV-SVR 大型拖拉機銷量預測模型流程圖Figure 3 Flow chart of GSCV-SVR large tractor sales prediction model

3 實證分析

以2017—2021 年某品牌某型號大型拖拉機在河南省的銷量數據為基礎,對農機裝備銷量預測進行實例分析,具體數據如圖4 所示。

圖4 2017—2021 年某品牌某型號拖拉機的河南銷量數據Figure 4 Sales data of a brand and model of tractor in Henan Province from 2017 to 2021

取2017—2020 年的銷量數據作為訓練數據,對2021 年的數據進行預測;與2021 年的實際銷量數據進行對比,計算預測誤差,評價模型的準確性.

首先對數據進行預處理,之后設定模型中懲罰系數和核函數參數的初始范圍為[2~8,28],初始步長為1。針對所選的數據集特征,交叉驗證CV 參數K 選擇4。通過網格搜索與交叉驗證確定最佳參數組合,得到GSCV-SVR 預測模型。 將2021 年自變量數據輸入GSCV-SVR 預測模型,得到預測結果。 預測結果與實際數據對比如圖5 所示。

圖5 GSCV-SVR 預測值與實際值對比圖Figure 5 Comparison of GSCV-SVR predicted value and actual value

為進一步檢驗GSCV-SVR 在大型拖拉機銷量預測上的準確性, 分別使用 LSTM 人工神經網絡、ARIMA、LASSO 回歸常用預測模型, 對 2021 年銷量數據進行預測。各模型預測結果與實際數據對比如圖6 所示。

圖6 各預測模型結果對比圖Figure 6 Comparison diagram of the results of each prediction model

表2 給出了各模型預測結果與實際數據的均方根誤差(RMSE)和平均絕對誤差(MAE),由此可知GSCV-SVR 的均方根誤差和平均絕對誤差均最小,相比其他預測模型具有更好的預測性能。

表2 各模型預測效果對比Table 2 Comparison of the prediction effects of each model

4 結論與展望

將SVR 方法應用于大型拖拉機銷量預測研究中,可有效解決預測研究中歷史數據量少、影響因素多的問題。 提出一種改進的網格搜索與交叉驗證法,用于SVR 參數尋優并可有效提高網格搜索的精度和效率。通過分析選取影響銷量的特征并將其歸一化和One-Hot 編碼處理,作為模型的輸入,以增強模型的可解釋性,提高預測精度。預測結果表明,在小樣本情況下,利用RBF 核函數建立的GSCV-SVR 模型相比于LSTM、ARIMA 和LASSO 回歸模型具有更高的精度,能夠用于大型拖拉機的銷量預測。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 女人18一级毛片免费观看| 日韩成人免费网站| 无遮挡国产高潮视频免费观看| 国产精品久久久久鬼色| 国产一区二区三区在线观看免费| 99国产在线视频| 日韩123欧美字幕| 亚洲综合网在线观看| 国产午夜精品一区二区三区软件| 亚洲中久无码永久在线观看软件| 在线无码私拍| 91国内视频在线观看| 国产又黄又硬又粗| 国产欧美日韩免费| 91久久国产综合精品| 成人免费午夜视频| 国产一级在线观看www色 | 狠狠色丁婷婷综合久久| 在线观看91香蕉国产免费| 国产免费久久精品99re丫丫一| 久久精品中文字幕免费| 99久久无色码中文字幕| 国产另类乱子伦精品免费女| 欧美人人干| 欧美日本在线| 中文字幕在线欧美| 秘书高跟黑色丝袜国产91在线| 99热国产这里只有精品9九| 亚洲精品片911| 国产精品香蕉在线| 欧美日韩一区二区在线免费观看| 精品亚洲国产成人AV| 91精品啪在线观看国产| 毛片视频网址| 又爽又大又光又色的午夜视频| 久操线在视频在线观看| 欧美日韩午夜| 精品少妇人妻一区二区| 国产鲁鲁视频在线观看| 亚洲精品少妇熟女| 午夜综合网| 国产成人夜色91| 成人福利免费在线观看| 美美女高清毛片视频免费观看| 精品久久久久久久久久久| 国产日韩久久久久无码精品 | 亚洲欧美日韩视频一区| 欧美成a人片在线观看| 色偷偷综合网| 成·人免费午夜无码视频在线观看| 亚洲第一av网站| 日韩欧美国产成人| 天天色综合4| 99久视频| 尤物视频一区| 国产成在线观看免费视频| 五月天天天色| 国产精品无码AV中文| 狼友av永久网站免费观看| 玖玖精品视频在线观看| 71pao成人国产永久免费视频| 久久久黄色片| 亚洲日韩精品无码专区| 在线综合亚洲欧美网站| 亚洲欧美在线看片AI| 色婷婷综合在线| 日韩专区欧美| 蜜臀av性久久久久蜜臀aⅴ麻豆 | 国产成人免费| 片在线无码观看| 国产大片喷水在线在线视频| 亚洲第一中文字幕| 亚洲动漫h| 91精品专区| 亚洲精品大秀视频| 一级一级特黄女人精品毛片| 亚洲无码高清视频在线观看| www.91在线播放| 精品国产福利在线| 日本成人在线不卡视频| 亚洲区第一页| 亚洲va在线观看|