999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于隨機森林回歸分析的徑流預報模型

2018-10-15 08:53:48
水利水電快報 2018年9期
關鍵詞:重要性特征評價

(河南省南陽水文水資源勘測局,河南 南陽 473000)

徑流預報是水利水電工程設計、施工和運行管理的重要依據,在防洪減災、水資源優(yōu)化配置等方面發(fā)揮著顯著的作用[1]。因此準確有效地延長徑流預見期、提高徑流預報精度有著至關重要的意義[2-3]。目前,水文學者對徑流及其影響因子的關系進行了大量的研究[4-6],常用的有多元回歸模型、逐步回歸模型、最小二乘法等,但是受天文、氣候、植被、地質地貌等因素的影響,水文預報呈現出隨機性、高維性、模糊性等特點[7]。隨機森林回歸(Random Forest Regression,RFR)算法是由L. Breiman等[8]于2001年共同提出的一種基于決策樹的集成學習算法,可以同時處理連續(xù)、離散屬性,具有運行效率高、防止過擬合、強穩(wěn)健性和抗噪性等優(yōu)點,但是該方法在水文領域應用較少。因此,本文選取1970~2010年西峽水文站年降水量、年蒸發(fā)量、年平均流量、年均氣溫、年均相對濕度和年均氣壓作為預報因子,基于R語言構建隨機森林回歸算法,建立徑流預測模型,為實際工程中徑流預測問題的研究提供技術支撐。

1 數據和方法

1.1 數據來源

本文的分析數據主要來源于西峽水文站1970~2010年的水文及氣象數據,主要包括流量、徑流量、降水量、蒸發(fā)量、氣溫、相對濕度和氣壓等資料。西峽水文站系長江流域丹江水系老灌河干流上的主要控制站,為國家級一類站,控制流域面積3 418 km2,區(qū)間干流長度165 km,多年來平均降水量846 mm。

1.2 隨機森林回歸

(2)隨機子空間。在構建回歸決策樹的過程中,每個分裂節(jié)點在特征空間中隨機選擇若干特征構建特征子空間,并選出最優(yōu)特征子空間進行分裂,保證樹的獨立性和隨機性。在RFR中,樹的個數(ntree)和隨機特征數(mtry)決定著模型的最終預測能力。

1.2.1 預報模型構建

(1)樣本劃分。以選取的6個預報因子作為解釋變量,以西峽水文站年徑流作為目標變量,劃分1970~2000年數據為訓練樣本,2000~2010年數據為驗證樣本,采用訓練樣本構建預報模型,利用檢驗樣本對模型預報精度進行評價。

(2)預報模型構建?;赗語言的randomForest函數構建隨機森林模型[9],其中mtry默認為輸入變量的1/3,本文選取變量有6個,則mtry值取2。通過實驗得到不同決策樹個數的模型誤差與ntree的關系(如圖1所示),模型錯誤率隨著ntree的增加逐漸降低,錯誤率在ntree為300時達到最低(2.92%),之后隨著ntree值的增加,模型的錯誤率仍保持較低且穩(wěn)定的狀態(tài)。該特征充分證明了RFR算法具有防止過擬合的能力。

圖1 不同ntree對應的模型錯誤率

考慮到模型的精度和運算效率問題,實驗最終選擇mtry=2,ntree=300進行建模。

1.2.2 模型變量重要性評價

RFR通過計算解釋方差百分比(variance explained)來評價模型的預測能力。用方差增量(increase in mean squared error,IncMSE)以及節(jié)點純度增量(increase in node purity, IncNodePurity)兩個指標來定性衡量特征變量對目標變量的重要性。IncMSE為采用隨機變量替換某一變量對模型預測結果的影響,若該隨機變量使方差顯著改變,則表示原變量相當重要;IncNodePurity則利用同質性增加原理來衡量變量的重要性[9]。

1.2.3 模型評價與檢驗

本文通過評價模型的擬合效果和檢驗模型預測結果來評價模型的預測能力。通過計算RFR模型的決定系數(R2)和均方根誤差(RMSE)來評價模型的擬合效果[10]。

(1)

(2)

分別對RFR模型預測結果進行檢驗,通過計算總體相對誤差(Rs)、平均相對誤差(E)、平均相對誤差絕對值(E′)3個統(tǒng)計量指標以及精度P來評價模型的預測能力[10]。

(3)

(4)

(5)

(6)

2 結果分析

2.1 特征變量重要性評價

隨機森林算法可以用來評估所選特征變量的重要性,有效避免了一般回歸問題面臨的多元共線性問題[11]。本文特征變量的重要性評價如表1所示??梢钥闯瞿昶骄髁?、年蒸發(fā)量、年降水量、年平均相對濕度對于徑流模型的預報有較大的貢獻。

表1 RFR模型變量重要性評價 %

2.2 精度評價分析

2.2.1 模型評價

通過實驗得到預測模型的均方根誤差(RMSE)為 0.0382,決定系數(R2)為0.89,可知模型預測精度較好。

2.2.2 模型檢驗

RFR模型預測結果如表2所示,檢驗數據的平均相對誤差在16%以內,精度較高。

表2 徑流量模型預測檢驗結果

通過計算模型偏差統(tǒng)計量評價模型的預測能力,結果如表3所示,可以看出模型預報能力較好。

表3 模型總體預測結果檢驗

3 結 論

(1)本文建立的RFR徑流預報模型R2為 0.89,RMSE為 0.038 2,模型的擬合效果較好;模型預測結果的總相對誤差為0.034,預測精度P為91.52%。綜上表明本文構建的RFR徑流預報模型預報能力較好。

(2)在多樣本、多指標、復雜的水文預報問題處理中,RFR算法可以評估各個特征變量的重要性,對離群值不敏感,在隨機干擾較多的情況下表現穩(wěn)健,且不易產生過度擬合。而且RFR算法包含估計缺失值的算法,在水文資料存在缺失的情況下(1971~1975年有資料缺失)能夠彌補缺失值,使預測結果仍可維持較高的精度。

猜你喜歡
重要性特征評價
SBR改性瀝青的穩(wěn)定性評價
石油瀝青(2021年4期)2021-10-14 08:50:44
“0”的重要性
論七分飽之重要性
幼兒教育中閱讀的重要性
甘肅教育(2020年21期)2020-04-13 08:09:24
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
讀《邊疆的重要性》有感
唐山文學(2016年11期)2016-03-20 15:26:04
基于Moodle的學習評價
線性代數的應用特征
河南科技(2014年23期)2014-02-27 14:19:15
主站蜘蛛池模板: 亚洲中文在线看视频一区| 国产成人三级在线观看视频| 日韩一区二区三免费高清| 四虎精品黑人视频| 麻豆国产精品| 国产精品亚洲一区二区三区在线观看| 1级黄色毛片| 欧美日韩福利| 亚洲天堂视频在线播放| 日本成人福利视频| 日韩天堂在线观看| 亚洲欧美日韩另类| 国产第三区| 精品自窥自偷在线看| 欧美区一区二区三| 无码'专区第一页| Aⅴ无码专区在线观看| 成人免费午夜视频| 午夜成人在线视频| 尤物视频一区| 国模沟沟一区二区三区| 欧洲成人在线观看| 欧美日韩国产高清一区二区三区| 亚洲天堂免费在线视频| 97超碰精品成人国产| 国产视频大全| 亚洲成人高清无码| 国产白浆视频| 综合色天天| 免费亚洲成人| 无码AV日韩一二三区| 国产成人精品18| 福利国产在线| 91口爆吞精国产对白第三集| 重口调教一区二区视频| 久久超级碰| 欧美无专区| 国产哺乳奶水91在线播放| 极品国产一区二区三区| 亚洲一本大道在线| 天天躁日日躁狠狠躁中文字幕| 97超级碰碰碰碰精品| 国产自视频| 成人精品区| 欧美黑人欧美精品刺激| 91在线激情在线观看| 精品99在线观看| 97在线观看视频免费| 久久久受www免费人成| 日韩少妇激情一区二区| 青青网在线国产| 亚洲精品在线观看91| 久久午夜夜伦鲁鲁片不卡| 黄片一区二区三区| 國產尤物AV尤物在線觀看| 久久中文字幕不卡一二区| 91福利一区二区三区| 国产无码在线调教| 亚洲色图综合在线| 午夜福利亚洲精品| 91娇喘视频| 亚洲精品制服丝袜二区| 最新国语自产精品视频在| 全午夜免费一级毛片| 99久久精品免费观看国产| 欧美一区二区自偷自拍视频| 国产精品一区二区国产主播| 国产成人高清亚洲一区久久| 伊人久久精品无码麻豆精品| 亚洲福利片无码最新在线播放| 日韩欧美国产成人| 欧洲熟妇精品视频| 婷婷丁香色| 欧美全免费aaaaaa特黄在线| 91精品啪在线观看国产91| 国产无码高清视频不卡| 综合网久久| 国产成人精品免费av| 亚洲国产成人自拍| 国产精品999在线| 亚洲人成亚洲精品| A级毛片高清免费视频就|