doi:10.3969/J.ISSN.1672-7274.2025.06.009
中圖分類號:TM910.6;TP31;U469.72 文獻標志碼:B 文章編碼:1672-7274(2025)06-0026-03
Electric Vehicle ChargingLoad Forecasting Based on Optimized Random Forest Algorithm
ZHANG Meng
(Shanxi Vocational College of Finance and Trade, Taiyuan O3oo31, China)
Abstract: With the rapid development ofthe electric vehicle (EV) market,the demand forcharging is increasing, posing unprecedented challnges to the existing power system. Accurately predicting the charging load of electric vehiclescan guidethe management and scheduling of the power system,improve the eficiencyofenergyutilization, and help alleviate charging pressure.This article proposes an electric vehicle charging load prediction method based on optimized random forest algorithm.The experimentalresults show that compared with the SVM method,this model has significantly improved accuracyand stability,and can provide more reliable basis for power system management and scheduling, effectively coping with the pressure of charging peak.
Keywords: charging load forecasting; random forest; grid search
0 引言
隨著全球對可持續發展和環保的重視,電動汽車(EV)作為一種低碳出行方式,近年來得到了快速發展。數據顯示,電動汽車的市場份額不斷增加,預計在未來的幾年內將繼續保持強勁的增長[1]。據國際能源署(IEA)統計,預計2024年底,全球電動汽車的累計銷量將接近1700萬輛,將占全球汽車總銷量 20% 以上,預計2030年全球電動汽車銷量有望超過4000萬輛。充電負荷預測的準確性直接影響著電網的安全穩定運行和經濟效益。充電需求的激增給電力系統的穩定性和可靠性提出了嚴峻考驗。
針對上述背景,本文關注充電負荷受多種因素影響,利用AdaBoost思想策略對隨機森林進行優化并構建充電負荷預測模型。結果表明,該模型能夠有效預測電動汽車的充電負荷曲線,為電力系統的穩定運行提供重要的理論基礎和實踐指導。
1 理論基礎與數據處理
1.1決策樹模型
決策樹是一種采用樹形結構模擬決策過程的模型,通常在機器學習中用于處理分類與回歸任務。本質上決策樹的算法邏輯可以描述為if-then,根據不同的決策樹屬性選擇方式,將學習樣本按照邏輯分類,最后歸結至某一確定的分類中[2]。在決策樹的構建過程中,確定最優的分裂屬性是核心步驟,這涉及到決策樹的屬性選擇機制。本文中,采用了“基尼指數”作為衡量屬性優劣的標準,這是一種在CART(ClassificationandRegressionTrees)決策樹算法中常用的方法。
CART決策樹通過使用基尼指數(Giniindex)來衡量樣本集 D 的不純度。基尼指數越低,意味著數據集 D 的純度越高。在決策樹中,結點的“純度”值越高,表明該節點下的樣本更有可能屬于同一個類別,定義如下:

式中, pk 表示 ?k 類別在數據集 D 中的比例。針對數據集D 中的屬性A,基尼指數定義如下:

1.2隨機森林算法
隨機森林是利用訓練多個決策樹而形成的回歸與分類算法。直觀理解隨機森林,可以將其理解為對總體數據樣本進行的隨機抽樣形成的多棵決策樹結果。通過Bootstrap集成算法,從原始數據集N中有放回的重復獲取 Πn 個樣本生成新的訓練集和相應的決策樹。再對所有結果進行投票或平均匯總得到最終結果,極大程度上避免了單一決策樹在訓練中出現的過擬合情況。通過隨機森林算法,能夠更敏捷地對充電數據集各類參數樣本進行提取,從而形成最終的決策樹模型,對于回歸分析大多使用平均法得到隨機森林的最終輸出。隨機森林結構圖如圖1所示。

1.3數據處理
電動汽車充電負荷預測相關數據具有數據類型復雜、數據量龐大、缺失值較多等特點。因此,在模型訓練之前,需要對數據集進行數據預處理操作。為了分析電動汽車充電負荷預測模型的性能,本文選用ACN-DATA公開數據集,該數據集包含美國部分地區電動汽車充電樁歷史充電數據。采集數據的時間段為2020年1月1日至2021年9月14日,通過剔除重復數據和無效數據后,有效充電會話次數為5509條。具體數據包括充電樁ID、連接時間、斷開時間、充電量等。考慮到天氣情況對用戶充電行為的影響,如溫度、降雨、降雪等天氣情況對電池、用戶充電需求的影響,在進行數據處理中,增加了加利福尼亞當日天氣相關數據特征。
1.3.1數據填充
針對數據集中存在的缺損數據,為保證數據完整性以便于數據集整體訓練,需要利用數據填補方式對缺失值進行填補。常見的缺損數據處理方式有均值法、0填充法、插值法等。為盡可能保證電動汽車充電負荷數據完整性,以保留其數據特征和相關性,本文采用日期和類型的數據來填補缺失數據,利用相近日期類型相同的充電負荷進行加權填充,保證了數據完整性和預測結果的準確性。
1.3.2數據標準化
ACN-DATA中電動車充電負荷數據以及當地天氣數據使得本文數據集評價指標十分復雜,涵蓋不同類型的數據,如溫度、負荷、降雨量等不同指標的單位、數值范圍相差巨大。為了消除不同維度和尺度的影響,平衡各種屬性在訓練中對結果的影響。本文應用了Z-Score標準化技術,以確保所有數據的一致性和可比性。Z-Score標準化是通過計算每個數據點與平均值的差值,使得數據標準統一化,能夠使得不同屬性數據有可比性,公式如下。

式中, Zr 代表第i個樣本經過歸一化處理后的值; A 是原始數據第i個樣本值; μ 表示總樣本均值; σ 表示總樣本的標準差。
1.3.3特征篩選
為提升模型性能與泛化能力,本文采用Pearson相關性分析、PCA主成分分析來進行特征評估,以達到降低模型復雜度、減少過擬合的目的[3]。針對本文數據集中所包含的充電起始時間、充電斷開時間、負荷、當日最高溫度、當日平均溫度、平均風速等23個數值型屬性變量進行分析,以確保能夠在保證數據集屬性相關性達到最佳平衡點,提升模型整體效果。通過綜合考慮,本次模型最終選擇充電時間、是否為工作日、負荷、平均溫度等11個特征作為后續模型建立的屬性。
2 預測算法
在傳統隨機森林回歸模型中,參數的設定對模型預測的準確性起著至關重要的作用。如果參數選擇不當,可能導致模型的準確性下降。此外,模型的訓練時間和計算復雜度會隨著決策樹數量的增加而增加。而且傳統模型對數據的質量和數量有一定的依賴性,若數據存在噪聲或異常值,可能會影響預測結果的準確性。
本文使用網格搜索來優化AdaBoost模型的超參數,AdaBoost思想迭代提升以優化整個訓練樹模型,通過對每棵決策樹進行加權訓練,以提升學習器的性能。在每次迭代中,根據上一輪決策樹的預測誤差調整訓練數據的權重,并重新訓練新的決策樹。最終,將所有決策樹的預測結果進行加權求和,得到最終的預測結果。其模型流程圖如圖2所示。
3 實驗與分析
3.1模型訓練與評估
為了使得驗證結果的有效性,在本文選定的數據中,將樣本數據通過缺損填補、Z-Score標準化和特征選取構建了本文的實驗數據集,其中 80% 的數據被分配用于訓練模型,而剩余的 20% 則作為驗證集,用于檢驗模型預測的精確度。本文選用RMSE和MAE作為模型評價指標對電力負荷預測精度進行驗證。


3.2結果分析
將優化后的RF與支持向量回歸機(SVR)模型進行對比。根據前文選定評價指標,對本文模型與SVM算法得到的預測與實際值進行計算,結果對比如表1所示。從圖3可以看出,隨機森林在本文數據集中預測結果更接近于真實值,表明該模型能夠以較高準確度捕捉數據特征,從而為電動汽車負荷預測提供了一種可靠的方法。
4 結束語
本文利用網格搜索來優化AdaBoost模型的超參數,并選取合適的隨機森林參數,提出了基于隨機森林算法的電動汽車充電負荷預測模型,通過ACN-DATA公開數據集進行模擬仿真。根據RMSE和MAE指標對本文方法和SVM模型進行評價。通過表1所示結果,在數據集中本文方法在預測負荷的準確度和擬合程度都優于SVM算法模型,能夠提供更為準確的預測結果,能夠更為精準地捕捉到充電負荷的變化趨勢,從而為電網規劃、調度以及運營管理提供更為可靠的決策依據。
由于不同用途車輛以及充電站空間信息的用戶使用規律和充電需求存在明顯差異,在時間和空間上具有一定的隨機性。為了進一步提升電動汽車充電負荷預測的精度和可靠性,未來須深入研究這些復雜因素對預測結果的影響機制。探索如何將這些時間和空間信息有效地融入預測模型中,以更好地捕捉充電負荷的時空變化規律。期望通過這些深入研究,能夠開發出更為完善的電動汽車充電負荷預測模型,為智能電網的發展和電動汽車產業的可持續發展提供有力支持。
參考文獻
[1]陳男,孫曉東,馬志鵬.電動汽車接入電網對電網諧波的影響[J].電子測試,2021(17):122-123.
[2]劉延釗,黃志球,沈國華,等.基于決策樹和BN的自動駕駛車輛行為決策方法[J].系統工程與電子技術,2022,44(10):3143-3154.
[3]劉奕舟,李振華,魏偉,等.基于LSTM-GNN組合模型的電動汽車短期充電負荷預測[J/OL].電源學報,1-14[2024-12-02].http://kns.cnki.net/kcms/detail/12.1420.tm.20240724.1728.016.html.
[4]張欣,李林.基于隨機森林的季節性電動汽車充電負荷預測[J].軟件工程,2024,27(11):11-14,37.