王寧, 陳宇, 李波
(同濟大學 汽車學院,上海 201804)
隨著環境惡化問題的日益突出,由于傳統煤礦、石油等不可再生能源存在自身資源短缺和污染問題,能源消費正向電動化、清潔化、低碳化、智慧化轉型[1]。電動汽車因高效能、零污染、低排放等優點逐漸受到各國政府的重視[2],電動汽車產業高速發展,大規模電動汽車接入電網,造成電網波動性變化,在可靠性、安全性和經濟性等方面影響電網運行[3-5],對其充電負荷進行預測十分有必要。精準預測有助于促進電動汽車與電網的互動,實現有序充電,進而優化電網負荷運行曲線,保障電網穩定運行,提高充電設施的利用率,減少電動汽車充電給電網帶來的負面影響[6-7]。
現有的負荷預測方法可按照時間尺度分為4類:超短期預測、短期預測、中期預測和長期預測,如圖1 所示[8-9]。不同的時間尺度應用場景有所區別,超短期預測適用于電力系統實時監控,短期預測適用于充電設施的日常運維,中長期預測多用于輔助未來充電基礎設施的投資規劃和資源配置[10]。為實現協調電動汽車與電網關系的目的,國內外相關研究以短期為主,從車端和充電站端兩方面展開。
從車端展開的預測方法多利用統計學方法建立車輛出行和充電模型,采用蒙特卡洛法進行仿真分析[11-14]。但由于用戶行為存在高度的異質性和隨機性,此類方法的模型參數設計復雜,模型難以克服長尾效應的影響,會導致最終的車端仿真結果與真實充電行為存在差異[15],普適性較差。
相比從車端展開的預測方法,從充電站端出發的預測方案通過采集大量充電站有效歷史負荷數據,考慮溫度、天氣狀況、節假日、特殊日期、生活習慣、交通狀況等因素對充電行為的影響[6],利用機器學習類算法直接從數據中探索負荷變化規律[16],規避了建模仿真帶來的誤差影響,預測結果更接近于真實值的變化趨勢,方法實用性更強。在電動汽車高速發展的背景下,充電站負荷數據井噴式增長,基于充電站端的方法應用前景廣闊,國內外積極展開研究。李恒杰等[17]考慮電動汽車基礎設施需求的特異性和電動汽車配置的差異性,建立能量集成輕量梯度提升框架進行充電站充電負荷預測,能在縮短訓練時間和降低計算資源需求的同時實現充電站負荷的超短期預測。龔鋼軍等[18]考慮環境、日期類型等影響充電站負荷量的關鍵因素,改進深度學習中的棧式自編碼器,提出棧式自編碼器-極限學習機,實現對大量數據的特征提取,對充電負荷進行精準預測。FENG Jiawei等[19]將基于多變量殘差修正的灰色模型和LSTM 相結合,建立從影響因素數據到預測的映射,降低電動汽車負荷預測誤差,有效提高電動汽車充電站負荷預測的精度。SHEN Xiaodong 等[20]針對充電站數據稀缺問題,提出一種基于生成對抗網絡的數據生成方法,在LSTM 中添加新型門控機制進行負荷預測,并通過試驗證明該方法的有效性。
上述方法雖取得了良好的預測效果,但他們的研究只從時間序列角度探索外部因素對于充電負荷的影響,對象均為單個站點,方法泛化能力不足,不能實現對多個站點負荷的協同精準預測。為解決這一難題,諸多學者基于電動汽車充電負荷存在空間與時間的雙重動態變化的特點,挖掘各充電站負荷在空間維度上存在的聯系,構建預測方法時充分考慮空間維度信息的影響,從而實現對多個站點負荷的協同精準預測。張秀釗等[21]利用LSTM 層和三維卷積層捕獲充電樁負荷的空間和時間維度信息,構建時空神經網絡同時輸出多個時間步的時空動態負荷矩陣,實現對于充電負荷時空二維信息的準確預測。彭麗等[22]通過二維空洞卷積層學習空間維度信息,并利用二維空洞卷積層的堆疊實現對時間維度信息的學習,成功構建一個能充分考慮空間和時間維度信息的模型。上述文獻雖然具有優異的預測效果,但是忽略了外部特征對于模型精度的積極影響,易出現模型魯棒性不佳的問題。對此,王圣元[23]意識到外部因素在充電站負荷預測中的重要性,構建基于門控圖神經網絡的負荷時-空預測模型,取得良好的預測結果,但只是將天氣特征和日期特征作為圖神經網絡的輸入,未深入挖掘其特征規律。
為此,本文提出一種能同時考慮負荷時空因素和外部因素影響,并且能協同多個充電站負荷進行預測的方法,該方法基于GSTNN 模型,將充電站看作充電負荷節點,構建每一時刻所有充電站的負荷加權有向圖以刻畫充電站之間的空間關系,對有向圖進行堆疊后輸入時空神經網絡,進行時空因素特征提取,同時利用LSTM 網絡提取天氣、日期、歷史負荷等外部因素的特征,再利用融合網絡將特征進行拼接,最終實現同時對多個充電站的精準負荷預測。與隨機森林(Random Forest, RF)、LightGBM (Light Gradient Boosting Machine)、XGBoost(eXtreme Gradient Boosting)、多層感知機(Multilayer Perceptron,MLP)、LSTM、不考慮外部因素的圖時空神經網絡(GSTNN_nf)等模型進行比較,本文提出的考慮外部因素的GSTNN 模型能充分考慮影響充電站負荷的因素,實現對多個充電站負荷的協同預測,同時輸出各充電站的預測負荷,并具有更高的預測精度。
深度學習憑借其特有的深層結構,使模型能具備極強的特征表示和概念抽象能力,避免了傳統機器學習方法對特征工程的依賴[24],已經在圖像處理、機器翻譯、自動駕駛等多個領域廣泛應用[25-27],并取得了優異的效果。在上述領域使用的神經網絡中,處理的數據節點都有固定的排列規則和順序,此類數據稱為歐式結構數據,如圖2a 所示。但實際應用過程中,很多問題的數據節點排列無序,如圖2b 所示,傳統深度學習難以解決此類問題,圖神經網絡應運而生。

圖2 數據結構示意圖
圖神經網絡以具有不規則結構的圖數據作為處理對象,可將圖定義為G=(V,E),其中V表示節點的集合,E表示邊的集合。利用圖神經網絡解決問題就是把實際問題轉換成圖中節點之間的連接和消息傳播問題,通過交叉傳播來獲得更加豐富的鄰域信息,從而實現節點信息的更新[28],更新過程可表示為:
式中:Vm為在m層的節點v;f為狀態轉移函數;vc為v節點的特征;ve為與v節點相連的邊的特征;va為v節點鄰域的節點特征;Vm-1為在m-1 層的節點v。
為提高圖神經網絡的性能,現有研究將多種深度學習技術與圖神經網絡結合,提出了圖卷積神經網絡、圖注意力網絡、門控圖神經網絡等新型模型。
在圖神經網絡中,節點和邊集合的定義是構建和分析圖結構的基礎,因此,首先利用給定的充電站歷史負荷數據和地理位置關系構建加權有向圖,并添加鄰接矩陣進一步描述節點之間的連接關系。定義圖為G=(Vt,E,A),其中,Vt為N個充電站節點的集合,對應于交通網絡中N個充電站在t時刻的充電負荷值,表示為為第i個充電站在時刻t的充電負荷值;E為邊的集合;A為鄰接矩陣,是一個維度為N×N的矩陣。
基于有向圖的構建,可將充電站負荷預測問題轉換為利用包含N個充電站M個時刻歷史負荷值的有向圖,來預測未來Δt時間段內整個區域的充電站負荷。形式上可表達為:
式中:θ為需要學習的參數,包括邊集合、鄰接矩陣等;為預測的t+ 1時刻所有充電站的負荷預測數據的集合;Vt為t時刻觀測到的所有充電站的負荷。
鄰接矩陣是表示頂點之間相鄰關系的矩陣,為了捕捉隱藏的空間相關性,目前許多研究的常用手段是通過定義不同類型的鄰接矩陣來映射更深層次的圖結構[29]。由于每個充電站的負荷預測值不僅與該充電站本身的歷史信息有關,也與其他充電站的負荷歷史信息相關[30]。本研究以充電站之間的路網距離作為基準,使用基于閾值的高斯核[31]構建鄰接矩陣,將路網距離轉化為一個反映兩個充電站連通性的權重ω,ω計算式,如式(3)所示。
式中:ω(i,j)為從充電站i到充電站j的邊權重;dij為從充電站i到充電站j的路網距離;φ為距離的標準差;ε為控制矩陣分布和稀疏性的閾值。
為了解決充電站負荷的預測問題,本文提出一個GSTNN 模型,其整體架構如圖3 所示。GSTNN模型由時空特征提取網絡和外部特征提取網絡兩部分組成。在時空特征提取網絡中,將不同充電站同一時刻的負荷特征Vt=[v1,t,v2,t,…,vN,t]作為時空卷積模塊的輸入,利用時間門卷積捕獲時間特征,利用空間圖卷積捕獲空間特征,對兩類特征進行疊加后,將結果輸入全連接層,實現時空卷積模塊的最終輸出。在外部特征提取網絡中,本文首先提取預測時刻t+ 1 至t+Δ的外部特征,并將其轉化為特征矩陣S,然后利用LSTM 進行特征提取,再利用全連接對結果進行映射和整合。最后,通過融合層將兩個模塊的最終輸出進行融合處理,得到t+ 1到t+Δ時間段內的預測結果V=[Vt+1,Vt+2,…,Vt+Δ]。

圖3 預測模型結構圖
為了融合來自空間域和時間域的特征,GSTNN 模型構建時空特征提取網絡對圖結構時間序列進行處理。如圖3 所示,該時空特征提取網絡由多個時空卷積模塊和一個全連接模塊組成,每個時空卷積模塊中空間圖形卷積層橋接兩個門控序列卷積層,形成一個“三明治”結構。
傳統卷積神經網絡是針對規則網格的標準卷積,難以處理非結構化數據。目前,常使用擴展卷積的空間定義法或譜圖卷積法對卷積神經網絡數據進行泛化處理。此次基于譜圖卷積的原理構建空間圖形卷積層,該卷積層能充分考慮網絡的連通性和全局性,直接對圖結構數據進行處理,提取空間域中的特征,卷積核θ對圖形信號進行過濾的計算式為:
式中:x為圖形信號;θ為卷積核;L為歸一化圖拉普拉斯算子;U為L的特征向量矩陣;Λ為L的特征值對角矩陣。
由于采用圖傅利葉基進行乘法運算,計算量較大,本文利用切比雪夫多項式逼近來克服這一問題,從而將圖卷積改寫成:
基于卷積神經網絡結構簡單、訓練速度快等特點,本文選用門控序列卷積來對充電站負荷的時間動態行為進行捕捉,其由一維因果卷積和門控線性單元串聯組成。一維因果卷積利用卷積核進行特征提取,門控線性單元可以堆疊時間層特征,從而獲取更加全面的特征。卷積核θ與輸入V之間的映射關系可以表示為:
式中:P、Q分別為GLU 中門的輸入;⊙為元素級哈達瑪積;σ為sigmoid門。
最后經過全連接層對所有輸入的圖結構數據進行處理,經過線性變換,最終得到n個通道的結果,記為Vn。
考慮到季節、天氣、時間、歷史負荷等外部特征對于充電站負荷的影響,GSTNN 模型中還包含一個外部特征提取網絡,如圖3 所示,該網絡由一個LSTM 和一個全連接網絡串聯而成。LSTM 具有長時記憶功能,能解決長序列訓練過程中存在的梯度消失和梯度爆炸問題,適用于處理與時間序列高度相關的特征。由于此次使用的外部因素多與時間序列高度相關,所以選擇LSTM 進行特征提取,再連接一個全連接層用于特征從低維到高維的映射,最終輸出外部分量特征為Ve。
為充分考慮充電負荷歷史時空分布以及外部因素對于充電站負荷預測的影響,本文利用一個特征融合層將時空分量的輸出Vn與外部分量的輸出Ve進行融合,融合過程可表示為:
式中:Wr和We為調節時空分量和外部分量影響程度的可調節參數;×2 為2 模矩陣張量積,對數據進行降維和特征提取,并簡化計算和分析;tanh 為雙曲正切函數,使輸出值均在[-1,1]的范圍內。
為驗證模型對每個充電站未來t+ 1至t+Δ時間段的預測結果準確性,使用L2損失衡量模型性能,損失函數具體定義為:
式中:Vt+i為t+i時刻的實際充電站負荷值;為模型預測的t+i時刻充電站負荷值;Θ為模型中所有可訓練的參數。
充電站的充電負荷受多種因素影響,在預測中全面考慮影響因素是使預測結果更加接近實際情況的有效保證。對此本小節選擇來自不同區域的充電站作為研究對象,通過對充電站負荷數據的統計分析,篩選用于此次研究的外部特征。
3.1.1 季節影響
不同季節在氣候、溫度等方面呈現出獨特特征,會對充電站的負荷產生影響。本小節選擇2021年3 月至2022 年2 月一個完整季節性年份,對充電站負荷的季節性變化進行研究,其中2021 年3~5月為春季,2021 年6~8 月為夏季,2021 年9~11月為秋季,2021 年12 月至2022 年2 月為冬季。選擇10個充電站進行統計分析,他們在4個季節的充電負荷統計量如圖4 所示。圖4a 展示了充電站的日平均充電負荷統計情況,每個充電站的日平均充電負荷均會隨著季節的變化產生波動,日均負荷最大值多出現在秋季,少數出現在夏季和冬季,極少出現在春季,充電站所處區域的差異是造成這一現象的原因之一。圖4b 展示了日均充電負荷標準差的統計情況,4 個季節的日均負荷標準差同樣存在差異,多數情況下春季的標準差最低,說明用戶的充電行為在春季具有更高的規律性。

圖4 季節對于充電負荷的影響分析
基于季節對充電站負荷的影響,為實現更加精準的預測,本文采用短期負荷預測,并在預測過程中添加月份特征體現季節對于充電負荷的影響。
3.1.2 天氣影響
天氣因素是充電站負荷預測研究中常用的外部特征,但在研究過程中常存在天氣因素類型多、難以量化的問題[32]。為減少模型訓練的復雜程度,對預測模型采集到的天氣因素與充電站負荷進行相關性分析,以剔除相關性小的特征。皮爾森相關系數rXY是常見的衡量兩個變量相關性的統計指標,計算式如式(9)所示,取值范圍為(-1,1),其絕對值越大則變量間的相關性越強,系數與相關性之間的對應關系見表(1)。
式中:Xi和Yi為兩個變量的第i個觀測值;Xˉ和Yˉ為兩個變量的平均值;n為變量觀測值的總數。

表1 皮爾森系數與相關性對應表
所選擇的10 個充電站的充電負荷與天氣因素的相關性如圖5 所示,其中max 代表充電站當日最大充電負荷,min 代表充電站當日最小充電負荷,mean代表充電站當日平均充電負荷,tem_max代表當日最高氣溫,tem_min 代表當日最低氣溫,weather_day 代表當日日間的天氣,weather_night代表當日晚間的天氣。天氣包括晴、多云、小雨、陰、小到中雨、中雨、中到大雨、大雨、雷陣雨、大到暴雨10 種類型,用0~9 的整數對這10 種天氣進行編碼。由圖5 可知,相較于天氣情況,當日溫度對負荷的影響更為明顯。為降低模型的復雜性,選擇當日的最高溫度和最低溫度作為預測模型使用的天氣特征。

圖5 充電站充電負荷與天氣因素的相關性分析
3.1.3 時間因素
星期制度和節假日能塑造人們的時間安排、工作模式和社交習慣,對社會活動產生廣泛影響。充電行為作為社會活動的一環,也一定程度上受其影響,考慮星期制度和節假日因素對于充電站充電負荷預測問題十分必要。
圖6a展示了星期制度對于充電負荷的影響,觀察可知對于所選擇的10 個充電站,一周內的日平均負荷一直處于波動狀態,主要存在兩種趨勢:一是工作日負荷高、休息日負荷低;二是工作日負荷低、休息日負荷高。這兩種趨勢的形成與充電站所處的區域具有一定的關聯性。前一種主要出現在辦公區域,休息日人們前往工作的數量減少,負荷下降;而后一種主要出現在景點附近,休息日前往游玩的人數增多,導致負荷上升。

圖6 周循環和節假日對充電站負荷影響分析
圖6b 中定義了差異率的概念,表示兩個變量之間的差值占較小變量的比例,如式(10)所示。
式中:x,y為兩個變量;xi、yi為第i個變量。本文計算了所有充電站節假日和工作日的每小時平均負荷,利用差異率公式得到兩種日類型下的負荷差異率,繪制箱型圖。如圖6b 所示,充電站的差異率分布范圍區間廣,最大值超過1.7。這一情況的產生與充電站所處的地理位置密切相關,位于旅游景點、高速公路的充電站,其充電負荷常隨著假期人流的增加而上升。因此,本文構建星期和節假日特征,以提高負荷預測精度。
3.1.4 歷史負荷影響
歷史負荷主要對短期負荷預測產生兩方面的影響,一方面相似日的負荷值也會相似,另一方面待測負荷與其前某些時刻的負荷值存在變化趨勢上的相似[33]。對此,本文基于會影響充電站負荷的衍生特征[34],提取10 個充電站預測時刻前k個時間步的負荷值(rolling_khour)、 平均負荷值(rolling_khour_mean)、負荷標準差(rolling_khour_std)、負荷的最大值(rolling_khour_max)和最小值(rolling_khour_min),以及過去n天內同一時刻的平均負荷(n_days_past_mean)、負荷標準差(n_days_past_std)作為分析指標,其中k的取值范圍為[1,7]內的正整數,n的取值范圍為[2,7]內的正整數,分析指標的具體表達形式見圖7 的縱坐標。分別計算各個分析指標與當前負荷值的皮爾森相關性系數,并計算同一指標對應相關性系數的平均值,繪制歷史負荷的相關性分析圖,如圖7 所示。觀察可知,隨著時間跨度的增大,前k時刻負荷相關統計量與當前負荷之間的相關性逐漸減弱,這符合常見的觀點,即短周期內不同時刻的變量值之間的相關性隨時間間隔的減小而增大。但在星期制度的影響下,前n天內同一時刻的統計量與當前負荷之間的相關性隨著時間間隔的增大逐漸減弱,n為7 時相關性最大。為減少試驗計算的工作量,本文選擇皮爾森相關性系數大于0.6 的歷史負荷影響因素作為輸入特征。

圖7 歷史負荷與充電負荷的相關性分析
為展示基于GSTNN模型的多充電站負荷協同預測方法的性能,本文以中國某市城區內10個電動汽車充電站一年的歷史數據作為數據集。每個充電站以小時為頻率記錄充電站的負荷,負荷單位為kW,一天記錄24 條數據,全年共記錄8 760 條數據。針對其中充電站負荷為0 的異常情況,如圖8 中實線所示,利用異常時刻前一天同一時刻負荷和后一天同一時刻負荷的均值插補,插補后的結果如圖8 中虛線所示。將數據集按照6∶2∶2 的比例,劃分為訓練集、驗證集和測試集,鄰接矩陣的閾值ε設置為0.5。

圖8 處理前后數據對比
從準確性和泛化性兩方面對本文模型進行評估。準確性方面,充電站負荷預測本質是一個回歸問題,本文選擇在機器學習和深度學習中廣泛使用的均方誤差(Mean Square Error,MSE)作為損失函數,利用歸一化后的充電站數據計算損失值,評價模型預測的準確性。泛化性方面,由于本文是對多個充電站負荷進行協同預測,且不同充電站充電負荷變化范圍具有較大差異,難以用以絕對誤差為基準的指標量化評估模型的泛化性。所以本文選擇加權平均百分比誤差(Weighted Average Percentage Error,WAPE)作為評價指標,它側重于相對誤差的評估,且在充電站功率為零的情況下也能實現精準的計算。兩種評價指標如式(11) ~(12)所示。
式中:n為測試樣本數量;yi為第i個樣本的真實值;為第i個樣本的預測值。
3.3.1 圖神經網絡性能分析
預測結果與實際數據的對比是評價模型性能的直觀體現,本文對充電站的實際負荷與預測負荷的擬合情況進行分析,圖9展示了10個充電站的負荷擬合情況,可見預測負荷在負荷變化趨勢上高度擬合實際負荷,直觀體現了圖神經網絡預測的準確性。
損失曲線能有效反映模型在訓練迭代過程中的損失變化情況,是評估模型性能的重要指標。預測模型試驗的損失曲線如圖10 所示,展示了訓練集、驗證集和測試集上損失值的變化情況。在前5 次訓練中,3 種數據對應的損失值顯著下降。隨著訓練次數的增加,損失值逐漸減小并趨近于0。這表明模型具備強大的學習能力,能快速適應數據并實現精確的預測。
3.3.2 充電站負荷預測方法對比
為更全面地評估基于GSTNN 模型的協同預測方法的實際預測能力,將其與使用RF、LightGBM、XGBoost、MLP、LSTM、GSTNN_nf 模型構成的充電負荷預測方法進行性能對比,其中,基于GSTNN 和GSTNN_nf 模型的協同預測方法能同時輸出10 個充電站的預測結果,其余方法則需要單獨預測每一個充電站的負荷。各充電站使用模型得到的預測結果所對應WAPE 值見表2。GSTNN 模型在其中7 個充電站上的預測上取得最優的預測效果,在剩余3 個充電站上取得次優的預測效果。在充電站2和充電站3上,僅有LightGBM模型表現出比GSTNN 模型更好的預測效果,在充電站7 上僅有RF 模型表現出比GSTNN 模型更好的預測效果。可見LightGBM模型和RF模型在充電站負荷預測上仍存在優勢,但整體預測表現上仍是GSTNN 模型效果最優。并且使用GSTNN 模型對所有充電站進行預測時,所有充電站的WAPE 值均低于0.12。相比之下,其他模型存在最大WAPE 值超過0.22 的情況。由此可知,GSTNN 模型具有更強的泛化性能,能準確預測多個充電站的充電負荷。

表2 不同模型下充電站預測結果WAPE值
充電站負荷的準確預測是減少新能源汽車高速發展對電網影響的重要手段之一,本文針對現有充電站負荷預測方法難以同時考慮時空特征和外部特征影響的問題,提出一種基于GSTNN 模型的充電站負荷協同預測方法,該方法在充分考慮天氣、日期、歷史負荷等外部因素影響的同時,探索充電站負荷之間的時空關聯,有效提高預測準確率。得出以下結論。
1)GSTNN 模型能實現多個站點的協同預測,相比只能實現單充電站預測的RF、LightGBM、XGBoost、MLP 和LSTM 模型和不考慮外部因素的GSTNN_nf 模型,具有更高的預測精度與更強的泛化性。在對10 個充電站的負荷預測試驗中,GSTNN 模型在其中7 個充電站數據上得到最低的WAPE 值,在剩余3 個充電站數據也能得到次低的WAPE值,且整體誤差率低于其他對比算法。
2)充電站之間地理位置關系是影響充電站負荷預測準確度的重要因素。GSTNN 模型憑借其對充電站之間地理位置關系的深入挖掘,獲得了比對比模型更高的預測精度,體現出充電站之間的地理位置關系對于負荷預測的重要性。
3)GSTNN 模型存在不足,模型準確率在某些充電站數據上的預測效果不及LightGBM 和RF 模型,需要進行進一步優化。而且GSTNN 模型目前只能實現小范圍充電站負荷的準確預測,需進一步探究提升其大范圍充電站負荷預測的能力。本文采用的10 個充電站距離較近,隨著充電站分布區域的擴大,GSTNN 模型的準確度會逐步下降。只考慮距離因素的鄰接矩陣構建方式是造成該現象的原因之一,未來應進一步研究鄰接矩陣的構建方法,擴大模型預測的范圍,提升其學術價值與實際應用前景。