劉宇嫣,林 飛,楊中平
(北京交通大學電氣工程學院,北京 100044)
截至2020年底,中國城市軌道交通運營線路總長度達7969.7 km,總電能耗為172.4億kWh,同比增長12.9%。其中,牽引能耗為84億kWh,占總電耗的49%[1]。在我國建設資源節約型、環境友好型社會的大背景下,降低牽引能耗對促進城市軌道交通行業的可持續發展、實現“雙碳”目標具有重要意義。
再生制動技術已廣泛應用于城軌交通列車中,充分利用列車再生制動能量是降低城軌交通牽引能耗的有效手段。再生制動能量的回收利用主要有列車運行圖優化、能量回饋型和能量存儲型等幾種方式。列車運行圖優化方式通過調整運行圖以增加相鄰列車間的牽引與制動過程的重疊面積,達到再生制動能量直接被列車利用的目的,可以有效降低牽引能耗[2-3]。能量回饋型是指在牽引變電所配置逆變裝置和升壓變壓器,直接將列車再生制動能量回饋到交流電網中[4-5]。能量存儲型是指在列車制動時將再生能量存儲在地面或車載儲能裝置中,并在列車牽引時進行釋放[6-7]。地面儲能系統可回收利用再生制動能量,實現節能、穩壓、削峰和緊急牽引等功能[8]。隨著儲能技術的快速發展,儲能方式已經成為世界上解決城軌再生能量利用問題的主流方式之一[9]。
相比車載儲能系統,采用地面儲能系統不會增加列車重量,同時不占用安裝空間,并且具有安裝靈活和開發成本低的優點[10]。選擇合適的儲能元件是在應用中獲得最佳儲能性能的關鍵。在設計儲能系統時,需要考慮能量密度、功率密度、充放電率、持久性和全壽命周期成本等因素[11]。目前應用于城軌交通的儲能元件主要有飛輪、超級電容和電池[12]。
城市軌道交通列車位置與負荷的實時變化,導致牽引供電系統的網絡拓撲及參數具有時變性,使其成為一個復雜的非線性時變系統。在多列車運行工況下,列車、儲能系統、變電所之間存在著復雜的能量交互。因此,無論采用何種儲能元件,都需要設計合理的能量管理策略(energy management strategy,EMS)來進行充放電的管理,提升儲能系統的性能[13]。
筆者首先介紹地面儲能系統的組成與控制,然后對能量管理策略的國內外研究現狀進行介紹和分析,最后對未來的研究趨勢進行展望。
地面式儲能系統一般由儲能模組和變流器組成,若儲能元件為超級電容或電池,則變流器為雙向DC/DC變流器,若采用飛輪儲能,則變流器為逆變器。本文以前者為例介紹儲能系統的能量管理策略。地面式儲能系統并聯在直流接觸網正負母線兩端,通過 DC/DC變流器來控制儲能系統的充放電,實現儲能元件與牽引網之間的能量流動[14],如圖1所示。

圖1 地面式儲能系統組成Figure 1 Schematic of ground-based energy storage system
地面式儲能系統的控制可分為兩層,上層為能量管理層,下層為變流器控制層,如圖2所示。能量管理層獲取到牽引供電系統中列車、變電所及儲能系統等狀態信息,以優化目標為導向,由能量管理策略計算得到控制指令,該控制指令可以為電壓、電流或者功率值。在目前實際應用的系統中,能量管理層通常給出儲能系統充放電的動作電壓閾值,并把該閾值作為電壓控制指令值送入下層的變流器控制層。能量管理策略對儲能系統的節能、穩壓等控制目標具有重要影響。

圖2 地面式儲能系統控制框架Figure 2 Control framework of ground-based energy storage system
變流器控制層根據接收到的指令值,一般采用成熟的電壓電流雙閉環方案得到變換器所需的PWM信號,完成對儲能模組的充放電,如圖3所示[15]。電壓外環由牽引網電壓與電壓指令值的誤差,通過比例積分控制器(proportional integral,PI)輸出電流參考值調節牽引網網壓。參考電流通過限流環節可避免儲能系統過流充放電,從而得到電流指令。電流內環 PI控制器根據電流指令產生控制 IGBT開通和關斷的脈沖信號。保證系統穩定性以及提高儲能系統的動態性能是變流器控制策略的主要任務。

圖3 電壓電流雙閉環控制結構Figure 3 Voltage and current double closed loop control structure diagram
城市軌道交通牽引供電系統是一個復雜的非線性時變系統,儲能系統的優化控制會受到多環境變量、多限制條件的影響。儲能系統、列車、變電所共同影響著牽引供電系統的能量流動[16]。所以,能量管理策略的設計也需要考慮三者的影響。其中,供電系統空載電壓、列車運行圖和儲能系統容量配置對儲能系統能量管理的影響最大。
1.2.1 空載電壓
牽引變電所通常由降壓變壓器和整流機組組成,將10/35 kV高壓交流電轉換為750 V或1 500 V的直流電壓[17]。整流機組一般采用 24脈波二極管整流,其電流具有單向流動性[18]。當列車牽引時,變電所提供電流;當列車制動時,若無鄰近牽引列車回收再生制動能量,牽引網壓升高,車載制動電阻啟動或采取空氣制動,將制動能量轉換為熱能進行消耗[19]。傳統的能量管理策略一般以牽引網壓為判據,通過比較牽引網壓與充放電電壓閾值的大小來判斷儲能系統是否充放電。但由于受城市電網的影響,牽引網空載電壓并不是固定值,而是實時波動的,因此固定的充放電閾值可能導致儲能系統發生“充而不放”或“無法充電”的現象[20],所以能量管理策略的設計需要考慮空載電壓這一影響因素。
1.2.2 列車運行圖
列車運行圖主要包括停站時間、運行時間和發車間隔3個影響因素。一般停站時間和運行時間相對固定,發車間隔受人流密度的影響而變化[21]。發車間隔對能量流動影響較大,并且存在一定規律。當發車間隔較小時,系統內列車牽引和制動過程重疊時間增大,牽引和制動列車之間能量交互增多,牽引變電站輸出峰值功率較大;當發車間隔較大時,列車剩余再生能量較大,牽引變電站輸出峰值功率較小[22]。發車間隔的變化會導致牽引供電系統的能量流發生變化,因此發車間隔也是儲能系統能量管理策略必須考慮的因素。
1.2.3 儲能系統容量配置
受到安裝空間、成本等因素制約,儲能系統的容量總是有限的;而儲能元件的荷電狀態(state of charge,SOC)范圍又與其壽命相關。因此,能量管理策略與容量配置相互耦合,互相影響。設計合理的能量管理策略必須考慮容量配置的約束,而不同的能量管理策略下所得到的優化容量配置方案也不同[23]。
城軌交通儲能系統的能量管理策略決定了不同時間段、不同狀態下儲能系統的工作模式以及充放電功率。目前,國內外學者為充分發揮儲能系統的節能、穩壓及削峰優勢,對地面儲能系統中的能量管理策略進行了大量研究,根據設計思路和問題目標可將地面式儲能系統的EMS分為基于網壓的EMS、基于列車的EMS和基于優化策略的EMS 3種能量管理策略。
列車的牽引與制動對牽引供電網所產生的最直觀現象就是網壓的波動。基于網壓的 EMS是通過判斷網壓實際值與充放電閾值間的大小關系來決定儲能系統的充放電狀態[24-26]。當網壓高于充電閾值時,儲能系統充電;當網壓低于放電閾值時,儲能系統放電;當網壓介于充電閾值和放電閾值之間時,儲能系統處于待機狀態;當網壓高于上限值或低于下限值時,儲能系統處于停機狀態。儲能系統的狀態轉換關系如圖4所示。充放電閾值對儲能裝置充放電能量影響明顯,充電閾值過高,高于車載制動電阻啟動電壓時,儲能裝置可吸收能量減少,充電閾值過低則會影響列車間的能量交互;放電閾值越低,儲能裝置可放電能量越少[27]。文獻[28,29]考慮了儲能系統的SOC,將儲能系統SOC限定在合理的范圍內,避免其過充過放。

圖4 儲能系統充放電狀態轉換關系Figure 4 Charge–discharge state transition diagram of energy storage system
恒定的充放電閾值難以適應空載電壓波動和發車間隔的變化,無法達到最佳的節能效果。為了解決空載電壓波動而導致的儲能系統充放電性能不佳的問題,文獻[30]根據24脈波不控整流機組的空載特性,通過中壓網絡換算出空載電壓值,使充放電閾值在空載電壓上下波動。但由于列車的牽引和制動也會造成中壓電網電壓的下降和上升,所以通過此方法得到的空載電壓值與實際值存在著一定的誤差。
文獻[31]提出一種空載電壓辨識方法,如圖5所示。此方法利用歷史電壓電流值模擬變電所輸出特性,利用神經網絡來預測實時的空載電壓值。此方法理論上具有更高的精確性,但工程應用的實際效果還有待檢驗。

圖5 空載電壓辨識流程Figure 5 No-load voltage identification flow chart
牽引網壓的變化是由變電所、列車和儲能系統共同作用的結果,因此基于網壓來控制儲能系統充放電也成為后續能量管理策略改進的基礎。基于網壓的EMS主要依賴本地變電所和儲能系統的狀態信息來調節充放電閾值,無需獲取周邊儲能、變電所和列車的狀態信息。該策略能在一定程度上達到節能穩壓的效果,并且實現方式簡單可靠,在實際工程中得到廣泛應用。但此策略由于僅以網壓為判據無法解耦列車運行工況與變電所之間的能量流動關系,難以適應牽引供電系統負載變化。
儲能系統的核心作用是回收列車的再生制動能量,所以列車運行工況的變化是儲能系統工作狀態轉換的根本依據。基于列車運行狀態的EMS結構如圖6所示,其能量管理系統除了考慮變電所和儲能系統狀態外,還需加入列車運行工況作為能量管理的判據。目前,對基于列車運行狀態的 EMS研究主要分為兩類,一類是基于儲能系統鄰近列車的運行工況,還有一類是基于事先確定的列車運行圖的變化規律。

圖6 基于列車運行狀態的EMS框架Figure 6 EMS frame diagram base on train operation status
文獻[32,33]為優化節能效果、最小化線路壓降,根據列車速度計算得到可釋放的最大制動能量,并以此為依據動態調整電壓閾值。文獻[34,35]為最大化再生制動能量回收,避免車載制動電阻啟動,通過列車實時功率、位置信息動態調節充電電壓閾值。這幾種方法更適用于單列車運行工況,當儲能系統鄰近站間存在多輛列車時,難以考慮列車交互與儲能系統吸收之間的耦合關系。文獻[36,37]則研究了不同發車間隔下,供電系統能量與功率的流動關系,將發車間隔作為已知條件,動態調節充放電閾值,可有效解決發車間隔波動的問題。
基于列車運行狀態的 EMS能更全面考慮列車、變電所和儲能系統的運行狀態,有利于提高再生制動能量的利用率。該能量管理策略的實現除了需要已知本地變電站和儲能系統信息以外,還需獲得移動列車的狀態信息或者列車數據中心的實時信息,在一定程度上增加了系統應用的復雜度。此外,該策略在考慮線路上多車運行工況時,往往僅以列車運行圖作為輸入條件,但在實際中還需考慮司機駕駛習慣、列車運行時間誤差等不確定因素的影響。
上述方法都是從直觀經驗出發,并考慮主要的影響因素,提升能量管理策略的效果。還有研究者在建立完整數學模型的基礎上,以某種性能指標為優化目標,通過最優化求解方法,期望得到全局最優解。
文獻[38]建立了雙車運行模型,將儲能系統的最優控制問題看作一個經典的等周問題,通過歐拉—拉格朗日方程求得解析解。在此基礎上,文獻[39]建立了變電站輸出能量和線路損耗最小化的目標函數,通過拉格朗日乘子求得最優解。文獻[40]為最小化變電站輸出能量,以最小化變電站電流均方根為目標來跟蹤儲能最優電壓指令。文獻[41]提出了一種基于動態規劃的混合儲能系統運行優化策略。然而由于牽引供電系統拓撲結構隨列車的移動實時變化,動態規劃無法實現在線最優控制。此外,由于系統模型和電路參數誤差使得理論解在實際運行中與理想結果存在一定的差距。隨著控制系統計算能力的提升,采用機器學習等人工智能方法成為地面式儲能能量管理策略研究中的新思路。文獻[42]利用神經網絡預測地面儲能系統 SOC最小狀態,通過調節閾值來跟隨儲能系統的SOC,保證其在列車制動時能最大化回收再生制動能量。文獻[43]通過神經網絡模糊控制,以儲能SOC和列車與儲能之間的距離作為輸入量實時調節充放電閾值。還有學者利用強化學習等方法,實現儲能系統的全局最優控制[44-45]。圖7為基于強化學習的儲能系統能量管理示意圖。控制代理通過與環境之間的交互,實時學習儲能系統的充放電規則。通過強化學習,控制主體(相當于控制器)觀察某一時刻的環境狀態,并通過試錯行為獲得能表示狀態相對價值最大獎勵累積值。一般來說,當被控對象(環境)的狀態轉移概率未知或人類專家知識不足時,通常很難用建模的方法來描述控制規則。但通過強化學習,不用建立精確的環境模型,可以利用反復試錯所獲取的獎勵值來不斷更新控制規則。

圖7 基于強化學習的EMS框架Figure 7 EMS frame diagram based on reinforcement learning
通常,強化學習中的環境模型被定義為(S,A,R,P,γ)。其中,S表示一組狀態,A表示一組動作,R表示獎勵函數,P表示轉移概率集,γ表示貼現率。代理在t時刻觀察環境狀態st,根據策略πt輸出一個動作at。環境轉換到狀態st+1,代理根據轉換獲得獎勵rt+1。基于這個獎勵,代理更新策略π。
文獻[44]利用時序差分學習來獲取充放電規則。其迭代更新公式如(1)所示。

文獻[45]建立了節能率和穩壓率的優化目標,利用Q學習算法來獲取代理策略,其迭代更新公式如式(2)所示。

基于機器學習的能量管理策略可以獲得近似全局最優的策略,使儲能系統在復雜多變的牽引供電系統中實現最優控制成為可能。但該能量管理策略也具有維數災難、訓練時間長、落地應用困難等問題,還需進一步改進與解決。
本文通過上述分析對比,對這3種能量管理策略的優缺點進行了總結,如表1所示。

表1 3種能量管理策略的優缺點Table 1 Pros and cons of the three EMSs
目前大部分文獻所研究的對象是單個牽引變電站內的地面式儲能系統,但實際應用中一條線路會配置多套儲能裝置,構成復雜的“牽引網—列車—儲能系統”耦合關系。
對于多儲能系統協調控制可以分為集中控制和分布式控制兩種結構[46]。集中式控制結構是通過中央能量管理系統對每個單獨的儲能系統進行統一管理[47],隨著儲能系統數量的增加,對中央能量管理系統的計算速度要求急劇上升,其控制復雜性也會急劇增加[48]。相比于集中式控制結構,分布式控制結構下各儲能系統獨立決策,通過儲能系統間的信息交互完成能量管理[49],具有較高的魯棒性,能有效解決實時性問題。文獻[50]提出了集中—分布式牽引供電系統的智能能量管理結構,然而該文獻只對多儲能能量管理提出設想,并未對具體控制算法進行詳細探討。文獻[51]提出多儲能系統分布式協調控制策略,建立了多儲能系統決策的合作式馬爾科夫博弈模型,采用基于值解耦網絡的多儲能系統協調控制方法,通過“集中學習,分散控制”的方法實現各儲能系統的獨立決策,如圖8所示。多儲能系統如何協調配合使全線路節能效果最優,是當前需要探討的重要課題。

圖8 多儲能系統協調控制示意Figure 8 Coordinated control diagram of multiple energy storage systems
目前,大部分研究工作對地面或車載儲能系統進行單一的考慮,隨著再生能量回收技術的發展,越來越多的城軌列車取消制動電阻;通過配置車載儲能系統,與地面儲能系統協同進行再生能量回收成為消除再生失效的重要手段。隨著軌道交通通信技術的發展,車載與地面儲能系統的互聯協調運行也將是城軌交通儲能應用的重要趨勢。同時引入車載和地面儲能設備,對整個系統進行頂層設計,開展二者協調控制等方面研究,發揮車、地儲能系統各自優勢,進一步提高再生能量利用率,可以完全或接近完全消除再生制動失效的發生,車-地儲能系統協調控制示意圖如圖 9所示。目前針對車-地儲能系統協調控制的研究較少。日本三菱公司[52]建立了車載儲能與地面儲能系統協調控制的框架,利用車載儲能系統在線預測列車功率,實時優化車載儲能系統充放電時間,從而防止列車再生失效的發生。文獻[53]提出了一種車-地儲能系統協調控制策略,根據不同工況下地面儲能系統和車載儲能系統的閾值變化規律來合理分配功率,以此來降低再生失效率。

圖9 車-地儲能系統協調控制示意Figure 9 Coordinated control diagram of on-board and ground energy storage systems
地面儲能系統能量管理技術的發展和成熟,將更有利于其推廣與應用。本文根據設計思路和實際應用中的特點將能量管理策略劃分為基于網壓的EMS、基于列車狀態的EMS和基于優化策略的EMS 3種策略。目前,在實際應用中地面儲能系統大多采用基于網壓的EMS。隨著通信水平、數據處理速度的提升,在今后基于列車運行狀態的EMS和基于優化策略的EMS將會更具吸引力。最后,在單站儲能系統 EMS研究的基礎上,對多儲能系統協調控制和車-地儲能系統協調控制未來的發展趨勢和研究方向進行了展望。