陳巨龍, 李 震, 朱永清, 劉大猛, 張 裕, 王祖凡, 高 天, 郝梓琳,董琳琳, 趙海森
(1.貴州電網有限責任公司電網規劃研究中心,貴州 貴陽 550002;2.華北電力大學 電氣與電子工程學院,北京 102206)
近年來為改善能源結構、重塑能源格局,世界各國正努力推進新一輪能源技術革命。“十四五”期間,儲能領域將以應用為導向,突破現有技術發展瓶頸,以高安全、長壽命、高效率、低成本、大規模、可持續發展等衡量指標來評價儲能技術的先進性與適用性。基于離散固體介質的重力儲能技術在電力系統中充分發揮“穩定器”、“調節器”和“平衡器”的作用,2021年Science期刊發表論文稱重力儲能技術可作為主導全球儲能市場的電化學儲能技術的一種有效替代方案[1],可改善電力系統運行特性,提升大電網的綜合防御能力,保障電網的安全穩定運行,為實現無碳電力系統提供技術支撐,為碳達峰、碳中和目標以及能源轉型作出貢獻[2-5]。
目前,國內外在重力儲能系統方面的研究已有一定的研究成果,現有重力儲能系統根據儲能質量塊在充放電過程中的運行軌跡可分為兩類,分別是斜坡式重力儲能系統和垂直式重力儲能系統。斜坡式重力儲能系統主要有以下幾類:美國ARES公司的軌道車輛儲能系統[6];奧地利IIASA研究所提出的山地纜繩索道儲能系統;天津大學提出的“斜坡軌道+碼垛機”儲能系統;中科院電工研究所提出的重載車輛爬坡儲能系統,以及中電普瑞電力工程有限公司提出的基于傳送鏈提升重物的儲能系統等。垂直式重力儲能系統主要有Energy Vault公司提出的塔式儲能系統;蘇格蘭Gravitricity公司的地下豎井式儲能系統;葛洲壩中科儲能技術公司提出的利用廢棄礦井和纜繩提升重物的儲能系統;徐州中礦大公司提出的利用支撐架和滑輪組提升重物的儲能方案[8-9]。
斜坡式與垂直式重力儲能系統實現的技術方案多種多樣,但綜合來看,其系統主要由充放電和碼放兩大環節構成,充放電過程主要是單個或多個質量塊通過機械傳動裝置與系統發電/電動機進行交互,其原理與抽水蓄能類似。其質量塊碼放環節從原理上類似于行吊起吊重物,起吊過程中,首先要對質量塊的位置進行精準判定,然后行吊移動至相應位置進行重物的吊取碼放,但重力儲能系統對質量塊碼放環節的需求將導致傳統行吊對重物的位置識別方法不再適用,這也是重力儲能系統使用離散質量塊發電不可避免的問題。
對于如何精確控制行吊進行重物碼放,文獻[10]將視覺技術、最優控制和自適應控制理論應用于行吊的位置測量、路徑規劃和運動控制,以實現自動、安全、高效的運行。文獻[11]基于AlexNet卷積神經網絡(CNN)視覺識別算法和改進Canny邊緣檢測算法設計了機器視覺系統來識別質量塊位置。文獻[12]采用RFID射頻技術設計了天車智能定位系統。文獻[13-14]通過采用計算機視覺技術完成天車系統中的定位。但現有行吊或天車的定位方法均為對靜止的重物進行位置判定并進行吊取碼放,在重力儲能系統運行過程中,由于對碼放環節時效性的需求,需要質量塊抓取裝置提前動作,以縮短碼放環節整體的運行時間。目前對適用于重力儲能系統質量塊抓取裝置的控制方法還沒有相關成果,所以對該問題的研究很有必要。
由于斜坡式與垂直式重力儲能系統對于碼放環節的時效性需求一致,且碼放環節原理相似,本文以斜坡式重力儲能系統為分析對象,介紹斜坡式重力儲能系統的整體工作流程以及對質量塊抓取裝置的需求。其次提出使用質量塊瞬時加速度計算其運行路程的方法,并根據質量塊在緩沖平臺的運行路程影響因素分析了該方法的誤差來源。最后,提出基于深度神經網絡的斜坡式重力儲能系統質量塊抓取裝置控制方法,滿足系統對碼放環節的時效性需求,提高碼放環節的工作效率。
斜坡式重力儲能系統的基本原理是利用儲能質量塊在高低勢能位間的勢能差存儲、釋放電能。其平面結構如圖1所示,立體結構圖如圖2所示。

圖2 斜坡式重力儲能系統立體結構
本文對圖1所示的結構進行研究,其中斜坡段及上下緩沖平臺鋪設鋼軌,質量塊底部帶有輪轂,可沿鋼軌上下運動,質量塊由抓取裝置在上下緩沖平臺和上下堆棧平臺移動,同時在上下緩沖平臺配置輔助加速電機,保證質量塊能夠以一定的初速度進入斜坡段。
當電網中出現多余電力時,重力儲能系統將工作于充電狀態。質量塊由機械抓取裝置放置于上緩沖平臺,并通過輔助加速電機經機械傳動裝置加速,質量塊在下緩沖平臺的最大運行速度不超過在斜坡段的運行速度,當質量塊到達斜坡段入口,與輔助加速傳動裝置脫離連接,并與斜坡段的主傳動裝置相連,由發電電動機提供動力源,沿斜坡向上運行,當到達上緩沖平臺,質量塊與主傳動裝置脫離連接,在上緩沖平臺自由減速,當減速至靜止狀態,抓取裝置識別質量塊位置,并移動至質量塊上方進行抓取,碼放到上堆棧平臺。此時電能存儲為質量塊的重力勢能。
當電網電力不足時,重力儲能系統將工作于放電狀態,其工作流程與充電過程相反。
重力儲能系統運行過程中,質量塊抓取裝置是質量塊靜止與運動狀態之間的樞紐。無論是處于放電還是儲能工況,上下堆棧場地的抓取裝置一定是工作在不同運行模式下的。第一種是將碼放區的質量塊抓取并放到緩沖區,此類工況是對靜止的質量塊進行定位并抓取,對于整體的碼放時間要求不高,常規的抓取裝置即可滿足要求。另一種則是要將緩沖區上的質量塊抓取并碼放,該過程需要在質量塊速度減小至零后,進行位置識別,然后移動、抓取質量塊。此類工況要比第一種工況消耗更長的時間,但在斜坡式重力儲能系統工作過程中,斜坡上可能有單個或多個質量塊如圖3所示,各質量塊時間間隔相同,質量塊到達緩沖平臺時,需要抓取裝置迅速定位并將質量塊抓取碼放,若抓取裝置無法及時定位質量塊位置,可能造成質量塊在緩沖平臺的擁堵。緩解擁堵問題,需要增大在線運行各質量塊之間的時間間隔,則在線運行的質量塊數量將減少,單個質量塊的質量將增大,將對系統機械強度提出更高的要求。

圖3 斜坡式重力儲能系統結構簡圖
所以斜坡式重力儲能系統中的質量塊抓取裝置,需以最快的速度定位質量塊位置,及時抓取質量塊并碼放,避免質量塊在緩沖平臺的擁堵。
基于圖1的斜坡式重力儲能系統結構,當質量塊到達上下緩沖平臺時,將與主傳動裝置脫離連接,自由減速。以質量塊在上緩沖平臺的運行過程為例,進行受力分析,如圖4所示。

圖4 質量塊在緩沖平臺的受力分析
本文中討論的質量塊底部帶有輪子,當自由運動于上緩沖平臺時,在水平運行方向將受到阻力減速,其所受阻力F阻表示為
F阻=Ff+Fw
(1)
式中:Ff為質量塊與緩沖平臺之間的摩擦力;Fw為風力。
摩擦力Ff可表示為
Ff=μ×N
(2)
式中:μ為質量塊與緩沖平臺間的摩擦因數;N為緩沖平臺給予質量塊的支持力。
風力Fw可表示為

(3)
式中:ρ為空氣密度;v為質量塊相對于空氣的運行速度;S為質量塊的橫截面積;Cd為質量塊的風阻系數[15];α為風向角度(假設質量塊前進方向為正北)。
在重力儲能系統設計過程中,配置有安全防護裝置。當風力完全作為驅動力,即風向與質量塊運動方向相同時,若風力大于摩擦力,系統將通過安全防護裝置令質量塊靜止,故根據式(1)~(3),質量塊在緩沖平臺運行過程中,水平方向始終受到阻力的作用直至減速至靜止狀態。
2.2.1 常規方法
斜坡式重力儲能系統中的質量塊抓取裝置與行吊的原理類似,目前行吊在對重物的位置進行判定時,通常使用傳感器進行測量,如激光測距儀、超聲波測距儀、編碼器等。同時,也有結合視覺技術,如攝像頭、激光雷達等,對重物的位置進行識別和測量。這些傳感器和視覺技術的測量數據可以被用來計算和確定重物的位置和姿態,從而實現行吊對重物的準確控制,其運行控制流程如圖5所示。

圖5 質量塊抓取裝置常規操作流程
2.2.2 基于質量塊瞬時加速度的位置判別方法
根據式(1)~(3),質量塊在緩沖平臺運行過程中,水平方向始終受到阻力的作用直至減速至靜止狀態,理想狀態下,該運行過程可看作是勻減速運動。
根據前述分析的斜坡式重力儲能質量塊抓取裝置運行需求,為縮短質量塊減速至靜止狀態后等待抓取裝置的時間,可在質量塊剛進入緩沖平臺時,通過測量瞬時加速度,計算質量塊減速至靜止狀態時經過的路程。質量塊抓取裝置可提前運行至該位置的上方,等待質量塊靜止后,將其抓取,減小質量塊在靜止狀態等待的時間,避免質量塊在緩沖平臺的擁堵。
質量塊的瞬時加速度通過在緩沖平臺入口處配置兩個速度傳感器S1、S2測量計算來獲取,二者間距為x1,如圖6所示。

圖6 質量塊瞬時加速度測量方法
質量塊減速期間的路程x可表示為
其中,E(X2)<∞且E(Y2)<∞。我們用var(E(Y|X))/var(Y)表示給定X條件下Y的解釋方差,即有

(4)
式中:V1和V1分別為速度傳感器S1和S2測得的速度;a為質量塊在S2處的瞬時加速度;t為質量塊經過S2后減速至靜止狀態的時間;x為質量塊經過S2后減速至靜止狀態經過的路程。
基于質量塊瞬時加速度位置判別方法的抓取裝置運行流程如圖7所示。

圖7 基于質量塊瞬時加速度的抓取裝置運行流程
前述基于質量塊瞬時加速度的位置判別方法是在理想情況對質量塊運行路程的計算,即質量塊運行在緩沖平臺時,外部環境因素不變。而實際運行過程中,基于質量塊瞬時加速度計算而來的運行路程可能會與實際路程有較大偏差,影響抓取裝置對質量塊的精準抓取,下面結合式(2)和式(3)對質量塊在緩沖平臺上的運行路程展開分析。
式(2)為質量塊在緩沖平臺受到的摩擦力,其主要變量為摩擦因數μ,如果在外部環境幾乎無變化的情況下,摩擦因數變化不大,但考慮到重力儲能技術可能多與大面積光伏或風電場配合使用,其工作環境大多在沙漠、戈壁和山區等,在天氣惡劣的情況下,摩擦因數將有較大變化,導致質量塊在緩沖平臺運行過程中,會受到一個變化的摩擦力。
式(3)為質量塊在緩沖平臺受到風力,在質量塊結構不發生變化時,風力的大小及方向主要與實際環境中風速大小和方向有關。當風速方向或其分量與質量塊運動方向相反,該風力為阻力性質,減小質量塊的行進路程;當風速方向或其分量與質量塊運動方向相同,該風力將變為驅動力性質,延長質量塊的行進路程。
基于上述對質量塊在緩沖平臺運行速度的影響因素分析,質量塊減速至靜止過程為變加速度運動,所以基于質量塊瞬時加速度的位置判別方法在實際應用中,無法準確判定質量塊在緩沖平臺上最終的停止位置。
深度神經網絡(DNN)又稱為多層感知機。與傳統只有一層或者兩層的神經網絡相比,DNN的層數較多,包含一個輸入層,多個隱藏層和一個輸出層。前一個隱藏層的輸出作為后一個隱藏層的輸入,最后一個隱藏層的輸出作為輸出層的輸入,且每一層包含多個神經元,這些神經元之間存在大量的連接和參數,可以更好地處理復雜的數據結構和特征[16-17],其結構如圖8所示。同時,深度神經網絡中的非線性變換函數也更加靈活,可以處理更加復雜的非線性關系,促進了其在工業應用中的發展[18]。

圖8 深度神經網絡結構
深度神經網絡的前向傳播計算流程可以描述為,對每一層神經元之間的權重矩陣進行計算,得到當前層的輸出值。以第m層中的第j個神經元為例,其輸出值yjm可以表示為

(5)
式中:wijm為第m-1層中的第i個神經元與第m層中第j個神經元之間的連接權重;bjm為第m層中第j個神經元的偏置;f(·)為激活函數。
全連接神經網絡使用反向傳播算法進行訓練,其核心思想是從輸出層開始逆向計算每一層神經元的誤差項,然后使用這些誤差項來更新每層之間的連接權重。具體過程分為正向傳播、計算誤差、反向傳播誤差和更新權重四個步驟,重復執行上述四個步驟,直到網絡的訓練誤差足夠小或達到指定的訓練輪數。
權重的更新可表示為

(6)
式中:E為輸出層神經元的誤差;η為學習率;vjm為第m層中第j個神經元的加權輸入;δjm為各層神經元的誤差項。
隱藏層神經元誤差項可表示為

(7)

根據式(7),可以看出誤差項從輸出層開始逐層反向傳播,并基于式(6)逐層更新網絡神經元的權重。
除此之外,Dropout機制也可以有效地防止神經網絡過擬合[18]。在神經網絡的某一層應用Dropout機制時,會隨機地將一些特征設置為0,通過隨機舍棄特征的方式,減少每次訓練時神經元的數量。這相當于在每一層的輸出中加入了噪聲,從而增強模型的泛化能力。
根據式(1)~式(3),質量塊在緩沖平臺減速運行時的加速度是摩擦力和風力共同作用的結果。根據前述分析,重力儲能系統的運行環境可能較為惡劣,所以質量塊在緩沖平臺受到的摩擦力和風力將跟隨環境因素隨機變化,導致質量塊受到一個隨機變化的合力,最終體現在變化的加速度上。
為方便實際應用過程中的測取,同時可將上述影響因素予以體現,選擇質量塊的初速度、風速、風向以及瞬時加速度作為深度神經網絡的輸入,其減速運行路程作為輸出,構建深度神經網絡模型,如圖9所示;模型的訓練流程如圖10所示。

圖9 深度神經網絡結構

圖10 深度神經網絡模型訓練流程
應用過程中,首先測量質量塊在緩沖平臺入口處的瞬時速度并計算瞬時加速度,同時獲取風速及風向數據信息,并使用訓練完成的深度神經網絡模型進行質量塊運行路程的預測,該路程值作為位置信息傳送給質量塊抓取裝置,抓取裝置提前移動至相應位置等待質量塊減速至靜止,完成對質量塊的抓取及碼放,整個運行流程如圖11所示。

圖11 基于深度神經網絡模型的抓取裝置運行流程
由于本文介紹的斜坡式重力儲能系統結構尚無樣機范例,故使用歷史風向風速數據、斜坡式重力儲能系統運行參數并結合隨機數模擬構建質量塊在緩沖區的運行數據集,斜坡式重力儲能系統的主要參數見表1。
風速風向數據取貴州省貴陽市2020-2021年的部分歷史數據,共獲得10 000條數據,每條數據包含6個子項,分別為風速、風向、質量塊瞬時速度、瞬時加速度、實際減速距離以及忽略環境因素變化的理想運行距離。
在深度神經網絡構建過程中,為獲取網絡的最優參數,取上述構建數據集中的1 000條數據進行訓練。按照前文所述的理論在隱含層之間加入Dropout層,增強模型的泛化能力。同時選擇選擇Adam優化器來優化損失函數,其對各類模型的適應性較強,主要根據梯度的一階矩和二階矩估計來自適應調整學習率。本文所涉及的深度神經網絡構建與訓練均在PyCharm平臺上基于Python語言實現,選取Tensorflow的Keras作為深度學習模型框架[19]。本文通過對比試驗,確定網絡層數、Dropout層保留率以及優化器學習率。
網絡層數對模型的預測精度有較大的影響,選擇全連接層將輸入數據與權重相乘并添加偏差,通過激活函數將結果轉化為輸出引入非線性變換和復雜性。本文所要處理的預測問題復雜度較小,所以若使用過多網絡層,可能出現過擬合現象,網絡層太少可能導致模型難以捕捉到數據特征,影響模型的泛化能力。通過改變網絡層數,分別訓練并得到模型的準確率,本文計算準確率時,將預測數據與實際數據作差,若差值小于0.1,則認為預測數據準確。根據表2所示試驗結果,選擇7層網絡的方案。

表2 不同網絡層數對比
Dropout作為一種常用的正則化技術,根據指定的保留率隨機將一部分神經元的輸出置為零,減弱模型對單一神經元的依賴。根據表3所示試驗結果,可知保留率在0.6時的準確率較高,故選擇Dropout層保留率為0.6。

表3 Dropout層不同保留率對比
Adam優化器的學習率是訓練網絡時的一個重要超參數,它決定了參數更新步長的大小,學習率將直接影響訓練的速度和性能,根據表4所示試驗結果,選擇學習率為0.000 5。

表4 不同Adam優化器學習率對比
根據上述實驗得到的網絡參數,構建深度神經網絡,同時將數據集隨機打亂,按照6…2…2的比例劃分為訓練集、驗證集和測試集,共訓練1 000次。深度神經網絡模型訓練過程中,訓練集和驗證集的損失值小于0.002,如圖12所示。說明模型收斂良好,精度較高。

圖12 訓練集和驗證集損失函數
將測試集數據作為輸入,對比使用深度神經網絡和直接使用質量塊瞬時加速度進行路程計算的方法在質量塊運行路程預測上的差異,如圖13所示。

圖13 路程預測差值
由圖13可知,當使用質量塊瞬時加速度直接計算運行路程時,該路程計算值與實際值的差在±1 m之間。而使用深度神經網絡根據質量塊瞬時加速度進行路程的預測后,其與實際路程的差值在±0.1 m之間,大大提高了路程預測的精度。
考慮到實際應用過程中對于質量塊在緩沖平臺運行路程的預測時效性,對模型給出路程預測值的時間進行測量,測量流程如圖14所示。

圖14 模型預測時間測量流程
本文使用的電腦硬件配置如表5所示。跟據圖14的時間測量流程,測得使用本文模型的預測值輸出時間小于50 ms,該時間差可以滿足重力儲能系統實際運行過程中對時效性的需求。

表5 電腦硬件配置
本文提出了一種基于深度神經網絡的斜坡式重力儲能系統質量塊抓取裝置控制方法,通過深度神經網絡構建質量塊瞬時加速度與運行路程的映射關系,并考慮了環境因素突變對質量塊運行路程的影響。通過對比分析,驗證了所提方法的有效性,主要結論如下:
(1) 通過質量塊的瞬時加速度可以對其在緩沖平臺的運行路程進行預測計算,從而縮短了重力儲能系統碼放環節的占用時間;
(2) 所提方法結合深度神經網絡,挖掘質量塊運行過程中因環境因素變化導致的運行路程變化,通過Dropout機制提高了模型的泛化能力及質量塊運行位置的預測精度;
(3) 在設計工況下,質量塊初速度為3 m/s,緩沖平臺摩擦因數為0.05,使用所提方法預測得到的運行路程與實際路程差值在±0.1 m之間,有效減小了質量塊運行路程的預測誤差,提高了碼放環節的工作效率。