牟 令,陳 俊,陳 侃,楊德超,劉必武,滕 易
(1.湖北能源集團新能源發展有限公司,湖北 武漢 430000;2.三峽大學信息技術中心,湖北 宜昌 443002)
在各種類型的可再生能源中,太陽能[1]是應用較廣泛的能源之一。因此,基于安裝簡單、安全性高、無污染、維護少和無噪聲等優點,光伏[2-3](photovoltaic,PV)發電在輸電網中發揮著越來越重要的作用。
PV系統運行的關鍵任務之一是在不同天氣條件下獲取最大可用太陽能。該任務可轉化為PV最大功率跟蹤問題[4]。目前,許多學者對PV系統最大功率跟蹤問題進行了研究,并取得了豐碩成果。文獻[5]提出了1種結合自適應布谷鳥搜索算法和擾動觀察方法的復合跟蹤算法。該算法將布谷鳥搜索算法中的切換概率和Lévy飛行步長系數自適應調整,以改善模型搜索能力。文獻[6]提出了1種改進細菌覓食算法求解最大功率跟蹤算法,從而避免輸出功率來回振蕩。上述算法均為典型的啟發式算法。然而,啟發式算法容易在不同的運行中收斂到不同的最優解。近年來,強化學習[7](reinforcement learning,RL)以其卓越的在線學習能力而吸引了學者們廣泛的關注。與啟發式算法相比,RL具有更高的收斂穩定性和更強的學習能力。文獻[8]提出了1種基于深度RL算法的PV-抽蓄互補系統智能調度模型,解決了PV發電功率預測精度不高的問題。文獻[9]提出了1種基于連續型深度確定性策略梯度算法的微電網能量調度方法。該方法基于馬爾可夫開發決策過程建立模型狀態、動作空間以及獎勵因子,并通過長短期記憶模型提取時序變量數據,從而在調度空間中提升深度RL模型的收斂性。然而,最大功率的高隨機性以及天氣條件的多變性使解空間較大。傳統的RL搜索能力較低,導致模型易陷入局部最優。
為改善上述問題,本文提出了1種改進的模因RL模型。該模型可解決部分遮光條件下PV系統最大功率跟蹤問題。該模型將傳統RL模型中單智能體改進為多智能體,并基于模因尋找局部最優和全局最優。本文以某市氣象數據為例,驗證了所提模型的有效性。
PV電池通常為P-N型半導體二極管,可將太陽能轉換為電能。
PV電池等效電路如圖1所示。

圖1 PV電池等效電路
PV電池等效電路包括1個光電流源、1個并聯二極管和1個串聯電阻。通常,多個PV電池組合在一起形成PV模塊。這些模塊以串聯和并聯方式組合,從而提供所需的輸出功率。本文令串聯和并聯的PV電池的數量分別為Ns和NP,則輸出電流和電壓之間的關系為:
(1)
式中:Ipv為PV輸出電流;Np為并聯的PV面板數量;Ig為電池光電流;Is為電池反向飽和電流;q為電子電荷,通常取1.602 177 33×10-19Cb;B為理想因子,通常取1~5之間的整數;k為波爾茲曼常數,通常取1.380 658×10-23J/K;Tc為電池的絕對工作溫度;Upv為PV輸出電壓;Ns為串聯的PV面板數量;Rs為電池串聯電阻。
產生的Ig由太陽輻射確定。
(2)
式中:ki為電池短路電流溫度系數;Tref為電池參考溫度;Ts為太陽總輻射。
PV的Is根據以下關系隨溫度而變化:
(3)
式中:IRS為電網電流的D-Q分量;Eg為電池中使用的半導體能隙。
式(1)~式(3)表明,由PV陣列產生的電流同時依賴于太陽輻射和溫度。
當串聯電路中的1個模塊由于遮擋(如灰塵、樹木、鳥類等)而在太陽下暴露出較少部分,其電壓將下降,工作模型表現為負載單元而不是發電單元。這種情況下將產生1個熱點溫度。為保護PV模塊免受潛在損壞,通常將1個旁路二極管與每個PV模塊并聯。此外,每個串聯電路的末端還連接了1個阻斷二極管,以防止并串聯之間的電壓失配導致的反向電流。
盡管二極管能夠避免上述問題,但其不可避免地會改變PV特性并產生雙峰曲線。因此,PV系統應始終跟蹤全局最大功率,以便從PV陣列中提取最大可用的太陽能資源。否則,其運行時將會損失大量功率,從而造成能源浪費。
本節建立了基于模因RL的有遮擋PV系統最大功率跟蹤模型。本文首先對PV系統最大功率跟蹤模型進行建模;其次介紹了模因RL建立過程;最后對模型詳細過程進行介紹。
根據前述分析,當串聯電路中的1個模塊由于遮蔽而暴露出較少的光照時,其電壓將下降。此時,旁路二極管與每個PV模塊并聯,以保護遮蔽模塊免受潛在損壞。此外,每個串聯電路的末端還連接了1個阻塞二極管,以提供對并聯串之間電壓失配引起的反向電流的保護。然而,二極管將改變光伏特性并產生雙峰線。為改善上述問題,有必要對PV最大功率點進行跟蹤。
部分遮擋情況下,PV系統最大功率跟蹤模型結構如圖2所示。

圖2 PV系統最大功率跟蹤模型結構
PV系統最大功率點可以通過調節有遮擋下的PV系統以輸出電壓Upv實現。因此,Upv可視為優化變量,且存在下限和上限。通過將輸出有功功率的最大化作為目標函數,有遮擋下的PV系統最大功率點優化模型為:
(4)

模因算法[10]是1種通過連續的交互和進化解決特定優化問題的計算智能模型。模因算法旨在通過基于種群的全局搜索和基于多模因的局部搜索的有效合作,提高搜索效率和種群多樣性。為提高搜索效率,本文將模因算法和RL模型相結合,提出了1種基于模因的RL模型,從而提高模型局部和整體搜索能力。
2.2.1 模型建立
Q學習[11]是RL中的主流局部搜索算法之一。Q學習一般只使用單個智能體與環境交互。在當前狀態下作出決定后,該智能體可以根據反饋獎勵更新知識。因此,Q學習容易導致低學習效率。為了處理這個問題,本文引入模因概念,使用1組協作的智能體來更新Q學習的知識矩陣,同時使用實編碼關聯存儲器將原始的大規模知識矩陣分解為多個小規模知識矩陣。參考Q學習的學習規則,每個模因的知識矩陣可以更新為:
(5)


(6)
式中:q0為從0到1均勻分布產生的隨機值;ε為選擇貪婪行為的概率權重;arand為從動作集合中選擇的隨機動作。
為了避免模型陷入局部極值狀態,種群將根據所有智能體的優缺點重新組合成不同的模因。本文使用基于洗牌蛙跳算法(shuffled frog leaping algorithm,SFLA)的種群劃分規則進行全局信息交換。因此,可以根據最大優化的適應度值的降序來實現種群劃分過程。第i個模因更新可以描述為:
Yi=[xp,fp∣xp=xi+n(y-1),fp=fi+n(y-1)],p=1,2,…,Ps,i=1,2,…,na
(7)
式中:Yi為第i個模因狀態;xp和fp分別為第p個智能體的解和適應度值。
2.2.2 模型求解
根據式(4)中輸出電壓的最小值和最大值,可以基于所選動作轉換智能體的解。

(8)
式中:xip為第i個模因中第p個智能體獲得的解。
一般而言,具有較大適應度值的動作將獲得更高的反饋回報。為了加快學習速度,本文在模因RL模型中利用蟻群的協作機制設計反饋獎勵。
(9)

模型選擇最佳狀態-動作對集合中的值時存在獎勵,而其他情況獎勵為0。這種機制確保了模型優先從最佳狀態-動作對集合選擇高獎勵策略。
當天氣條件變化時,PV系統的輸出特性也會隨之改變。因此,不同控制策略的反饋獎勵將受到天氣的直接影響。模因RL模型將根據更新的反饋獎勵快速搜索高質量的最優值,以近似追蹤PV系統的全局最大功率跟蹤點。因此,所提模型可以有效地處理一天中不同時間以及不同季節的天氣變化。
模因RL執行流程如圖3所示。

圖3 模因RL執行流程圖
為了評估所提模型性能,本節對不同場景下的PV系統運行變化進行了測試。同時,本文將所提模型與遺傳算法(genetic algorithm,GA)、粒子群優化(particle swarm optimization,PSO)算法、人工蜂群(artificial bee colony,ABC)算法、灰狼優化(grey wolf optimization,GWO)算法、教學優化(teaching-learning-based optimization,TLBO)算法的性能進行了比較。
模因RL參數設置如下:模因數為30;每個模因中的種群數量為100;學習率為10-2;學習率衰減系數為10-4;最大迭代次數為104。試驗軟件環境為Matlab 2019A。同時,算法運行硬件環境為酷睿i7中央處理器(central processing unit,CPU)、內存32 GB ARM的聯想服務器。操作系統為Windows 1 064位。
案例分析數據為某市2022年4個季節中4個典型日的現場大氣數據。其中:太陽輻射范圍為0~1 000 W/m2;數據收集間隔為10 min。
數據集中部分大氣數據如圖4所示。

圖4 數據集中部分大氣數據
由圖4可知,4個季節太陽輻射數據和溫度數據具有時間周期變化趨勢。在圖4(a)中,通常在12∶00太陽輻射值最大;在圖4(b)中,在12∶00~16∶00 溫度最高、4∶00~8∶00溫度最低。數據統計結果符合實際情況,反映了數據的周期性趨勢。
為了定量評估PV系統的功率波動,試驗引入了PV系統功率輸出的平均變異性和最大變異性這2個指標:
(10)

(11)
式中:Δvmax為PV系統功率輸出的最大變異性。
4個季節的模型運行統計結果如表1所示。

表1 模型運行統計結果
由表1可知,在所有算法中,所提模型擁有最高的輸出能量和最小的功率變化。特別是在太陽輻射階躍變化下,所提模型的平均變異性最低。這表明模型具有較強的魯棒性。此外,所提模型在冬季產生的輸出能量最高,表明模型能夠有效跟蹤PV最大功率,從而驗證了模型的穩定性。
為有效跟蹤光伏發電系統最大功率點,本文對PV發電系統進行了研究與分析,建立了1種基于計算智能的PV發電系統最大功率跟蹤模型。該模型基于部分遮擋條件下的PV系統建模,可解決PV系統最大功率跟蹤問題。為提高搜索效率,本文將模因算法和RL模型結合,提出了1種基于模因的RL模型,從而提高模型局部和整體搜索能力。試驗時,本文對春季、夏季、秋季、冬季具有周期性的數據進行測試。與主流算法相比,所提模型擁有最高的輸出能量和最小的功率變化。試驗結果表明,所提模型能夠有效跟蹤PV最大功率,驗證了模型的穩定性和魯棒性。所提模型為PV能源的高質量能效利用提供了借鑒。
未來可對系統數據安全管理領域進行研究,如引入區塊鏈、云計算等技術以提高混合配電網數據交互可靠性及效率,從而進一步改進智能化電力故障診斷及定位方案。