李耀華, 趙承輝, 周逸凡, 秦玉貴
(長安大學 汽車學院,陜西 西安 710064)
有限狀態集模型預測控制(finite control set model predictive control,FCS-MPC)基于電機的系統預測模型,充分利用逆變器的離散特性和開關狀態有限的特點,遍歷計算所有開關狀態作用下的系統動態行為,并基于成本函數最小化的原則選擇最優電壓矢量用于逆變器開關狀態的響應,近年來在電機控制領域受到了廣泛關注[1-5]。
FCS-MPC通過遍歷計算所有的備選電壓矢量,導致算法計算量較大難以在實際應用中實施。文獻[6]舍棄了部分預測價值較小的電壓矢量,只對特定候選狀態進行預測運算。文獻[7]從減少開關次數出發,舍棄開關次數較多的電壓矢量。文獻[8]通過定子磁鏈扇區和轉矩增減信號,舍棄不滿足轉矩控制的電壓矢量。文獻[9]在擴展電壓矢量的基礎上,通過定子磁鏈扇區、轉矩和磁鏈增減信號對備選電壓矢量進行精簡。文獻[10]通過統計不同定子磁鏈扇區、轉矩和磁鏈增減信號及轉矩角下,模型預測控制電壓矢量利用率的情況,舍棄利用率較低的電壓矢量。文獻[11]對比分析采用不同備選電壓矢量集合的控制性能。以上方法均從減少備選電壓矢量個數出發,減輕系統運算量,提高系統實時性,但其將模型預測控制原有的全局最優變為局部最優,犧牲了一定的系統控制性能。因此,在保證模型預測控制遍歷所有可能狀態獲得全局最優的前提下,提高控制實時性是本文的研究重點。
神經網絡通過對數據的學習和訓練能夠充分逼近復雜的非線性映射關系,將所有定量或定性的信息分布儲存于網絡的各個神經元中實現并行分布式的儲存和運算,具有快速大量運算的能力和線上推理速度,可滿足實時性要求[12-13]。目前研究大多將神經網絡應用于轉矩觀測[14]、電機參數辨識[15]和最大轉矩電流比控制實現[16]等。
本文將模型預測轉矩控制(model predictive torque control,MPTC)選擇最優電壓矢量的過程視為非線性映射下的多分類任務,通過采集其運行數據離線訓練一個深度神經網絡(deep neural network,DNN),使神經網絡充分逼近MPTC的選擇規律,從而取代其進行最優電壓矢量的選擇,通過擴充動態數據,解決因動靜態數據失衡引起的系統失控問題,并通過更換訓練數據,驗證DNN具備學習非線性約束下的控制規律的能力。仿真驗證基于數據驅動的永磁同步電機神經網絡控制的可行性。
定子磁鏈坐標系下表面式永磁同步電機轉矩方程如式(1)所示,Te(k)、ψs(k)、δ(k)、p、ψf和Ld分別表示當前k時刻下的電機轉矩、定子磁鏈幅值、轉矩角以及電機極對數、永磁體磁鏈和d軸電感等參數。忽略定子電阻壓降的影響,施加電壓矢量Vs(k)并作用Δt時間后的定子磁鏈ψs(k+1)如圖1和式(2)所示,其中:α為施加的電壓矢量與定子磁鏈ψs(k)的角位置θψs的夾角;q為中間變量;Δθs表示電壓矢量作用下的定子磁鏈角度的變化量。

圖1 定子磁鏈運動變化過程Fig.1 Move of stator flux
(1)
ψs(k+1)=ψs(k)+Vs(k)Δt,
(2)
忽略轉子運動,根據余弦定理和正弦定理可以計算Vs(k)作用后第k+1周期的定子磁鏈幅值和轉矩角[17-20]分別為:
(3)
δ(k+1)=δ(k)+Δδ=δ(k)+
(4)
將式(3)和式(4)代入式(1)可得表面式永磁同步電機第k+1時刻的電機轉矩預測方程為

(5)
模型預測轉矩控制備選電壓矢量采用逆變器產生的全部7個基本電壓矢量,即
Vs∈{V0,V1,V2,V3,V4,V5,V6}。
(6)
式中:Vs為備選電壓矢量;V0~V7為逆變器產生的7個基本電壓矢量。零電壓矢量可由兩個開關狀態(111或000)生成,具體選擇以開關次數最小為原則[21]。
定義表面式永磁同步電機模型預測轉矩控制的成本函數為
g=
(7)

表面式永磁同步電機模型預測轉矩控制系統如圖2所示。

圖2 表面式永磁同步電機模型預測轉矩控制系統Fig.2 SPMSM MPTC system
如上文分析,模型預測轉矩控制根據成本函數從7個備選電壓矢量中選擇最優電壓矢量,可將該過程視為一個非線性映射下的多分類任務。因此,可以基于數據驅動來訓練神經網絡學習并逼近該分類過程的控制規律,從而代替模型預測轉矩控制。
基于數據驅動的神經網絡控制流程如圖3所示,其主要由特征工程建立、訓練數據采集與預處理、網絡構建、訓練、評價與應用等組成。

圖3 基于數據驅動的神經網絡控制流程圖Fig.3 Control chart of neutral network control

基于MATLAB/Simulink建立表面式永磁同步電機模型預測轉矩控制仿真系統模型,用于訓練數據的營造和收集。仿真模型為離散模型,采樣周期為5×10-5s。直流母線電壓為312 V,轉速PI調節器參數為Kp=5,KI=100,PI調節器輸出上下限為[-35 N·m,35 N·m]。參考定子磁鏈幅值為0.3 Wb。仿真用表面式永磁同步電機參數如表1所示。

表1 仿真用表面式永磁同步電機參數
訓練數據建立的仿真條件如下:設置參考轉速分別為-500、-300、-100、100、300、500 r/min,使用斜坡函數設置負載轉矩在1 s內從-30 N·m變化到-10 N·m及1 s時間內從10 N·m變化到30 N·m。設置負載轉矩分別為-34、-30、-25、-20、-15、-10、10、15、20、25、30、34 N·m,使用斜坡函數設置參考轉速在2 s內從-500 r/min變化到500 r/min和在2 s內從500 r/min變化到-500 r/min。通過以上36組仿真試驗,收集特征工程確定的神經網絡4個輸入量和1個輸出量運行數據,共得到1 200 000組訓練數據。對訓練數據進行標準化,使其滿足均值為0和方差為1的正態分布,并按照9∶1比例劃分訓練集和測試集兩部分數據,前者用于網絡訓練,后者用于網絡測試評價。由于數據量較大,本文使用批數據訓練,批數據尺寸設置為2 000。
神經網絡的層數越深,學習能力越強,但結構也越復雜。通過試驗,確定采用1個輸入層,5個隱含層和1個輸出層的DNN網絡,其拓撲結構和訓練過程如圖4所示。

圖4 DNN網絡拓撲與訓練過程Fig.4 Topology and training of DNN
DNN網絡各神經層的神經元節點數目{n[0],n[1],n[2],n[3],n[4]}分別為4, 30, 50, 30, 7。隱含層間的傳遞和變換關系如下,第h層的輸出xh通過上一層的輸出xh-1與當前層的權值矩陣wh和偏置矩陣bh的運算,經過激活函數非線性化得到:
xh=ReLU(xh-1*wh+bh),
(8)
使用線性修正單元函數ReLU(rectified linear unit)作為各隱含層的激活函數,即

(9)
網絡訓練包括前向推理和誤差反向傳播兩個過程。前向推理過程主要執行如式(8)所示的多次層間變換,最終輸出對應7個基本電壓矢量的7個類別得分,并通過如式(10)所示的softmax函數將得分轉換為概率分布,式(10)中a(k)為類別得分,n為輸出層的神經元總個數。誤差反向傳播過程主要通過梯度法尋找使損失函數E減少最多的方向,并逐步更新wh和bh參數。使用交叉熵誤差作為損失函數,采用Adam梯度算法進行梯度更新。
(10)
重復前向推理和誤差反向傳播兩個過程,梯度將逐漸下降,網絡參數逐次迭代更新,損失函數值隨之減小,DNN網絡也逐步逼近MPTC選擇規律。重復次數設置過多或多少,對DNN網絡的效果都不利,前者會引起過擬合,使得網絡僅對訓練數據具有良好的分類性能,對新樣本的分類性能較差,泛化性能較差;后者會引起欠擬合,使得網絡對訓練數據訓練不充分,未能建立起關于訓練數據非線性映射的精確模型,網絡不具備可用性。通過試驗,確定重復次數為30次,其中學習率設置為0.01。
將DNN與MPTC選擇的電壓矢量相同的百分占比情況定義為準確率,用于評價DNN分類性能的優劣。DNN訓練集和測試集的一致率如圖5所示。

圖5 訓練集和測試集的準確率Fig.5 Accuracy of train set and test set
圖5表明隨著訓練過程的進行,準確率逐步上升并趨于穩定,訓練集和測試集的準確率曲線基本吻合,表明沒有出現過擬合和欠擬合,網絡在未知新樣本上的分類性能和可用性得到了保障。經過30次重復訓練, DNN網絡在訓練集和測試集上的準確率均達到約84%,說明網絡分類效果較好,逼近了模型預測轉矩控制的控制規律。
將訓練成熟的DNN取代原有的模型預測控制策略,嵌入至永磁同步電機系統控制系統,從而實現基于數據驅動的永磁同步電機深度神經網絡控制系統,如圖6所示,其中虛線部分為數據集建立和DNN離線訓練過程。DNN網絡輸入為特征工程的4個輸入,輸出為施加的電壓矢量。當網絡訓練成熟時,網絡的權重和偏置等參數已經整定完畢,在網絡使用過程中DNN僅需執行前向推理過程即可根據最大得分得到分類結果,無需softmax轉換和損失函數計算,從而可提升系統實時性。通過MATLAB/Simulink和Python/Pytorch聯合仿真實現控制策略驗證,其中通過編寫S函數調用Python腳本的方式完成DNN分類器的嵌入。

圖6 永磁同步電機深度神經網絡控制系統Fig.6 PMSM DNN system
下文對基于MPTC和基于DNN的永磁同步電機系統進行仿真驗證對比。
電機系統參數與上文一致,參考轉速初始值為60 r/min,1 s時階躍至-60 r/min,負載轉矩初始為15 N·m,0.5 s時階躍至-15 N·m,1.5 s階躍至15 N·m,仿真總時長為2 s,從而建立含電機四象限運行的復合工況。
為了定量評價控制效果,定義轉矩脈動均方根誤差(root mean squared error,RMSE)和磁鏈脈動均方根誤差如下:
(11)
(12)
其中n為采樣個數。
基于MPTC控制下的永磁同步電機轉速、轉矩和定子磁鏈幅值如圖7~圖9所示。

圖7 基于MPTC控制的電機轉速Fig.7 Motor speed using MPTC

圖8 基于MPTC控制的電機轉矩Fig.8 Motor torque using MPTC

圖9 基于MPTC控制的定子磁鏈幅值Fig.9 Amplitude of stator flux using MPTC
在0.2~0.4 s、0.6~0.8 s、1.2~1.4 s和1.6~1.8 s四個穩態時段內的轉矩脈動RMSE和磁鏈脈動RMSE及平均值如表2所示。

表2 MPTC控制下的轉矩和磁鏈脈動RMSE
圖7~圖9和表2表明MPTC系統運行正常,但由于其需要遍歷7個基本電壓矢量進行枚舉計算,計算負擔較大。相同仿真條件下,采用DNN控制的仿真結果如圖10~圖12和表3所示。

圖10 基于DNN控制的電機轉速Fig.10 Motor speed using DNN

圖11 基于DNN控制的電機轉矩Fig.11 Motor torque using DNN

表3 DNN控制下的轉矩和磁鏈脈動RMSE

圖12 基于DNN控制的定子磁鏈幅值Fig.9 Amplitude of stator flux using DNN
仿真結果表明:基于DNN的永磁同步電機系統運行正常,轉矩和磁鏈控制效果良好,電機可實現四象限運行。穩態下,轉矩和磁鏈的控制性能與MPTC基本相當,但在1s轉速階躍處產生較大的磁鏈脈動。
進一步研究發現在較大幅度的轉速階躍下,基于DNN的電機系統在轉速階躍處會出現失控現象。保持負載轉矩不變,參考轉速初始值設置為500 r/min,1 s時階躍至-500 r/min。此時,基于DNN控制的電機系統失控,轉矩和磁鏈波形如圖13、圖14所示。

圖13 數據驅動控制失控時轉矩波形Fig.13 Motor torque at the DNN out of control

圖14 數據驅動控制失控時磁鏈波形Fig.14 Amplitude of stator flux at the DNN out of control
在上述仿真條件下運行MPTC控制的永磁同步電機系統,同時并行運行DNN網絡,DNN所選的電壓矢量并不輸出,僅用于與MPTC選擇的電壓矢量進行比較。統計0.25~0.45 s和0.55~1 s兩段穩態時段和1~1.45 s發生轉速階躍的整個動態時段,MPTC所選電壓矢量與DNN所選電壓矢量的一致率如表4所示。

表4 MPTC與DNN輸出電壓矢量一致率
表4表明,穩態下DNN保持較高的準確率,但動態下準確率較低。
以0.01 s為單位統計0.55~1 s和1~1.45 s時間段內的電壓矢量選擇一致率,如圖15所示。

圖15 輸出電壓矢量一致率變化曲線Fig.15 Concordance rate of output voltage vectors by MPTC and DNN
圖15表明DNN在0.55~1 s穩態階段始終保持著較高且穩定的準確率,但在1~1.45 s轉速階躍動態階段,DNN所選電壓矢量的準確率較低,尤其是發生轉速階躍的動態初始階段,DNN錯誤選擇電壓矢量導致系統失控。
動態條件下,DNN選擇電壓矢量準確率較低的原因是MPTC在穩態和動態下選擇電壓矢量的傾向性存在較大的差異。采用式(7)所示的成本函數的MPTC在轉矩動態變化下電壓矢量選擇規律與穩態選擇規律有所不同,更傾向于選擇轉矩控制的電壓矢量,犧牲磁鏈控制。由于動態響應較快,使得訓練數據中反映動態階躍控制規律的數據較少,穩態數據和動態數據失衡,導致神經網絡動態訓練不足,系統存在動態失控風險[24-25]。
由于動態數據不足,使得基于動靜態失衡數據驅動的DNN存在動態失控的風險。因此,通過擴充動態數據,使得動態數據與穩態數據達到基本平衡,建立綜合數據集合,可抑制動態失控。
動態數據建立仿真條件如下:在[-500 r/min,500 r/min]轉速范圍內,設轉速階躍幅度為100、200、…、500 r/min,并在每種轉速階躍下分別設置負載轉矩為-30、-20、-10、10、20、30 N·m,共計354組動態仿真條件。通過參考轉矩判斷系統動靜態狀態,共收集到1 208 610組動態訓練樣本。綜合上文的穩態數據,從而建立2 208 610組綜合數據集合,其中穩態數據和動態數據的比例約為1∶1。DNN的拓撲結構與訓練設置與上文一致,僅將訓練數據集更換為綜合數據集合。通過網絡訓練,最終DNN在訓練集和測試集的準確率可達82%。
在上述失控仿真條件下,基于綜合數據集訓練的DNN控制仿真結果如圖16~圖19所示。MPTC和基于綜合數據集訓練的DNN控制下,轉矩脈動RMSE和磁鏈脈動RMSE及平均值如表5所示。仿真結果表明,基于綜合數據集訓練得到的DNN控制性能良好,電機系統可四象限運行,且可在保證穩態控制性能的基礎上,有效解決動態失控問題。

圖16 電機轉速Fig.16 Motor speed

圖17 電機轉矩Fig.17 Motor torque

圖18 定子磁鏈幅值Fig.18 Amplitude of stator flux

圖19 定子磁鏈軌跡Fig.19 Stator flux circle

表5 MPTC和DNN控制下的轉矩和磁鏈脈動RMSE
在0.55~1 s穩態時段和1~1.45 s動態時段內DNN與MPTC選擇電壓矢量的一致率如圖20所示。

圖20 一致率變化曲線Fig.20 Concordance rate of output voltage vectors by MPTC and DNN
圖20表明基于綜合數據集訓練的DNN在轉速階躍時電壓矢量選擇準確率始終保持在84%以上,從而可有效抑制動態失控。
在上述仿真條件下運行DNN網絡,同時并行運行MPTC控制,并根據成本函數對7個電壓矢量進行升序排序。統計DNN輸出電壓矢量在MPTC成本函數的排序位置情況,結果如表6所示,其中1代表成本函數最小,即最優電壓矢量,2代表成本函數次小,即次優電壓矢量,以此類推。

表6 DNN輸出電壓矢量在MPTC中排序位置
表6表明DNN輸出的電壓矢量約84%為最優電壓矢量,輸出為最優或次優電壓矢量占比為97.42%。研究發現,MPTC始終選擇次優電壓矢量也可以使電機系統正常運行,即次優電壓矢量也可作為可選電壓矢量。DNN選擇成本函數排序后4位電壓矢量的概率接近為0。因此,這是DNN在準確率為82%的情況下依然可使電機系統正常運行的重要原因。
仿真結果表明:MPTC控制下,在轉矩動態變化及轉速階躍時,磁鏈會產生較大的脈動,如圖21所示。這是因為式(7)所示的成本函數此時傾向于轉矩控制,所選的電壓矢量犧牲了磁鏈控制。由圖18可知,轉速階躍時,基于MPTC數據驅動的DNN磁鏈脈動較大。

圖21 基于MPTC控制的定子磁鏈幅值Fig.21 Amplitude of stator flux using MPTC
為了消除轉速階躍時的磁鏈脈動,設計考慮磁鏈約束成本函數為
g=
(13)
(14)
其中gf為防止選擇使磁鏈誤差較大電壓矢量的非線性約束項。
相同仿真條件下,采用增加非線性約束成本函數MPTC控制的定子磁鏈幅值仿真結果如圖22所示。穩態下,轉矩和磁鏈脈動RMSE如表7所示。仿真結果表明:增加非線性約束可有效抑制轉矩動態變化時的磁鏈脈動。

圖22 非線性約束成本函數MPTC控制下的定子磁鏈幅值Fig.22 Amplitude of stator flux using MPTC

表7 增加非線性約束成本函數MPTC控制下的轉矩和磁鏈脈動RMSE
與上文訓練數據集合建立方法相同,基于增加非線性約束成本函數的MPTC重新建立訓練數據集。在訓練樣本數量、DNN網絡結構與參數、訓練方法相同的條件下,僅更換訓練數據集,對DNN網絡重新訓練。最終DNN在訓練集和測試集的準確率可達82%。
相同仿真條件下,DNN控制下的定子磁鏈幅值仿真結果如圖23所示。穩態下,轉矩和磁鏈脈動RMSE如表8所示。

圖23 基于非線性約束數據的DNN控制下定子磁鏈幅值Fig.23 Amplitude of stator flux using DNN

表8 基于非線性約束數據的DNN控制下的穩態控制效果
當1 s發生轉速階躍時,四種控制策略下的最大定子磁鏈幅值如表9所示,其中MPTC、DNN、MPTC(gf)和DNN(gf)分別代表模型預測轉矩控制、基于MPTC數據驅動的DNN控制、非線性約束成本函數MPTC控制和基于非線性約束數據驅動的DNN控制。

表9 四種控制方式下的定子磁鏈脈動比較
仿真結果表明:基于非線性約束數據驅動的DNN控制下,穩態控制效果與非線性約束成本函數MPTC控制MPTC基本相當,且可有效抑制轉矩動態變化時的磁鏈脈動,說明通過基于數據驅動的DNN可學習并取代非線性約束下的控制規律。
本文提出了基于數據驅動永磁同步電機神經網絡控制以取代模型預測轉矩控制的方法,將計算量大、實時性差的遍歷尋優計算轉換為線下網絡訓練,線上運算僅進行快速推理和分類選擇,以滿足實時性要求,得出結論如下:
1)基于數據驅動的神經網絡控制可取代模型預測轉矩控制。基于DNN的永磁同步電機系統運行良好,可實現四象限運行,穩態轉矩和磁鏈的控制性能與MPTC基本相當,對采用多電平逆變器或矩陣變換器驅動或采用多步預測等備選電壓矢量數目較多的場合有較大的應用意義。
2)通過擴充動態數據集合,可解決因動靜態數據失衡引起的系統失控問題。
3)基于數據驅動的DNN可以學習非線性約束下的控制規律,表明數據驅動控制方式具有較強的可行性,可適用于模型預測控制多目標、非線性控制的復雜規律場合。