李 慧 , 常化鵬, 董 博, 秦 偉
(1.長春工業大學 電氣與電子工程學院, 吉林 長春 130012;2.長春工業大學 汽車工程研究院, 吉林 長春 130012;3.吉林大學 通信工程學院, 吉林 長春 130012)
隨著人們對天然物質的青睞以及全球回歸自然潮流的興起,特別是中藥現代化、國際化進程的迫近,分子蒸餾技術在高沸點、熱敏性天然物質的分離方面得到了迅速發展[1]。但是分子蒸餾過程強耦合、非線性和大滯后的特點很難對其進行優化控制,1978年Brosillow.C B提出可以通過過程中容易直接測量的變量(控制變量)建立軟測量數學模型推導出所需的主導變量(狀態變量)[2],并在化工過程中得到了廣泛應用。刮膜式分子蒸餾作為一種應用最廣的分子蒸餾方式,利用高速轉動的刮板在蒸發面上形成并更新既均勻又薄的液膜,加強了蒸發效果,但也使蒸發過程變得更加復雜,雖然Cvengro?等[3-4]利用Navier-Stokes方程、Boltzmann方程和熱量衡算關系式對氣相中的重力下的液膜流動的傳熱傳質過程進行了建模,Mckenna等[5]也通過將流體的物性參數以及設備的結構參數聯系起來建立了液膜非穩態的數學模型,但是蒸發過程機理的復雜性以及隨著工況以及環境的改變發生變化,預測性能也大大降低,普適性較差,軟測量神經網絡模型非線性擬合能力強,且不需要對象的先驗知識,對處理復雜過程的建模問題具有獨到的優勢[2],但是存在預測精度差、收斂速度慢、穩定性差等問題,基于此,Huang提出了序貫極限學習機[6-7](Onlin Sequential Extreme Learning Machine, OS-ELM),其具有以下特點:用于實現學習算法的訓練數據是順序的,可以是一個基于時間的數據,也可以是固定長度的批量數據,還可以是變化長度的批量數據,任何時刻只對新來的數據進行學習,一旦對新的數據學習結束,就丟棄掉這些數據,不需要先驗知識來確定這種算法需要多少訓練樣本。大大提高了軟測量模型的可靠性和預測精度。
文中通過建立基于數據的OS-ELM軟測量模型,并采用ADHDP對各影響蒸發效率的控制變量進行學習尋優,得到了最優的狀態變量,實現了對刮膜式分子蒸餾系統的優化控制。
刮膜式分子蒸餾器的旋轉軸和安裝在旋轉軸上的輥筒共同組成刮膜器,物料沿壁面從頂部進入,蒸發液膜在刮板的旋轉作用下不斷更新,當旋轉軸轉動時,輥筒在離心力的作用下緊貼在蒸發器表面,物料在輥筒與蒸發面共同的作用下在蒸發器表面形成一層液膜。頭波與之前形成的液膜不斷地進行混合更新,這種不斷混合更新有利于液膜內濃度分布均勻,增加了傳熱和傳質效果[8-9]。刮膜式分子蒸餾器的結構如圖1所示。

圖1 刮膜式分子蒸餾器的內部結構
在蒸發工藝工程中,提純物純度是一個很重要的指標,在刮膜蒸發過程穩定的情況下,與狀態變量純度存在強耦合關系,并可以直接獲得的控制變量主要有以下幾個[8-12]:
1)進料速度。進料速度直接影響著液膜的更新及其薄厚,以及在蒸發面上停留的時間,合適的進料速率能使蒸發面積得到充分利用,有效提高蒸發速率。
2)刮膜電機轉速。刮膜電機的轉速決定了液膜更新速度的快慢以及液體的平均停留時間,進而影響到狀態量純度。
3)真空度。合理增大系統的真空度能夠減少分子間的碰撞,降低輕分子因碰撞而發生的氧化可能性,保證了被提純物的原有屬性。
4)蒸發溫度。如果蒸發溫度過高,液膜就容易發生氧化、聚合等現象,而溫度低的情況下會降低分子活躍度,影響蒸發速率與分離效率,還會影響產品的純度。
OS-ELM原理:
一個標準的具有N個任意不同樣本(xj,tj)的單隱層前饋網絡,其中xj=[xj1,xj2,…,xjn]T∈Rn,tj=[tj1,tj2,…,tjm]T∈Rm,激活函數為g(·),假設具有L個隱層神經元,可記為:
(1)

βi——隱層第i個神經元和輸出層神經元之間的輸出權值;
bi——隱層第i個神經元的閾值;
wi·xj——wi和xj的內積。
單隱層神經網絡學習的目標是使輸出的誤差最小,可以表示為:
(2)
即存在wi、xj和bi使得:
(3)

i=1,2,…,L
這等價于最小化損失函數
(4)

H-1=(HTH-1)HT
(5)

(6)


(7)

(8)

(9)
所以
其中
(11)
由此可知:
(12)
由此可以得到遞推公式
(13)


(14)

(15)
由上面的推導可知,OS-ELM在建立軟測量模型時,輸入的數據數量可以變化,在隨著工況不斷變化的同時,新的輸入數據也會及時修正模型,并且在舍棄了舊的輸入數據的情況下,提高了運行速度,軟測量模型的準確性和可靠性得到顯著提高[13]。
設刮膜蒸發過程的離散時間非線性動態系統
x(k+1)=f[x(k),u(k),k]
k=0,1,…
(16)
式中:x∈Rn——系統的狀態向量;
x∈Rm——控制動作;
f——系統函數。
系統性能指標函數為:
(17)
式中:U——效用函數;
γ——折扣因子,0<γ≤1;
J——依賴于初始時間k和初始狀態x(k)的性能指標函數。
ADHDP的目標是選出最優的控制序列u(i),i=k,k+1,…,使得式(17)定義的函數最小化。
ADHDP控制器結構包含3個典型網絡。模型網絡(Model Network)用來估計下一時刻的系統狀態;評價網絡(Critic Network)用來近似最優性能指標函數;執行網絡(Action Network)為狀態變量到控制變量之間的映射[14]。ADHDP學習控制器結構如圖2所示。

圖2 ADHDP學習控制器結構
圖2中Q函數是對性能指標函數的預估,可以寫成如下表達式
Q(x(k))=U(x(k),u(x(k)))+Q(x(k+1))
(18)
式中:u(x(k))——反饋控制變量;
Q(x(k)),Q(x(k+1))——性能指標函數,評價網絡的輸出。
如果評價網絡的權值設為Wc,可以令式的右式為:
D(x(k),Wc)=U(x(k),u(x(k)))+Q(x(k+1),Wc)
(19)
同時,式(19)的左式可以寫為Q(x(k),Wc),因此可以通過調節評價神經網絡權值最小化均方誤差函數

(20)
獲得最優性能指標函數根據最優性原理,最優控制應滿足一階微分必要條件,所以有


(21)
因此得到最優控制

(22)

ADHDP控制器包含由BP神經網絡實現的執行網絡和評價網絡,以及刮膜蒸發過程的OS-ELM軟測量模型。執行網絡和評價網絡的隱藏層采用雙極性sigmoidal函數,輸出層采用線性函數purelin,推導評價網絡和執行網絡的具體實現方法。
評價網絡輸出為性能指標函數Q(k),應滿足式(18),其訓練最小化誤差為:
(23)
ec(k)=Q(k)-U(k+1)-Q(k+1)
(24)
為了獲得較快的收斂速度,將效用函數U(k)定義為二次型形式,定義如下:
U(k)=x(k)Ax(k)T+u(k)Bu(k)T
(25)
式中:A、B——分別為2維與4維的單位矩陣。
權值更新過程推導如下:

(26)
Wc2(k+1)=Wc2(k)+ΔWc2(k)
(27)
式中:lc——評價網絡的學習率;
ch2(k)——隱含層的輸出值。
(28)
式中:C(k)——評價網路的輸入矩陣;
ch1(k)——隱含層的輸入值。
Wc1(k+1)=Wc1(k)+ΔWc1(k)
(29)
執行網絡用于計算控制量,以使Q(k)最小為目標。
Ea(k)=Q(k)=γQ(k+1)+U(k+1)
(30)
權值更新過程推導如下:
?

(31)
式中,Wa為執行網絡權值,Wc1u=Wc1(1:m,:),即Wc1的前m行,這里m=4,即與控制量對應的部分權值,la為執行網絡的學習率。
Wa2(k+1)=Wa2(k)+ΔWa2(k)
(32)

(33)
Wa1(k+1)=Wa1(k)+ΔWa1(k)
(34)
綜上,ADHDP控制器的實現步驟如圖3所示。
文中訓練OS-ELM軟測量模型的數據來源于刮膜式分子蒸餾裝置針對東北地道藥材五味子分離提純過程的數據。刮膜式三級分子蒸餾裝置由前級脫氣、分子蒸餾1和分子蒸餾2三大部分組成,控制和監控各級工藝參數分別由PID儀表和計算機實現,第一、第二兩級用于除去五味子原料油中水分和雜質且相關工藝參數固定,采集第三級的控制量、狀態量的離線和在線數據。

圖3 ADHDP訓練流程圖
選擇系統壓力、溫度、進料流量和刮膜電機轉速作為控制變量,純度作為狀態變量,設定網絡輸入為6,輸出為2,選取600組作為訓練數據,150組數據用來進行預測,OS-ELM網絡與BP網絡的仿真結果對比如圖4所示。
.

(a) OS-ELM純度預測

(b) BP純度預測
具體性能參數對比見表1。

表1 OS-ELM與BP模型網絡性能對比
從表1可以看出,OS-ELM軟測量模型的誤差和訓練時間都遠遠小于BP軟測量模型,并且隨著數據的更新持續地對模型進行修正,證明了OS-ELM模型的優越性。
參數設置會在一定程度上影響算法的收斂速度。經過實驗選取BP-ADHDP與OSELM-ADHDP的評價網絡和執行網絡的結構均為6-14-2和2-5-4,學習率為0.1,折扣因子為0.5,迭代步數為50,在刮膜蒸發過程中對系統壓力、溫度、進料流量、刮膜電機轉速和純度參數的尋優結果對比分別如圖5~圖9所示。

圖5 控制量溫度變化曲線圖

圖6 控制量進料速度變化曲線圖

圖7 控制量刮膜電機轉速變化曲線

圖8 控制量壓力變化曲線圖
由仿真結果可以看出,BP-ADHDP與OSELM-ADHDP大約都在13時步左右趨于穩定,但是,OSELM-ADHDP最優狀態量純度為95.58%,要遠大于BP-ADHDP的89.93%,優化的狀態量純度得到了顯著提高,并且OSELM-ADHDP模型網絡更加準確可靠,能夠實現更好的控制優化效果。
BP-ADHDP與OSELM-ADHDP最優控制量與狀態量對比見表2。
分子蒸餾系統本身的多參數、強耦合、非線性決定其難以獲得精確數學模型,在刮膜蒸發過程中的重要參數只能依賴于人工經驗,以致難以實現穩定有效的控制,采用基于數據驅動的OS-ELM軟測量模型,可以根據實際工況對模型進行調整,運用ADHDP對刮膜蒸發過程進行優化控制,仿真結果表明,系統訓練時間短、超調量小,能夠快速達到穩定狀態,對提高刮膜蒸發過程的穩定性和高效性具有一定的指導意義。

表2 BP-ADHDP與OSELM-ADHDP最優控制量與狀態量對比
參考文獻:
[1] 連錦花,孫果宋,雷福厚.分子蒸餾技術及其應用[J].化工技術與開發,2010,39(7):32-38.
[2] 曹鵬飛,羅雄麟.化工過程軟測量建模方法研究進展[J].化工學報,2013,64(3):788-800.
[3] Cvengro? J, Badin V, Pollák S. Residence time distribution in a wiped liquid film [J]. Chemical Engineering Journal and the Biochemistry Engineering Journal,1995(5):259-263.
[4] Cvengro J, Pollá K, Micov M. Film wiping in the molecular evaporator [J]. Chemical Engineering Journal,2001(1/2/3):9-14.
[5] Mckenna Timothy F. Design model of a wiped film evaporator applications to the devolatilisation of polymer melts [J]. Chemical Engineering Science,1995(3):453-467.
[6] Rong H J, Huang G B, Sundararajan N. Online sequential fuzzy extreme learning machine for function approximation and classification problems [J]. IEEE Transactions on Systems Man and Cybernetics Part B,2009,39(4):1067-1072.
[7] Liang N Y, Huang G B, Paramasivan S, et al. A fast and accurate online sequential learning algorithm for feedforward netwroks[J]. IEEE Transactionson Neural Networks,2006,17(6):1411-1423.
[8] 徐暢,許松林.刮膜式分子蒸餾停留時間分布的CFD模擬研究[J].安徽師范大學學報,2013,36(2):141-145.
[9] 王燕飛.刮膜式分子蒸餾過程流體流動的模擬與驗證[D].天津:天津大學,2007.
[10] 王玲.刮膜式分子蒸餾器液膜停留時間分布及傳熱研究[D].天津:天津大學,2012.
[11] 李慧,王珂鑫.刮膜式分子蒸餾傳質模型及其仿真[J].化工學報,2015,66(3):1026-1034.
[12] 李慧,李秀歌,王佳增.負壓低溫蒸餾裝置的溫度控制[J].長春工業大學學報:自然科學版,2014,35(5):516-523.
[13] 楊易旻.基于極限學習的系統辨識方法及應用研究[D].長沙:湖南大學,2013.
[14] 林小峰,宋紹劍,宋春寧.基于自適應動態規劃的智能優化控制[M].北京:科學出版社,2013.
[15] 羅艷紅.基于神經網絡的非線性系統自適應優化控制研究[D].沈陽:東北大學,2008.