范 磊,艾昌文
(1.云南大學信息學院,云南 昆明 650504;2.云南大學省電子計算中心,云南 昆明 650223)
工業領域中常會遇到具有時滯特性的過程控制問題,滯后時間越長,控制難度越大。當滯后時間與過程時間的比值超過某一限度,控制難度急劇增加[1]。通常,如滯后時間與過程時間之比大于0.5,則認為該過程具有大時滯特性。
酸堿中和反應過程中,由于受傳輸管道、反應容器容積、反應方式以及檢測點位置等因素的影響,輸入與輸出之間存在明顯的滯后。因此,將pH值的過程控制作為時滯對象進行研究具有典型意義[2-3]。
在pH值的控制過程中,需要動態地向被測液體中添加酸堿溶液,以保持pH值始終趨于穩定。根據生產工藝的要求,有時要對添加劑流量作大幅調節,有時僅需對添加劑流量作微小調節。加之酸堿中和反應具有的時滯及非線性特性,要達到良好的控制效果,對pH值的控制策略和方法有很高的要求。
以工業污水處理過程中的pH 值控制為例,其控制工藝流程如圖1所示。

圖1 控制工藝流程圖Fig.1 Flow chart of control process
圖1中,工業污水與酸堿添加劑在混合器中進行混合,由pH控制器實時采集pH傳感器的測量值,并通過調節中和劑的添加量實現pH值的控制目標。
控制系統的執行器采用位置反饋型高精度、小口徑電動球閥。這種閥門的全行程時間通常在5~60 s。實際應用中,選用行程時間在20 s左右的電動執行器較為合適。其可同時滿足pH控制過程的大幅快速調節和微量精確調節要求。
按照污水處理的工藝流程和控制系統構成,pH控制器通過控制添加劑的單位流量來消除污水的單位流量V、污水的酸堿度H1以及添加劑的酸堿度H2等因素可能產生的擾動。閥門開度U與V、H1、H2可以用以下關系式表示:
U=f(V,H1,H2)
(1)
式中:U為變量;V、H1、H2為因變量。
正常情況下,作為每個具體的應用對象:當工藝流程確定后,V、H1、H2總是相對穩定的,因此U也就相對穩定;當V、H1、H2之中的一項或多項發生變化時,U也隨之發生變化。
根據以上分析可以認定,在特定的應用場合,按照既定的生產工藝流程,閥門開度總是相對固定的。當擾動因素出現后,調節添加劑流量的閥門開度隨之發生變化。當擾動因素消失后,閥門開度最終要回到初始位置附近。該位置信息即為閥門開度的經驗值U0。在智能控制過程中,閥門開度經驗值能夠對實現系統的快速、穩定控制起到關鍵作用。
酸堿中和反應過程可以用一階慣性環節加純滯后傳遞函數表示:
(2)
式中:K為對象的靜態增益;T為對象的時間常數;τ為對象的純滯后常數。
由于中和反應的嚴重非線性特征,在不同的pH控制點,其放大作用和慣性作用是不同的。因此,式(2)中的參數K和T是一個變量。不同的K值和T值構成了一個模型集。實際應用中,只能使用有限的模型集來近似反映這一非線性過程,如常見的三區段變增益控制[3-4]。這種方法減少了非線性的負面作用。但模型的精確性是有限的,區段的劃分也比較困難,并沒有理論分析結果能保證其穩定性。其次,對于純滯后系統,由于比例積分微分(proportion integration differentiation,PID)控制是按偏差進行調節的,調節器的作用要經過滯后時間才能反映出來,極易導致調節過度的問題[5]。
對于大時滯系統,Smith預估補償控制通過對對象模型的預測,用預估器補償純滯后τ對系統控制品質和穩定性的影響,將純滯后環節從閉環回路傳遞函數的特征方程中移出。這樣不僅可以加大調節器的放大系數,而且將純滯后系統的設計問題轉換成了無滯后系統的設計問題。
Smith預估補償器的魯棒性差,對被控對象的數學模型依賴性很強,對對象參數的不確定性、時變性以及擾動的不確定性都很敏感,不具有良好的干擾抑制特性的能力[6]。對一個不精確的數學模型,如果采用固定的控制算法,本身就缺乏靈活性和應變能力。而過于復雜的數學模型求解又對設備的性能要求很高。因此,Smith預估補償器對于具有時滯特性的非線性過程控制并不適用。
通過大量的試驗發現,對一些難以建立數學模型的復雜系統,相關訓練結果表明,由人工實現的控制方法是最優的[1]。人在控制過程中,一方面表現出很強的觀察能力、判斷能力和邏輯推理能力;另一方面還表現出很強的學習能力,特別是在學習過程中能夠不斷優化控制策略。
采用智能控制技術,從宏觀結構上和行為功能上對人的控制過程進行模擬。這種方法不需要具體了解對象的結構、參數,也不需要建立精確的數學模型,而是最大限度地識別和利用控制系統動態過程中所提供的特征信息。根據積累的經驗和知識進行在線推理,合理確定或變換控制規則。在同等條件下,這種方法所獲得有關動態過程的各種信息,要比傳統控制方式豐富的多。它不僅知道當前系統輸出的誤差、誤差變化以及誤差變化趨勢,還知道前期控制效果和識別前期控制決策的有效性。人工智能控制通過定性決策和定量控制相結合的多模態組合控制方法,能對復雜系統(如大時滯、非線性、時變、復雜多變量、環境擾動等)進行有效的全局控制,并具有較強的容錯能力和學習能力[7-8]。
本文把控制理論的方法和人工智能的框架相結合,通過改變控制策略去適應對象的復雜性和不確定性。這種基于“控制論”的方法恰好能夠彌補Smith預估補償等“模型論”方法存在的缺陷和不足。
根據在工業現場的長期觀察,人工控制pH值的過程圍繞閥門開度經驗值展開。人工控制的優化過程即現場學習和經驗積累的過程。其中,閥門開度經驗值是操作人員在現場需要獲取的主要控制參數之一。
閥門開度經驗值能夠在大時滯pH過程控制中起關鍵作用。在設備從停止狀態(或暫停狀態)切換到運行狀態過程中,系統出現擾動到擾動消除等常見情況。人工操作的第一步就是將閥門開度調節到經驗值(如果pH值明顯偏低,也可以先調節到一個比經驗值更大的開度值,一段時間后再回到經驗值,這樣可以加快調節進程),經過一定的時延后(時延長短與滯后時間和過程時間相關聯)進行特征辨識,再根據特征辨識結果采取相應的控制策略。此外,人工還能夠根據當前閥門開度值與經驗值的偏差情況,對干擾源的性質和設備運行故障情況進行分析和判斷,及時采取有針對性的處置方法。由此可見,閥門開度經驗值是人工控制過程中的重要依據。這種調節方式的過程雖然簡單,但針對性很強。它能夠避免大時滯過程中容易發生的、由過度調節導致的系統劇烈振蕩,而且能使被控參數以較快的速度逼近目標值。
從人工控制過程的分析可以看出,閥門開度經驗值是控制算法的核心。自動控制系統首先需要模仿人的邏輯思維和決策過程,根據閥門開度的運行軌跡,自動完成閥門開度經驗值的學習和優化。
pH控制系統在一定的時間周期內運行,如果將閥門每次運行的軌跡跟蹤并記錄下來,形成閥門在0~100%區間運行軌跡的數據集,則該數據集中出現最頻繁的值,就是集合中的眾數,即可認定為是閥門開度的經驗值。
有兩類基于數據驅動的傳統學習方法可供借鑒,即數據累積方法和集成學習方法[7-9]。數據累積方法在接收到新的數據塊Dj時,丟棄之前的學習結果hj-1,利用到當前為止所有的累計數據(D1,D2,…,Dj-1,Dj)重新獲得學習結果。集成學習則是基于每個獨立的數據塊分別進行學習,用投票機制融合不同數據塊所獲得的學習結果,從而得到最終預測。
數據累積方法非常直觀,但沒有利用之前的學習結果hj-1來幫助新數據塊的學習。集成學習方法則認為每個數據塊是獨立的知識表示,因此不存在從舊知識到新知識的經驗累積和知識轉化。
為彌補這兩種學習方法的不足,閥門開度經驗值將采用一種自適應增量(adaptive boosting,AdaBoost)學習方法。在學習過程中,利用已經學到的經驗和知識作為下次學習的基礎數據。具體而言,當接收到新的數據塊Dj時,以上次的閥門開度hj-1經驗值為初值,在此基礎上對新的數據塊Dj進行重新學習,并獲得下一次的閥門開度經驗值hj。
具體算法設計步驟如下。
①閥門的0~100%開度區間內按0,1,…,100等刻度設置離散觀測點,并由這些觀測點組成一維數組。該數組由101項數據元素構成(a0~a100),所有數據元素的初值均為0,表示第一次學習之前閥門運行軌跡的數據為空。
②閥門第一次調節時,取閥門開度的中位數,使閥門開關到50%位置,相當于首次開機閥門開度經驗值的缺省值為50%。
③以后每次閥門開關調節后,閥門的運行軌跡經過的區間的數組元素值+1。例如,閥門開度從50%調節到55%,那么a50=a50+1、a51=a51+1、a52=a52+1、a53=a53+1、a54=a54+1、a55=a55+1,以此類推。
④重復步驟③,直至滿足(“閥門調節次數”≥“設定的學習次數”)∩“設備停止運行”后,結束本次閥門開度軌跡數據的采集工作。
⑤判斷數組中的最大值是否唯一。如不唯一,對該數組進行數據整形。具體整形方法如下:將每一數據元素與相鄰的兩項數據元素相加后,重新對該數據元素賦值(a0=a0+a1,a1=a0+a1+a2,a2=a1+a2+a3,…,a99=a98+a99+a100,a100=a99+a100),然后再進行最大值的唯一性判斷,直至數組中只有唯一的最大值為止。
⑥數組中最大元素的序號即為下一次的閥門開度的經驗值。
如果以各觀測點為橫坐標、數組的元素值為縱坐標繪制直方圖,通常會呈正傾斜數據分布(眾數<50時)或負傾斜分布(眾數>50時)。峰值越突出,閥門動作幅度越小,說明控制平穩,控制效果就越好。
為便于分析,取100個閥門調節過程中的開度數據進行測試,P(100) = [50,53.4,58.5,63.3,65.4,66.8,65.9,63.8,64.6,65.2,65.9,65,65.6,64.8,58.6,52.6,43.6,33.2,38.5,41.4,43.3,42.3,43.6,42.5,41.8,43.4,46.6,0,50,57.6,62.2,64.5,65.5,64.7,65.3,64.8,65.4,64.6,66.1,72.2,75.5,78.8,81.4,83.3,82.4,79.4,75.3,68.2,66.5,62.2,59.7,57.9,58.5,60,61.2,60.3,61.5,62.4,63.2,64,63.3,64.2,63.5,64.5,67.7,70.1,73.3,72.4,70.2,68.5,66.9,67.8,68.3,67.7,68.2,67,1,62.5,56.5,49.3,43.1,34.5,36.4,42.6,48.8,53.2,58.7,63.4,64.2,62.7,58.4,56.6,57.5,58.6,57.7,58.2,57.6,58.1,57.5,58.3,57.6]。
通過上述算法完成自適應增量學習后,得到下一次的閥門開度經驗值h1為63%。試驗結果如圖2所示。

圖2 試驗結果Fig.2 Experimental result
AdaBoost是由Freund和Schapire提出的一種具備自適應調節能力的集成算法[10]。目前,將該算法用于解決分類問題的研究成果較多。在工業領域,汪森輝和李海峰等將改進的AdaBoost.RS算法用于燒結終點的預報分析[11]。在pH值的控制過程中,將改進的自適應增量學習方法應用于閥門的開度調節,使閥門初始開度能夠適應控制對象的動態變化。基于機器學習的控制方式簡化了模型結構,避開了次要因素的影響,把模型逼近于實際對象的問題轉化成為主要參數的學習與選擇問題,使系統的智能化程度得到了提高。