王 娜,胡超芳,師五喜
(1.天津工業大學 a.電氣工程與自動化學院;b.電工電能新技術天津市重點實驗室,天津 300387; 2.天津大學 a.微光機電系統技術教育部重點實驗室;b.電氣與自動化工程學院,天津 300072)
pH中和過程是具有嚴重非線性和大滯后的復雜工業過程[1-2],獲得性能滿意、能夠反映其本質特征的模型是對其進行有效控制的重要前提。通常的解決方案有全局建模策略,包括神經網絡、支持向量機等,但在處理pH中和這類數據分布離散、幅值變化較大的較強非線性對象時,會因為結構的單一性而難以充分逼近其非線性特性,導致模型的擬合精度和泛化能力較差[3]。
為此,基于分解-合成思想的T-S模糊建模方法[3-5],通過在子空間建立起若干局部線性函數關系的組合來描述全局系統,使規則庫得以有效約簡,計算復雜性大大降低。
T-S模型的構建通常采用模糊辨識,即模糊子空間的劃分來獲取規則數、前提參數和后件參數。而規則數對應著模糊子空間的劃分,一般采用模糊聚類的方法實現[6-7]。但在實際應用中,模糊聚類的初始參數,即聚類個數和聚類中心通常是事先未知的,一般通過經驗或者人為試湊的方式給定,有2類途徑:比較法[3,8]或者融合法[3,9-10]。比較法通常采用若干聚類有效性指標的比較確定聚類數,易于受到人為決策的影響;而融合法中不重要聚類的判別和刪減過程不僅增加了計算的復雜性,并且容易導致聚類空間出現空洞,使模型的泛化能力變差[9]。此外,由于聚類過程中易受到數據中噪聲的影響,可能導致生成的聚類個數過少或者出現冗余,也會直接影響到模糊規則數的確定[11]。
為此,本文提出一種基于客觀滿意聚類的pH中和過程建模方法。首先改進原始客觀聚類分析算法[12-14],其具有對數據中噪聲的較強魯棒性,從而克服噪聲對于聚類結果,即聚類個數和聚類中心的影響,可以直接確定一個比較適宜的初始規則數和初始聚類中心,并將其與Gustafson-Kessel(GK)模糊聚類[15-16]相結合,利用GK聚類進一步優化原有的聚類中心及對應的模糊劃分。此外,針對建模者對于模型的滿意度,在初始模糊劃分的基礎上,再利用模型的滿意度指標進行模糊聚類的迭代,以確定滿意的模糊規則數和前提參數,使模型結構更加靈活有效,最后再利用穩態卡爾曼濾波算法[5]估計模型的后件參數,以克服傳統最小二乘算法在求解病態矩陣時易導致非數值解的問題,提高計算的穩定性。
從系統建模的角度而言,pH中和過程是一個多入多出過程,輸入量為酸液流量Fa及所含成分濃度Ca,堿液流量Fb及所含成分濃度Cb,輸出量為酸液濃度ωa和堿液的濃度ωb。CSTR的動態模型為:
(1)
(2)
其中,V為反應器的容積。
不失一般性,考慮弱酸強堿過程,其中和滴定方程為:
(3)
其中,wa=[Cl-],wb=[Na+] ,Ka=1.76×10-5為弱酸的電離常數,且pKa=-lgKa。中和滴定曲線如圖1所示,可見pH中和值在中和點附近靈敏度很高,而在遠離中和點處靈敏度很低。

圖1 弱酸強堿及強酸強堿中和滴定曲線
在非線性系統建模中,T-S模糊模型是一種常用的有效模型結構,規則形式如下[5]:
(4)

采用加權平均法,T-S模型的推理可簡化如下:
(5)

客觀滿意聚類首先引入原始的客觀聚類算法[12-14]對其進行改進,并將其引入Gustafson-Kessel(GK)聚類[15-16]來提供比較合適的初始聚類個數和聚類中心,以此作為原始輸入-輸出數據空間的初始模糊劃分,并依據用戶提供的建模滿意度準則,進行后續新的聚類個數生成和聚類中心的更新,以確定最終的模糊劃分,其原理如圖2所示。

圖2 客觀滿意聚類原理
3.1.1 GK聚類
與傳統模糊聚類算法相比,GK聚類利用自適應距離度量取代固定的歐式距離,進行類內距離的計算,從而有效克服了模糊C均值算法易受初始值影響而陷入局部極值的缺點,因而更加適合模糊辨識。
給定數據集Z,GK通過求取目標函數J的極小值來獲取給定聚類個數c下的模糊隸屬度矩陣U和對應的聚類中心V:
(6)
其中,d(zj,vi)表示樣本zj與聚類中心vi之間的距離,受實際的聚類形狀影響,并由聚類協方差矩陣Fi決定。
(7)
d2(zj,vi)=(zj-vi)TMi(zj-vi)
(8)
(9)
但GK聚類的初始參數,即聚類個數c和聚類中心V難以確定,常見有比較[3,8]和融合法[3,9-10]。但在如何確定聚類的初始個數上,比較法依賴于聚類有效性指標的相互比較,而融合法采用最大聚類個數開始,依次逐步合并的方式確定最終聚類個數。兩者均比較依賴于經驗,或者某些假定的數據條件,比如必須滿足高斯正態分布等。而對于缺乏先驗知識,或者不滿足外在假設條件的數據集則缺少有效的提煉聚類個數的方法。并且,還容易受到數據中噪聲、數據分布等因素的影響,從而給模型前件參數的確定帶來較多的不確定性,進而導致不準確的辨識結果,影響整個模型的精度。為此,提出改進客觀聚類算法,并與GK聚類相結合,形成客觀滿意聚類方法,以改善這一狀況。
3.1.2 客觀聚類原理
客觀聚類的基本原理如圖3所示。主要采用相似性數據分級和自組織聚類實現對相似數據子集的共同聚類和比較,其中相似性數據分級利用兩兩距離最近的數據對排序,以將整個數據集劃分為訓練集A、B或者測試集C、D,即Z={A,B}or{C,D},并分別在這4個子集上進行自組織聚類, 將各自的聚類結果兩兩比較以決定最終的聚類結果。

圖3 客觀聚類的基本原理
為克服原有算法的最近鄰聚類效應,導致難于形成較小聚類,以及原有一致性計算中出現的多值解問題,本文采用改進客觀聚類算法[14],即引入相對不相似性測度(Relative Dissimilarity Measure,RDM)[17]來確定待融合的聚類,以降低最近鄰引起聚類過程的滾雪球問題,提高算法的準確性,并提出改進一致性準則來克服多值解的收斂問題,提高求解的穩定性。
與傳統硬聚類相比,改進客觀聚類的特點主要為:
1)相似性數據分級
通過相似性分級,原始的數據集Z被重新劃分為2組數據子集{A,B}或者{C,D}。相比之下,子集A與B的相似度最高,而C與D亦然。并且,{A,B}的相似度高于{C,D},因此將{A,B}作為內部訓練集進行聚類,來獲得原始數據集Z的一種可能的聚類結果,而{C,D}作為測試集來校驗{A,B}結果的準確性,為最終的聚類結果的確定提供外部依據,因此,在內外2種準則的共同檢驗下,最終聚類結果的有效性得以保證。


圖4 訓練子集A、B的偶極子構成
2)啟發式自組織聚類
不同于傳統的層次聚類,啟發式自組織聚類利用一種新定義的距離測度-相對不相似性測度(RDM)來衡量[17]每次聚類中待融合的2個聚類i和j之間的相似性,并且還考慮了未被合并的聚類k對于本次聚類合并的影響,對于數據的分布更具有較強魯棒性。
(10)
(11)

改進一致性準則定義如下:
(12)

與原始的一致性準則相比,改進的一致性計算采用同一位置下不同子集的聚類中心之間的差異來代替數據點之間的差值,從而降低了數據中噪聲點對一致性計算的影響,確保了聚類結果的準確性。

如2.3節所述,利用所提的客觀滿意聚類算法的聚類結果可以確定T-S模型的初始結構,規則數即為聚類個數,模糊劃分矩陣中的隸屬度元素即為所對應規則的前提參數,但這一結果并非模糊模型的最優結構。其主要原因在于聚類算法在使用數據建模時,主要利用聚類的相似性原理,以尋找最優的聚類為目的,而建模對象之間的輸入-輸出關系的某些非線性特性就可能被忽視,造成欠擬合,所以最終的聚類結果可能并不能滿足建模精度要求。
如圖5所示,在非線性曲線中,曲線l1和l2段的動態特性僅用聚類C1來表示,l4和l5段僅用聚類C3所覆蓋,顯然建模的擬合精度不足。VS表示非常小,S表示小,M表示中,L表示大,VL表示非常大。為此,在客觀滿意聚類基礎上,引入一種誤差反饋機制,利用聚類后模型與實際數據輸出之間的最大誤差來反饋所建模型的擬合效果,并以此為聚類是否繼續迭代的依據,直至模型與數據輸出之間的誤差降低至某一允許的精度范圍內終止。在此前提參數的辨識基礎上,利用穩態卡爾曼濾波算法[5]估計規則的后件參數,完成整個T-S模糊模型的結構和參數辨識。

圖5 模糊聚類劃分的欠擬合
算法步驟歸納如下:
步驟1采用EOCA 算法確定一個初始聚類結果{c0,V0},c0為聚類個數,V0為初始聚類中心集。



考慮式(1)~式(3)描述的弱酸強堿中和過程,給定酸液流量Fa,則系統輸入輸出分別為堿液流量Fb和流出物的pH值。樣本集(Fb,ypH)可通過機理模型式(1)~式(3)得到。在Fb中加入[-51.5,+51.5]范圍內的變化量,由此產生300組樣本。假設T-S模型包含2個輸入量,其表達式為:

(13)



圖6 一致性準則與聚類個數關系曲線
給定初始規則數n=c=2 ,初始聚類中心Vi,采用GK和穩態卡爾曼濾波法分別辨識前提參數和結論參數之后,得到第i條規則Ri為:
(14)


圖7 無噪聲下實際系統輸出與模型估計的誤差曲面

最終產生的5個聚類中心在整個數據集中的分布如圖8所示。

圖8 無噪聲下c=5時的聚類子集與聚類中心分布
由圖8可見,整個數據集被均勻劃分為5個聚類,每個聚類中心即為模糊規則的中心,數據與聚類中心之間的模糊隸屬度矩陣決定了其前提參數。以第1個數據為例,其在模糊矩陣中表示為:U_c5(1,:)=[0.03 0.79 0.06 0.09 0.02],以其最大的隸屬度值0.79應該歸為第2類,其余數據以此類推,形成上述5個聚類子集{c1,c2,c3,c4,c5},對應聚類中心{v1,v2,v3,v4,v5}。系統輸出與模型輸出的比較曲線如圖9所示。

圖9 無噪聲下系統實際輸出與模型輸出的誤差比較曲線
上述結果為未添加噪聲下的模型,為驗證所建模型的魯棒性,對上述數據的輸入和輸出同時添加信噪比為5 dB的白高斯噪聲,采用同樣方法訓練,結果得到(itaCD=0.003 3)c=2∠(itaAB=1.183 2)c=6,故選取初始聚類個數為2。經過GK模糊聚類和迭代,以及穩態卡爾曼濾波后,得到聚類個數為4時MSE為0.64,而聚類個數為5時MSE為0.65,誤差精度變化不大,故確定最終規則數為4,MSE為0.64,如圖10所示。

圖10 有噪聲下系統實際輸出與模型輸出的誤差比較曲線
無噪聲環境下,采用上述訓練數據集,所提方法與其他模糊聚類建模效果比較如表1所示。由表1可見,與USOCPN相比,本文方法規則數較少,并且訓練精度處于同一量綱內,因此具有更加精簡的模型結構,其結構和參數辨識的計算效率相應就得以大大降低。與GK模糊聚類相比,本文方法取規則數為5時,其建模精度處于同一量綱范圍內,但其初始聚類個數和初始聚類中心均可由客觀聚類方法直接一次給定,避免了GK模糊聚類中初始聚類參數難以確定,采用試湊而帶來的不確定性,更加直接有效。并且,在添加噪聲之后,與GK模糊聚類相比,模型的擬合精度處于同一量級范圍內,但卻避免了GK模糊聚類難以確定模糊規則數的缺點,使得初始結構的確定更加準確。同時,能夠以較少的規則數獲得較為滿意的建模精度。

表1 客觀滿意聚類與其他模糊聚類的建模性能比較
本文利用客觀模糊聚類辨識pH中和過程,提供了一種新型的T-S模糊建模方法。該方法能從系統的實際輸入輸出數據出發,自適應地快速確定系統的模糊規則數、前提參數和后件參數。對pH過程的仿真研究驗證了所建模型對系統具有較強的擬合能力,并且對于噪聲數據的擬合有較強的魯棒性,結構簡單,易于實現。
[1] BUCHHOLT F,KUMMEL M.Self-tuning Control of a pH Neutralization Process[J].Automatica,1979,15(6):665-671.
[2] NIE Junhong,LOH A P,HANG C C.Modeling pH Neutralization Processes Using Fuzzy-neural Approaches[J].Fuzzy Sets and Systems,1996,78(1):5-22.
[3] 李 檸,李少遠,席裕庚.利用模糊滿意聚類建立pH中和過程模型[J].控制與決策,2002,17(2):143-147.
[4] 李香娜.基于T-S模糊模型的酸堿中和過程的系統辨識[J].華北科技學院學報,2010,7(3):56-60.
[5] TAKAGI T,SUGENO M.Fuzzy Identification of Systems and Applications to Modeling and Control[J].IEEE Transactions on Systems,Man,and Cybernetics,1985,15(1):116-132.
[6] YI Yang,FAN Xiangxiang,ZHANG Tianping.Anti-disturbance Tracking Control for Systems with Nonlinear Disturbances Using T-S Fuzzy Modeling[J].Neurocomputing,2016,171(3):1027-1037.
[7] 宋 俐,謝 剛,楊云云.基于模糊聚類的社團劃分算法[J].計算機工程,2016,42(8):126-133.
[8] QIAO Junfei,LI Wei,ZENG Xiaojun.Identification of Fuzzy Neural Networks by Forward Recursive Input-output Clustering and Accurate Similarity Analysis[J].Applied Soft Computing,2016,49:524-543.
[9] KRISHNAPURAM R,FREG C P.Fitting an Unknown Number of Lines and Planes to Image Data Through Compatible Cluster Merging[J].Pattern Recognition,1992,25(4):385-400.
[10] KAYMAK U,BABUSKA R.Compatible Cluster Merging for Fuzzy Modeling[C]//Proceedings of IEEE International Conference on Fuzzy System.Washington D.C.,USA:IEEE Press,1995:897-904.
[11] 劉士榮,余建軍,林衛星,等.啟發式模糊聚類學習在函數逼近和非線性系統建模中的應用[J].模式識別與人工智能,2003,16(2):230-235.
[12] 王 娜.基于客觀聚類的模糊建模方法研究[D].上海:上海交通大學,2009.
[13] 賀昌政.自組織數據挖掘與經濟預測[M].北京:科學出版社,2005.
[14] 王 娜,楊煜普.一種基于改進客觀聚類分析的模糊辨識方法[J].控制與決策,2009,24(1):13-17,22.
[15] QIU Haobo,XU Yanjiao,GAO Liang,et al.Multi-stage Design Space Reduction and Metamodeling Optimization Method Based on Self-organizing Maps and Fuzzy Clustering[J].Expert Systems with Applications,2016,46(3):180-195.
[16] GUSTAFSON D,KESSEL W C.Fuzzy Clustering with a Fuzzy Covariance Matrix[C]//Proceedings of IEEE Conference on Decision & Control.Washington D.C.,USA:IEEE Press,1979:761-766.
[17] MOLLINEDA R A,ENRIQUE V.A Relative Approach to Hierarchical Clustering[M].Amsterdam,the Netherlands:IOS Press,2000:19-28.
[18] 李 檸.多模型建模與控制的若干問題研究[D].上海:上海交通大學,2002.