王斌宇,柴驊迅,王永健,李宏光
(北京化工大學 信息科學與技術學院,北京 100029)
在工業生產中,隨著時間的推移,控制系統設備往往會出現老化、損耗等一系列的問題,導致控制器的性能下降。由于控制回路之間往往存在著比較強的相關性,面向工業過程區域的控制性能評價更加具有實際意義。
由于計算機技術和信息技術的快速發展,DCS在流程工業生產中得到普及,生產中采集和保存過程變量的數據變得非常方便,而大量的歷史數據中包含了豐富的潛在知識,為分析控制系統的性能和參數提供了豐富的資源。近年來,相關的研究重點已經從SISO控制系統發展到了MIMO系統。在Qin[1]和Qin AND Yu[2]的文獻綜述中介紹了幾種多變量控制系統的評價方法和評價指標。從評價的思想上講,幾乎所有的評價方法都遵循以下流程: 首先,定義控制性能最優時的狀態作為評價基準,通常基準量化為一個數值型指標;然后,計算實時的狀態指標;最后,將實時評價指標與基準進行對比,得出評價結果。
對控制系統的隨機性性能進行評價,最常用的基準是Harris根據最小方差控制理論提出的最小方差基準,并且Harris在研究中將單回路最小方差基準擴展到了多變量控制回路中。這是一種統計性質的評價方法,但是最小方差基準通常是不可達到的,所以許多專家對更貼近實際的基準進行了研究。Jelali[3]在其綜述文章中對常用的基準進行了總結和比較,像線性二次高斯(LQG)、最優PID(OPID)和廣義最小方差(GMV)基準等。Yu和Qin[4]提出一種基于協方差的性能評價方法,選取歷史數據計算基于協方差的基準,求解實時協方差矩陣的廣義特征值,評價多變量控制系統性能,并且根據特征值和特征向量確定系統性能下降最快的方向。
在過程統計監控領域(SPM)[5-6],曾提出幾種從數據驅動角度量化當前系統狀態的方法[7],SPM通常基于多元統計和機器學習的方法來進行故障檢測和診斷。主成分分析方法 (PCA)和偏最小二乘方法(PLS)常作為分析多變量控制系統的重要工具,在過去十幾年中PLS方法也被眾多學者改進,包括與自適應、遞歸方法融合,以及方法的動態擴展[7]。然而,SPM領域和控制性能監控(CPM)領域沒有直接的關系。所以Zumoffen[8]將分塊遞歸PLS與最小總方差指標SSD進行整合,提出了數據驅動的監控指標。Zumoffen[9]給出了SSD指標最優值以及SSD指標對控制策略的影響。
本文給出基于數據驅動的多變量控制性能評價各項指標的計算,再由工程師根據經驗人工綜合分析各項指標,最后給出性能評價結果標簽。利用各項指標作為區域性能特征,工程師評價結果作為標簽,進行有監督的梯度增強決策樹(GBDT)+邏輯回歸(LR)[10]分類器訓練。分類器模型訓練完成后,就可以在線使用模型。首先,采集區域過程數據,然后計算過程區域控制性能指標,最后將區域過程特征指標作為分類器模型的輸入,分類器模型的輸出便是過程區域控制性能的評價結果。分類器給出的實時評價結果分為“優”、“良”、“差”三個等級,它比傳統的控制性能指標更加直觀。可以輔助操作工判斷過程區域的控制性能,指導生產操作。
首先考慮單回路的開環傳遞函數:
y(s)=G(s)u(s)+D(s)d(s)
(1)
式中:y(s)——被控變量的測量值;u(s)——操縱變量的測量值;d(s)——潛在的擾動變量。
多變量控制系統的開環傳遞函數為

(2)
式中:ys(s),yr(s)——被控變量CV的測量值;us(s),ur(s)——操縱變量MV的測量值;d*(s)——潛在的擾動變量。它們的大小分別是(ny×1), (nu×1), (nd×1),多變量控制系統的開環傳遞函數如圖1所示。

圖1 多變量開環傳遞函數示意


(3)
由式(3)可以將SSD定義為
(4)
在實時性能監控過程中,需要將實時SSDk同用戶自定義的基準SSDn做對比,構成性能監控指標ISSD,公式如下:
(5)
David Zumoffen[11]在數據驅動的區域控制性能監控方案中給出在線監控指標NISSDk,其計算公式如下:
(6)

NISSDk≤1,說明ISSD性能接近基準時期;NISSDk>1,說明ISSD性能出現下降。
在計算控制系統性能時,過程輸出的方差顯得極為重要,多變量的控制性能評價需要充分考慮變量間的相關性,Qin和Yu[4]提出基于用戶自定義基準的協方差指標。核心思想是從歷史數據中選取一段可以參考的數據作為基準B。而實時協方差矩陣由實時數據A計算,協方差指標Iv數學定義為
(7)
式中: cov(A)——多變量系統實時數據CV值計算協方差矩陣;cov(B)——基準時期數據計算協方差矩陣。一定程度上利用了系統整體的信息,考慮了變量之間的耦合,具有較高可信度。通過進一步的推導可以化簡為

(8)
式(8)可以解釋為所有廣義特征值的乘積。這樣整個監測過程就得到了量化,當Iv越接近1,說明控制系統的性能越接近基準時期,說明控制系統性能良好;當Iv大于1時說明變量間耦合比基準時期強,控制器性能變差,需要對控制器參數進行調整或者更新生產設備;當Iv小于1說明變量間耦合程度低,控制器性能比基準時期要好。
BW-RCID是一種依賴數據區塊方式給出的協方差指標,并且引入了遺忘因子β,第k塊數據的協方差矩陣與前面的每個數據塊協方差矩陣都具有聯系,可以表述為
(9)
這種自適應的協方差性能指標應被表述為
(10)
David Zumoffen[11]在數據驅動的區域控制性能監控方案中給出在線監控指標NIvk,其計算方式為
(11)

相對增益矩陣常用來反應多變量控制系統中回路之間的耦合關系,相對增益矩陣發生變化,意味著回路之間的耦合關系發生變化。如果相對增益矩陣發生較大變化,流程控制變量和操縱變量的配對關系可能存在問題,需要重新評估,改變變量的配對關系。
David Zumoffen等[11]提到了相對增益指標來評估變量間的配對關系,其數學描述為
(12)
在線監控過程中,如果相對增益指標大于1,則表示變量間的耦合關系發生較大變化,需要重新調整操縱量和被控變量的配對關系,或者重新設計控制策略。
GBDT是一種基于Boosting思想的迭代決策樹算法。GBDT的算法思想是: 從訓練集用初始的權重訓練一個弱分類器1;增強分類器1學習出現錯誤的樣本權重訓練分類器2;如此迭代直到滿足設定的分類誤差或者達到預設分類器個數上限。最終將這些訓練好的分類器整合成一個強分類器。GBDT的訓練過程如圖2所示。

圖2 GBDT訓練過程示意
在GBDT訓練過程中,前一輪學習到的分類器為ft-1(x),損失函數為L(y,ft-1(x)),該輪迭代過程就是找到一個弱學習器ht(x)來優化損失函數的過程。
最終模型可以描述為

(13)
進行了M輪的訓練以后,會產生M個弱分類器,整個模型的損失函數為
(14)
因為主要是擬合訓練樣本的殘差,所以選擇平方差損失函數作為訓練過程的損失函數。
邏輯回歸(LR)是一種廣義的線性回歸分析模型,邏輯回歸在二分類以及多分類問題上應用廣泛。它有一個重要前提就是需要進行有監督的學習。從概率學的角度講二分類LR是將給出的自變量映射到{0, 1}兩種情形,而線性函數結果大多數不在該范圍,于是人們提出了Logit變換來解決該問題。在LR中必須要用到的函數為Sigmod核函數,數學表達式為
(15)
該函數是S型函數,可以將自變量x映射到{0, 1}范圍內。將其中z進行線性函數變化可以得到LR的基本模型:
(16)
GBDT+LR是一個特征交叉的過程,GBDT的路徑可以直接作為LR的輸入特征來使用,避免了人工組合交叉特征的過程,其算法結構如圖3所示。

圖3 GBDT+LR算法結構示意
可以看到圖3中示例的2個樹均是GBDT訓練出的回歸樹模型。在線過程中樣本數據經過樹種的路徑最終到達子節點。將所有子節點作為LR的輸入特征,進行分類。
GBDT+LR是一種特殊的分類算法,因為其尋找特征和組合特征能力的強大,非常適用于多個指標特征且特征之間存在關聯,各特征非線性共同影響類別結果的情況,并且分類準確率高。分類效果顯示,應用GBDT+LR算法訓練得到的分類器評價結果準確度要遠高于其他分類算法。
分類器模型建立一般要經歷數據采集、數據預處理、劃分訓練集和驗證集、模型訓練、模型測試和模型保存等幾個過程。首先收集帶有區域控制性能評價指標并且經過工程師分析完成標簽評價的歷史數據;之后進行數據預處理,處理數據中的缺失和異常錯誤的數據;隨后按照7∶3的原則劃分訓練集和測試集;最后測試模型。分類器模型建立流程如圖4所示。

圖4 分類器模型建立流程示意
1)采集數據。需要從數據庫中截取一段多變量同一歷史時期的時序數據,用于分類模型的訓練和測試。
2)數據預處理。需要對采集好的數據進行處理,提高數據的質量和可利用率。數據處理主要包括: 重復數據處理、數據缺失值處理、數據噪聲處理。
3)劃分訓練集和測試集。將采集和預處理后的數據,按照7∶3的比例劃分訓練集和測試集。
4)模型訓練。用訓練數據集對未經訓練的GBDT+LR分類器進行訓練,初始化模型參數,訓練數據通過GBDT模型進行回歸,將GBDT中生成的決策樹的葉子節點進行特征組合,尋找訓練集的特征及特征組合,再將其作為輸入給LR分類器模型進行分類訓練,從而完成對GBDT+LR分類器的訓練過程。
5)模型測試。測試集主要用于測試模型的泛化能力,使訓練集和測試集正確率達到一個平衡,可以防止過擬合,提高模型泛化能力。
6)模型保存。分類器模型建立完成后,需要保存,使用時調用即可。
本文提出的基于分類器的評價方法是數據驅動的,不需要知道工廠流程的具體數學模型,僅通過足夠數量的歷史標簽數據,就可以通過分類器訓練,得到準確的分類器模型。在線通過分類器模型就可以評價當前控制回路的性能。基于分類器評價方法的步驟如下:
1)收集歷史數據,在工廠的DCS中存儲了大量歷史數據,經驗豐富的工程師根據數據曲線的變化給出系統總體的性能評價結果,分為 “優”、“良”、“差”三個等級,給數據貼上標簽,方便監督訓練。
2)利用工業現場數據,再根據前面提出的多變量指標,可以計算指示某方面性能的指標,如偏差指標指示被控變量的跟隨特性,協方差指標一定程度描述回路之間的關聯性和時延特性。將該類指標作為分類器輸入。
3)將帶標簽的指標數據集,按照一定的比例劃分訓練集和驗證集,利用訓練集訓練的分類器模型,讓分類器學習工程師分析評價多變量系統性能,并將結果在測試集上做驗證。
4)在分類器模型訓練完成后,就可用該分類器模型對當前回路性能給出評價。首先需要對回路當前的狀態進行各項性能指標的計算,得到計算后的指標值,再將其輸入到訓練完成的分類器模型中,分類器輸出結果則作為該回路的最終評價結果。
某精餾塔工藝過程如圖5所示。

圖5 精餾塔工藝過程示意
可以看出,精餾塔控制模型的控制結構主要為3個單回路PID控制,被控變量分別是塔頂分離出的輕組分y1,塔釜分離出的重組分y2,塔釜溫度y7;操縱變量是塔頂流出閥開度u1,旁流出閥開度u2,塔底回流閥開度u3;擾動變量是塔上部回流負荷d1,塔中部回流負荷d2。
在實驗過程中首先令精餾塔裝置進入穩態,各變量處于大致穩定的狀態。這時多次修改控制器參數、擾動參數、控制對象模型仿真生成5×103組數據。由于上述指標的求解,每組數據為1×103個時間點采樣構成的數據塊,由專家成員分析每組數據的控制質量,給出評價標簽。在數據準備工作完成后,需要將數據集按照4∶1的比例,劃分為訓練數據集和測試數據集,即訓練數據4×103例、測試數據1×103例;然后進行分類器模型訓練,將訓練數據集中4×103組訓練數據的性能指標作為分類器的特征輸入,評價結果作為分類器目標值,對GBDT+LR分類器進行訓練,部分訓練數據集見表1所列。

表1 訓練集數據樣本
訓練后用1×103組測試數據對GBDT+LR分類器進行測試,將這1×103組數據經分類器分類評價的結果與其原先的評價結果對比,若對比準確度足夠高,則完成GBDT+LR分類器建立,可將其投用,用來對該回路進行性能評價;若對比準確度未達到要求,則重新對其進行訓練,直至準確度達到要求。對于分類結果可能存在4種情況,給出了混淆矩陣,見表2所列。

表2 混淆矩陣
真陽性是指分類結果為正例,同時數據確實為正例的情況;假陽性是指分類結果為陽性,但數據確實為負例的情況;真陰性是指分類結果為負例,同時數據確實為負例的情況;假陰性是指分類結果為陰性,但數據確實為負例的情況。真陽性率為分類輸出為正例樣本的個數TP與真實正例個數P的比值;假陽性率為分類輸出為假正例的樣本個數FP與真實負例樣本個數N的比值。
ROC曲線是指分類問題中真陽性率和假陽性率構成的圖形。精餾塔數據多種分類器的ROC曲線對比如圖6所示。

圖6 多種分類方法ROC對比曲線
對于ROC曲線,正確率為分類方法所包圍的面積,由圖6可以看出,GBDT+LR 的分類器訓練準確度為92%,單獨的GBDT分類器訓練準確度為89%,BP神經網絡分類器訓練準確度為83%,SVM分類器只有69%的準確率。GBDT+LR相比其他三種方法效果最好,可以作為性能分類評價器使用。

對精餾塔進行時序數據采集,采樣時間為1 s。總的數據采樣點為2×104個,將總的時間序列數據劃分為10個連續時間區塊,每個時間區塊中包含2×103個數據點,計算其性能指標如圖7所示,圖7中橫坐標表示按時間序列采樣得到的10個區塊,每個區塊包含2×103個采樣點,縱坐標為無量綱的指標數值。

圖7 實時評價指標示意
將圖7所示時序的評價指標輸入訓練好的分類器GBDT+LR模型,可以得到時序的綜合評價結果,見表3所列。

表3 性能評價結果
從表3中可以看出,前幾個周期指標顯示系統性能良好,后幾個周期性能由好變差。這與在第5個采樣區塊增大了u1和y1間的增益導致系統性能變差的結果是一致的。
本文提出了一種數據驅動的區域控制綜合性能評價技術,現有的評價指標常側重指示控制系統某一方面的性能,工程師在評價控制系統性能時要充分考慮控制系統的快、準、穩等多個方面的性能,因此會綜合考慮多個性能指標,這樣的方法費時費力,針對該問題,本文提出基于分類器的控制性能評價方法,讓機器學習工程師評價過程,輸出綜合性指標。目前僅處于仿真階段,希望接下來可以將本方案使用到工業實際中。目前該研究只針對工況穩定的控制系統進行評價,在工況轉變的過渡過程及實際工業中多工況的情況,仍需再進行深入研究。