鄒筱瑜 王福利 常玉清 王敏 蔡慶宏
過程運行狀態評價指在過程安全、正常運行的前提下,進一步對過程運行性能優劣做出評價,并對非優原因進行追溯,為操作人員提供合理可靠的操作指導建議.過程運行狀態優劣評價指標種類眾多,其中,綜合經濟指標(Comprehensive economic index,CEI)是最常用的評價指標之一,CEI將物耗、能耗、產品質量等指標融合為經濟效益的綜合指標.有效的運行狀態評價方法有助于保證過程CEI最大化.因此,近年來對運行狀態評價方法的研究越來越多.
性能評價方法已廣泛應用于各個領域[1?4].層次分析法(Analytic hierarchy process,AHP)是一種研究初期盛行的方法,AHP以指標的拓撲結構為基礎,已廣泛應用于環境和風險評價中[5?7].過程危害分析法(Process hazards analysis,PHA)和專家系統是基于過程知識的方法,已應用于風險和狀態評價中[8?9].灰色關聯分析法(Grey relational analysis,GRA)是一種處理小樣本情況的方法,曾應用于環境和經濟效益的評價[10].作為人工智能方法發展的一個重要成果,人工神經網絡(Artificial neural network,ANN)擁有強大的學習能力和非線性處理能力.基于ANN的評價方法得到廣泛應用,例如臨界狀態評估等[11?12].其他常用評價方法還包括信息理論、動態概率理論等,已應用于結構破壞評價[13]、空氣質量評價[14]等領域.但上述典型評價方法并沒有針對過程運行狀態優劣程度在線評價進行深入研究.
過程運行狀態在線評價是近幾年誕生的一個新興研究方向.對于數據呈單峰分布的過程,Liu等針對線性和非線性的情況,分別提出了基于Total projection to latent structure(T-PLS)[15]和Kernel total projection to latent structure(KT-PLS)[16]的評價方法.對于數據呈多峰分布的過程,Liu等提出了基于高斯混合模型回歸(Gaussian mixture model regression,GMR)[17]的評價方法.此類方法雖能實現過程運行狀態在線評價,卻過度依賴于數據質量,要求數據測量準確、實時,否則,會使評價準確度和精度大大降低,甚至造成評價模型失效.
在實際生產過程中,存在大量無法準確、實時測量的變量,變量取值可能來自于粗糙的測量、離線化驗、專家定性估計等,即不確定信息在實際流程工業過程中廣泛存在.此類不確定性主要來源于惡劣的生產環境和落后的測量技術.Pawlak提出的粗糙集(Rough set,RS)理論是一種在不確定性存在的前提下進行推理的方法[18?19],現已廣泛應用于安全性評價和風險評價等領域[20?21],但還未有研究將RS應用于含不確定性的過程運行狀態最優性在線評價中.
當過程運行于非優運行狀態時,需進行原因追溯.傳統的非優原因追溯方法多基于確定性信息.基于指標分解的非優原因追溯方法是最常用的方法,Liu等[15]和Zou等[22]將優性評價指標分解為與變量相關的單項式和作為變量對優性指標的貢獻和.超出歷史最優運行狀態時貢獻范圍的變量,被認定為非優原因變量.只有優性指標可被分解為獨立的變量貢獻時,此方法才有效.Liu等[16?17]將優性指標對每個變量的偏導數值作為相應變量的貢獻,并將超出最優運行狀態時貢獻范圍的變量作為非優原因變量.該方法僅適用于優性評價指標為連續可導函數的情況.當過程存在不確定信息時,上述兩類方法都難以直接應用.
本文旨在解決含不確定信息的流程工業過程運行狀態優性評價和非優原因追溯問題.流程工業過程含有多生產單元、多變量等特點,同一生產單元內變量耦合程度高,單元間變量耦合程度低,整體變量規模龐大.若將傳統評價方法直接應用于流程工業過程中,可能存在以下三個主要問題:1)問題規模龐大,模型復雜,難以準確建立;2)過程變量并不直接影響最終評價指標,而是通過一系列中間工藝指標,逐步逐層影響綜合評價指標,因此,難以直接提取過程變量與最終評價指標的相關性;3)在非優情況下,非優原因變量難以快速定位,模型解釋性差.考慮到實際復雜流程工業過程特點和數據特性,本文提出基于RS的分層分塊模型,應用于過程運行狀態最優性在線評價和非優原因追溯.根據流程工業過程管理方向和生產流程進行縱向分層和橫向分塊,用RS對每一個子塊分別進行建模.在分層分塊模型的基礎上,進行評價和非優原因追溯.本文所提方法考慮到不確定信息,合理簡化問題規模,兼顧子塊內和子塊間的信息、不同層次指標之間的關系,提高評價精度和解釋性.
針對流程工業過程多變量、多生產單元、含不確定性、有不同層次指標的特點,提出一種基于RS的分層分塊模型(RS based hierarchical multi-block model,RSHMM),進行運行狀態評價,簡化問題規模,提高模型解釋性.
為了簡化運行狀態評價問題的規模,使得運行狀態評價模型具有更強的物理意義,根據工業過程流程、工藝特性和工藝指標等級的分布,將一個流程工業過程劃分為不同層次,每一層劃分為不同子塊.管理層次的細致程度決定了層次的數目,過程規模和工藝特性決定了子塊的數目.本文采用的單元層、功能區層和全流程層的劃分方法是一種常見的流程工業過程劃分方法,但不是唯一的劃分方法.一個流程工業過程的層次和子塊的劃分如圖1所示.縱向,劃分為全流程層、功能區層和單元層;橫向,功能區層劃分為M個功能區,第m個功能區劃分為Nm個運行單元.全流程包含整個流程工業生產過程;一個功能區包含獨立完成一個生產功能的所有生產單元;一個生產單元包含聯系緊密的一系列設備,同一生產單元內變量強耦合.一個單元模型的輸入為過程變量,輸出為單元層工藝指標;在建立單元指標與單元內過程變量的模型時,提取了與單元指標有關的變量相關性特征.一個功能區模型的輸入為體現單元特性的所有單元層工藝指標,輸出為功能區層工藝指標.在建立功能區指標與單元指標的模型時,提取了與相應功能區指標有關的單元指標之間的相關特征、耦合關系.同理,全流程模型的輸入為各個功能區層工藝指標,輸出為全流程評價指標.在建立全流程評價指標與功能區層工藝指標的關系時,提取了與全流程評價指標有關的功能區指標之間的相關特征、耦合關系.同時,也相當于提取了與全流程指標相關的單元子塊間的相關關系.工藝指標一般包括質量指標和消耗指標.在評價過程中,不能單獨通過一個子塊的工藝指標判斷該子塊的優劣程度,但可建立低一層工藝指標狀態與高一層指標狀態的關系,最終得到全流程指標和相關工藝指標的關系.同一模型內變量/指標之間相關性相對較強,不同模型間變量/指標之間相關性相對較弱.
在完成分層分塊結構的建立之后,由于不確定信息的存在,采用RS對每一個子模型進行建模,建立輸入與輸出之間的對應關系.
1.2.1 RS理論簡介
RS是Pawlak提出的一種在信息系統內表達不確定信息的方法[18?19,23].假設U為目標的非空有限集合,稱為論域,X為論域的一個子集(概念),A是一個有限的屬性集合,R是A的一個子集.對于論域中的一個元素x,令[x]R是一個包含x的集合,其中,[x]R中的元素在關系R上都相同.[x]R稱為x在關系R上的等價類.對于論域的任何子集X,X的上、下近似分別定義為

其中,R(X)包含U中所有可以確定屬于X的元素,(X)包含U中所有可能屬于X的元素.X的R-邊界域定義為

如果X的邊界域為空,即BNR(X)=?,則稱X是R可定義的,否則稱X是R不可定義的.R可定義集稱作R-精確集,R不可定義集也稱作RRough集,在不發生混淆的情況下,簡稱Rough集.
RS的約簡和推理在決策表的基礎上進行.決策表的每一列表示一個屬性,每個屬性的取值被劃分為若干離散狀態.通常,屬性可分為條件屬性和決策屬性.決策表每一行代表論域中的一個元素和一種推理規則.規則以IF(條件),THEN(決策)的形式表達,來實現推理決策.RS理論參見文獻[23].
1.2.2 離線建模
在實際生產中,一部分變量可以實時、定量測量,還有一部分變量無法準確、實時測量,變量取值可能來自于粗糙的測量、離線化驗、專家定性估計等.本文旨在解決存在大量不確定信息的流程工業過程運行狀態評價問題.
在建立如圖1的分層分塊結構基礎上,用RS建立每個子模型的輸入和輸出之間的關系.采集充足的、覆蓋所有運行狀態等級的歷史數據,以分層分塊結構為基礎,自頂向下,確定各子模型的決策屬性和條件屬性,組織決策表.每個子模型的輸入輸出,如圖2所示.離線建模數據包括全流程評價指標CEI、功能區層評價指標、單元層評價指標、各單元內過程變量和表征生產工況的變量.在全流程層,以全流程運行狀態綜合評價指標CEI為決策屬性,以功能區層工藝指標=[Z1, Z2,···, ZM]和代表過程生產工況的變量C為條件屬性,組織決策表,其中,(m=1,2,···,M)為功能區m的Im個指標,為第i個指標的取值,D為歷史樣本數目.過程運行狀態可根據CEI的水平劃分為不同等級,CEI越高,反映出運行狀態等級越好.在功能區層,針對第m個功能區,以該功能區工藝指標分別為決策屬性,以單元層工藝指標和C為條件屬性,組織第m個功能區的決策表,其中,為第m個功能區第n個單元的Im,n個指標,為第i個指標的取值.在單元層,針對第m個功能區第n個單元,分別以該單元工藝指標為決策屬性,以該單元內過程變量m,n和C為條件屬性,組織該單元的決策表,其中,,Jm,n為第m個功能區第n個單元包含的過程變量個數.不同生產工況下,過程對同樣操作的響應特性不同,運行狀態性能的評價指標所能達到的水平不同,性能評價標準也不同.因此,需要在每一層次每一子塊的輸入中加入反應過程生產工況的信息C.如果過程運行于單一工況,那么不需要進行工況區分,C為空.建立各子模型的決策表之后,將過程變量、工藝指標和評價指標進行離散化,即把無限空間中無限的個體映射到有限的空間中去,以此提高算法的時空效率.變量和指標的狀態劃分可采用傳統的等距離離散化方法[23]或聚類方法[24],也可借助專家經驗[25]進行劃分.基于分層分塊結構的評價模型,自頂向下進行離散化.離散化是應對過程信息不確定性的有效手段.針對定量測量的變量,將變量取值離散化為不同狀態等級,并用一系列正整數對不同等級進行順次編號.針對定性估計的變量,將每一種定性狀態作為一個變量狀態等級,并進行編號.值得注意的是,本文所指變量狀態等級只與變量幅值大小有關,與變量優劣無關,只有全流程運行狀態等級才與性能優劣有關;后文中,假設所有變量均已合理離散化.

圖2 離線模型輸入輸出示意圖Fig.2The diagram of input and output for the offline model
在組織決策表并離散化之后,需要對每一張決策表進行約簡,即在保持分類能力不變的前提下,刪除對決策沒有影響的條件屬性[26?27].常用的屬性約簡方法有一般約簡算法、基于差別矩陣和邏輯運算的屬性約簡算法、歸納屬性約簡算法等.
離線建模最后的操作是提取決策規則.規則庫中決策規則為IF(條件),THEN(決策)的形式,即啟發式規則.條件為各條件屬性狀態取邏輯和的形式,決策為相應決策屬性的狀態.決策規則是進行分層分塊評價和追溯的基礎.
通常,流程工業過程中間工藝指標和綜合評價指標難以直接在線獲得.因此,本文利用建立的分層分塊模型,自底向上逐步推理出工藝指標和綜合評價指標的狀態.1)通過過程變量的測量值,利用單元層各RS模型推理出單元層各工藝指標的狀態;2)以單元層工藝指標狀態為基礎,用功能區層RS模型推理出功能區層各工藝指標的狀態;3)以功能區層工藝指標狀態為基礎,用全流程層RS模型推理全流程綜合評價指標CEI的狀態.最終運行狀態等級評價策略以CEI在一定時間窗口內的狀態為基礎,進行進一步判斷.
獲得時刻t的在線數據后,用與離線建模相同的離散化方法,得到離散化后的數據,其中,ct表示過程生產工況,表示各子塊內包含的變量,J為變量維數.
為降低評價對噪聲的敏感度,時刻t的等級判斷不能以單個時刻的CEIt為標準.引入長度為H的滑動窗口,以t時刻滑動窗口{CEIt?H+1,CEIt?H+2,···,CEIt}內,出現頻率最高的 CEI狀態等級作為此時運行狀態等級的評價結果,記為Gdt.若出現頻率最高的CEI狀態等級不止一個,則保持前一時刻評價結果不變.運用此評價規則,針對一個存在L個運行狀態等級的過程,其初始狀態的確定,最多需要λ個時刻的評價,其中,λ=max{L+1,H}.
在確定初始運行狀態等級后,具體在線評價步驟總結如下:
步驟1.獲取t時刻在線數據并離散化得xt=;
步驟2.構造推理第m個功能區中第n個單元工藝指標的基礎;
步驟 3.根據單元層工藝指標的RS模型,由推理
步驟4.構造推理第m個功能區工藝指標的基礎,其中,;
步驟5.根據功能區層工藝指標的RS模型,由推理;
步驟6.構造推理全流程綜合評價指標CEI的基礎,其中,;
步驟 7.根據全流程RS評價模型,由zt推理出CEIt;
步驟 8.以t時刻滑動窗口{CEIt?H+1,CEIt?H+2,···,CEIt}內,出現頻率最高的 CEI狀態等級作為此時運行狀態等級的評價結果,記為Gdt.若出現頻率最高的CEI狀態等級不止一個,則保持前一時刻評價結果不變.
非優原因追溯的目的是在過程運行狀態處于非優等級時,找到導致非優狀態的原因,為操作人員提供生產指導.為查找真正的非優原因變量,提供使生產調整代價最小的最優生產條件作為參考,本文提出一種基于匹配度的非優原因追溯方法,查找非優原因,提供調整方向,保證調整的有效性和可行性.所提方法考慮到了最優生產狀態與當前生產情況的差異度、變量調整的幅度、變量調整的難易程度等.
在分層分塊的基礎上,自頂向下,進行查找.本文通過衡量當前非優數據與最優運行狀態規則庫中數據的匹配程度,選取與當前非優數據匹配度最大的優規則作為參考,與此優參考數據差異度較大的屬性為非優的屬性.對于一個非優的指標,需要繼續以相同方法向下查找更深層次的非優原因.直到查找到單元層非優的過程變量為止,得到非優原因.
一次查找中,規則匹配的過程如圖3所示,其中,a1a2a3···aJ′和分別表示當前的非優數據在各屬性的狀態取值和與之匹配度最大的優規則在各屬性的狀態取值,J′為條件屬性個數.用匹配度公式衡量當前數據與優規則的匹配情況.匹配度選取的準則為:1)兩個數據中相同的屬性越多,匹配度越大;2)兩個數據中屬性等級的級差越大,匹配度越小;3)兩個數據中不同的屬性調整越容易,匹配度越大.

其中,|aj?ak,j|為aj和ak,j的等級差,Aj為屬性j的等級總數,βj為屬性j的權重,權重越小,相應屬性可操作性越強,且滿足,利用式(3),可在最優規則庫中選取與a匹配度最高的規則,記為a?.然后利用差異度,確定a確定a中非優的屬性.定義a和a?中第j個屬性的差異度為

基于RSHMM的非優原因追溯如圖4所示.在全流程層,需要查找zt中導致非優的功能區層指標.以全流程層RS模型為基礎,將決策屬性CEI為優的數據構成全流程層的最優規則庫.計算zt與最優規則庫中每條規則的匹配度,得到與之匹配度最大的優參考規則,記為.對比zt和中的每個屬性狀態取值的差異,差異度大的為非優的屬性,需要進一步查找其非優原因.在獲得的同時,對應的單元層指標和過程變量也可以相應獲得,這些數據構成新的優規則庫,是下一層追溯的基礎.

圖3 非優原因追溯中的規則匹配示意圖Fig.3 Schematic diagram of the rule matching in non-optimal cause identification

圖4 基于RSHMM的非優原因追溯示意圖Fig.4 Schematic diagram of non-optimal cause identification based on RSHMM

圖5 金濕法冶金工藝流程示意圖Fig.5 The flow chart of the gold hydrometallurgy process production
金濕法冶金過程是一個典型的流程工業過程.與傳統火法冶金不同,金濕法冶金將礦石中固態的金轉換為礦漿中液態的金,再用鋅粉進行置換,在冶金效率和環境保護方面有較大優勢.但是,金濕法冶金過程含有大量不確定性,很多變量只能定性估計,而不能定量測量.因此,本章以國內某金濕法冶金過程為背景,驗證所提方法的有效性和可行性.該金濕法冶金工藝流程如圖5所示,過程包含三個功能區:浸出功能區、洗滌功能區和置換功能區.浸出功能區包含一次浸出單元和二次浸出單元.浸出單元用適當的溶劑處理礦石或精礦,使黃金以金氰絡合物離子形態進入溶液,而脈石及其他雜質不溶解.因此,黃金和原礦物雜質以固–液相的形式區分開來.洗滌功能區包含一次洗滌單元和二次洗滌單元.壓濾洗滌單元起到固液分離的作用,將富含金氰絡合物離子的貴液輸送到置換功能區,將固體雜質進行回收利用.兩浸兩洗的工藝設置保證了黃金浸出率.置換功能區利用鋅粉與金氰絡合物離子發生的置換反應,將液相的黃金重新變為固相.此功能區規模不大,變量相關性強,不需再細分為不同生產單元.因此,金濕法冶金過程的分層分塊結構為:全流程層是金濕法冶金全流程;功能區層包含浸出、洗滌和置換功能區;單元層包括浸出功能區中的第一次浸出和第二次浸出單元,以及洗滌功能區中的第一次洗滌和第二次洗滌單元.
本節將所提方法應用于我們課題組開發的金濕法冶金半實物仿真平臺中.此仿真平臺模擬了所研究的金濕法冶金生產過程.經過長時間的實踐、修正和完善,可以較為準確地模擬該濕法冶金生產過程,為實際生產決策提供參考.經過深入研究,選取與CEI密切相關的15個工藝指標和34個過程變量用于實現該過程的分層分塊結構運行狀態評價,分別列于表1和表2中.過程運行狀態劃分為優、中、差三個等級,分別對應CEI高、中、低三個狀態.從半實物仿真平臺采集三個等級的數據各2000組作為建模數據,每組數據包含生產條件、過程變量、單元層指標、功能區層指標和全流程評價指標CEI的變量狀態.采集300組數據作為測試數據,每組數據包括生產條件、單元層各子塊所含變量的狀態.這300組測試數據模擬了運行狀態等級從優變為中的生產過程:前150組測試數據運行于優運行狀態;從第151組測試數據開始,模擬礦漿來料量增多時,未能及時增加二浸NaCN添加量,導致運行狀態從優變為中的過程.選取滑動窗口長度H=5,用本文所提RSHMM方法分別進行運行狀態評價和非優原因追溯.

表1 各層評價指標列表Table 1 The assessment indices for each level

表2 濕法冶金過程變量表Table 2 The variables of the gold hydrometallurgy process
圖6是基于本文所提RSHMM方法的全流程評價結果,能較為準確地判斷出運行狀態等級的變化,幾個時刻的判斷延遲主要來源于離散化步驟的信息損失.RSHMM方法不僅能夠得到全流程運行狀態等級的評價結果,還能得到各級過程指標的狀態,利于提高解釋性,快速定位導致非優運行狀態的原因變量,對生產調整提供清晰的指導.非優原因追溯結果如圖7所示,所提方法能夠準確定位非優原因變量,并且深入展示非優運行狀態產生的原因.

圖6 基于RSHMM的在線評價結果Fig.6 RSHMM based online assessment result

表3 RSHMM和RS評價正確率對比(%)Table 3 The assessment accuracy rate comparison of RSHMM and RS(%)

圖7 基于RSHMM的非優原因追溯結果Fig.7 RSHMM based non-optimal cause identification result
同時,將該過程用傳統RS方法進行評價.經過反復實驗證明,基于RSHMM和RS評價方法的正確率與建模數據量有較大關系.表3是在不同的建模數據量下,RSHMM和RS評價的正確率.可見,當建模數據量少時,RSHMM的正確率遠大于RS.而當建模數據量大到一定程度時,兩種方法正確率差距較小.用基于RS的方法進行追溯,追溯結果雖然包含了正確的非優原因,但同時也包含了其他因素,追溯結果解釋性差.
綜上所述,相比于傳統的不分層評價方法,本文所提方法有如下優勢:1)對建模數據量的要求更低;2)解釋性強,展示各層次指標和變量的狀態,利于深入分析過程運行狀態產生的原因;3)候選非優原因變量范圍小,更符合實際生產需求;4)可以清晰、準確、快速定位非優原因變量,指導生產調整.
針對含不確定信息的流程工業過程運行狀態評價問題,本文考慮到流程工業特點和數據特性,提出一種基于分層分塊結構的流程工業過程運行狀態評價和非優原因追溯方法.所提方法清晰直觀地表達了流程工業工藝特性,以及變量、指標之間的層次關系.因此,可以通過過程變量,逐步推算綜合評價指標的狀態,實現全流程的評價.對于非優運行狀態,在分層分塊結構的基礎上,利用匹配度公式,逐步查找非優的指標和過程變量,最終確定導致非優的原因變量,提供生成指導.最后,將所提方法應用于某金濕法冶金過程,取得了良好效果,證明了所提方法的有效性、準確性和可解釋性.考慮到不確定信息,各子塊分別用RS建模,但RS離散化過程中存在信息損失,評價精度有限.后續研究將會集中于提高運行狀態評價精度.