趙躍東,郭警中
(安徽中科維德數字科技有限公司,安徽 合肥 230001)
化工行業作為國家經濟支柱產業之一,總產值占我國GDP 的12%以上,但普遍存在“大而不強”的問題,行業急需改變現狀,促進高質量發展。現代化工生產過程多屬典型流程型,因生產節奏快、前后生產工序銜接緊密、過程不透明、依賴人工經驗等原因,生產中往往存在質量波動、產能不穩定等問題,生產工藝優化成為行業共性問題。但是化工生產過程封閉復雜、關聯因素多、生產設備多樣化、生產及產品狀態采集難,常規的技術難以對生產工藝進行有效的優化及控制。隨著人工智能技術的發展,筆者認為,人工智能與化工生產場景的融合應用是實現化工行業生產工藝優化的最佳選擇之一。
國外現代化工行業智能化水平較高。投產前,通過模擬技術應用,模擬、分析優化整個化工生產工藝;生產中,進行全要素數采、大數據分析、反向控制等智能化應用實現實時采集、融合互通,進行工業機理模型優化、工藝參數(工序)的優化控制;事后根據生產特征與發展趨勢,開展行業機理模型、交叉機理模型優化、隨動優化控制、動態優化領域研究,進而反饋事前設計和模擬階段,形成閉環的良性發展。
我國現代化工[2]企業大多具有DCS、ERP、MES、PLM、SIS、能耗監測檢測、污染源、危險源的監測與報警等系統,但僅限于對生產前、過程控制以及生產結果的監測與遠程控制,大多關聯性差,孤島效應嚴重。對于如何降低質量波動、提升產能及優化污染排放等問題沒有有效控制手段,難以做到協同優化以及隨動優化,與國外同行有一定的差距。
為突破關鍵設備與技術的瓶頸,實現我國化工行業關鍵技術與卡脖子工程突破,需要借助大數據分析以及AI人工智能等手段,對已采集的生產數據、工況數據以及過程質量等工業現場數據,進行聯動與協同分析、篩選與解析融合,最終形成以生產工藝優化為目標的數據集、模型庫以及機理模型,為工藝優化提供可靠的AI算法與分析基礎。
一是全要素數據采集需求。生產工藝優化分析需要以與生產相關的各類工業現場數據為基礎,利用AI工業大數據挖掘技術找出數據之間的邏輯關系,進而實現工藝建模與工藝尋優。
二是數據共享與聯動需求。除全要素的數據采集外,數據之間的共享與互通,是作為完整數據鏈的首要條件。
三是AI智能數據分析與工藝優化[3]需求。部分化工企業利用人工核對、數據比對、量化展示等方式可實現數據淺層的分析功能,但是對于企業而言,帶來的管理效益、生產效益以及經濟效益有限,不能解決企業技術突破以及優化升級的根本問題,因此利用采集到的數據,進行數據價值挖掘、聯動分析,最終形成具有自學習、自分析、自優化的AI智能分析算法與機理模型,成為企業與行業的迫切需求。
3.1.1 應用場景
生產異常往往通過工藝卡片或操作規程中報警上下限來判斷。當某個參數的數值超出上限范圍時,即可判斷為生產異常并發出報警。一旦報警產生,一定程度上會引起工藝參數或產品質量波動。如果報警處置不及時,更有可能釀成生產事故。因此提前預警,對保障生產安全和提升產品質量具有重要的意義。
在化工實際生產場景中,生產工藝參數繁多、指標復雜,并且參數與指標之間存在強相關性,因此對于異常的發現需逐步推進、逐層解析。首先需要完成以指標為核心的數據檔案,根據關鍵指標及核心參數進行建模,形成單一目標的數據模型,并對單一指標進行降噪處理,以決策樹為核心,以回歸算法為基礎,建立單一指標的黃金曲線,并根據指標允許范圍設置上下閾值,在出現預警或異常趨勢時,系統自動將預警內容及演變趨勢推送至工藝、操作以及DCS操控人員,操控人員通過輔助知識庫及人工經驗進行提前干預,保持生產平穩。
同時,實際生產執行過程中,需考慮多指標及多指標之間邏輯關系,控制層或生產執行層需要完成多指標的平衡與權重匹配,否則會出現單一指標正常,而生產系統出現報警或波動等現象,因此需要同時對多個指標進行全局場景下的檢測與預測。由于多指標之間的邏輯關系,很難迅速做出合理判斷,故需從生產系統本身進行數據挖掘,比如單一參數的輕微波動,經過多工序的疊加、滾動則會造成整體生產裝置系統的異常,因此需要對單一參數的波動進行實時采集,并且利用相關性分析算法對所關聯的指標及后續參數進行歸檔、建模,最終實現預測分析,同時將預測結果推送至相關操作人員,由操作人員、工藝專家綜合判定是否進行優化調整。
3.1.2 單指標異常偵測
對全裝置的工藝報警點進行異常偵測,包括監控其實時值和狀態(正常、離群或者報警)。單指標異常偵測根據所選位號的值所處的范圍,分為正常、離群和報警三種狀態。其中判斷是否報警的標準是根據用戶提供的報警上下限指標,超過報警上下限指標的即判斷為報警狀態。離群的標準根據箱線圖算法計算的上下限判斷。當指標的數據既未離群又未報警時,即判斷該指標處于正常狀態。報警則用紅色圓圈顯示,報警狀態具有最高的優先級,當判斷某個指標既離群又報警時,則顯示報警的狀態。當判斷某個指標只離群未報警時,則顯示離群狀態。在單指標異常監控界面中,從上到下優先顯示報警點、離群點和正常點。(圖1)

圖1 單指標異常偵測示意圖
3.1.3 多指標異常偵測
選取裝置部分關鍵指標進行多指標異常偵測,包括異常開始的時間、各指標的觸發值和持續時間等。
建立一張多維數據的數據源表作為異常偵測的數據庫,該表中包含選取的多個關鍵指標和時間字段,該表按最小數采周期為單位存儲每個指標的數據。在儲存之前,數據需要經過清洗,將異常值去除。
針對多維數據源表中的各類指標數據,利用均值、方差以及標準差等工具對數據進行辨識分析,精確識別主成分,同時利用相關性分析、泊松分布以及權重分析等算法,抽取相應的主成分數據作為分析對象,同時利用因果分析、回歸分析以及游程檢驗等算法建立聚類分析模型。
利用游程檢驗以及灰度預測模型對數據進行分布判斷以及數據完整性校驗,同時利用K相鄰回歸、SVR回歸以及決策樹回歸等算法對聚類中心數、中心曲線進行判斷與選取。根據數據分布,利用距離計算算法如皮爾森相關距離、斯皮爾曼相關距離等算法,對指標數據與中心數據或中心曲線的距離進行相關判定及隨機判定,并按照距離的大小進行降序排列。根據企業生產經驗及歷史數據,選取某個閾值作為異常偵測的依據,在實時生產過程中出現指標數據偏離閾值范圍則系統做出異常判定。(圖2)

圖2 多指標異常偵測示意圖
3.2.1 應用場景
在生產裝置中,產品的質量往往是通過化驗室取樣化驗分析,分析周期各不相同,通常為4~8個小時。當產品質量檢測出不合格時,實際生產通常已經延遲了4~8 個小時,操作調整滯后嚴重,導致了不合格產品量的增加,增大了企業的生產成本。因此對產品質量進行在線監測和智能預測,對提升產品質量和降低生產成本具有重要的意義。
當前,部分裝置一方面建有實時數據庫系統,對生產裝置的工藝參數、能耗參數以及環保排放參數等進行實時采集和存儲,另一方面建有質量系統,對生產裝置的產品質量數據進行監測和存儲。通過對質量系統中產品質量數據和實時數據庫系統中的操作數據進行建模[4],進而通過與產品質量指標強相關的實時操作數據對產品質量進行軟測量,操作人員可根據產品質量的實時值的波動進行操作調整,進而提升產品質量。
3.2.2 數據整定和對齊
數據清洗后,按照一定規則寫入軟測量建模的數據源表中。數據源表主要由質量數據和實時數據庫系統數據中的相關變量的數據組成。此數據源表作為軟測量建模的數據源。質量數據源表包括采樣時間、操作參數和產品質量等字段。
質量系統中主要包含采樣時間和對應的產品質量數據。把質量系統中的數據經過清洗之后寫入軟測量建模的數據源表。數據源表以產品采樣批次為單元寫入產品質量數據和操作數據。寫入規則如下:質量系統中產品質量數據要與產品采樣時間一一對應。
把實時數據庫系統中的數據經過數據清洗之后寫入軟測量建模的數據源表中。寫入規則如下:對每一個點位號的數據按產品采樣批次為單位寫入數據源表中。將對應采樣時間的操作數據的瞬時值,按照一定的滯后時間與產品質量數據進行對齊。滯后時間需要根據業務知識和經驗進行估算。
3.2.3 R語言讀取、計算和結果輸出
用R語言讀取軟測量建模數據源表,選取3/4的數據用來訓練模型,選取1/4的數據來測試模型。當測試結果的相對誤差滿足某個閾值時,則測試通過。否則需要重新調整模型參數,直至測試通過為止。
接入在線的操作數據到模型中,即可實時計算出當前時刻的產品質量,從而實現產品質量在線監測和異常分析的功能。
3.3.1 應用場景
化工生產工藝存在多個工序,并且每個工序均存在單獨的生產工藝與控制策略,因此需要將完整的生產工藝進行拆分,形成多個優化分析目標。首先完成單一目標的優化分析,然后將多個單一目標進行聯動分析,形成多目標協同與聯動分析,才能夠完成對整體生產工藝的智能分析與優化。
優化分析模型分為單一目標優化分析模型和多目標優化分析模型。
單一目標優化模型,可以挖掘歷史上最好操作進行固化,實現操作經驗傳承??膳c其他基于機理模型的優化軟件互補使用。通過采集工業裝置或者設備的原材料及關鍵變量的歷史數據,將生產過程或者運行過程劃分為多種操作模式。一方面,分別計算每種生產模式下,目標參數最優時強相關變量的取值。另一方面,基于操作模式的變化,實時推薦最佳的操作參數。
在生產優化的應用場景中,優化的目標往往是多維的。因此,多目標優化與單目標優化模型相比更具有價值,能為企業帶來更大的收益。多目標優化模型可同時選取多個目標進行優化計算,可以挖掘歷史上最好的操作經驗進行固化,實現操作經驗的傳承。
由于是對歷史上操作經驗的挖掘,通過機理模型將優化值進一步提升,優化分析模型會自動更新優化方案,并在下一次的優化計算中,推送新優化方案。所以優化分析模型具有自學習功能,能夠不斷學習新優化方法,持續豐富針對每種生產模式的優化方案庫,給用戶帶來經濟效益的持續性提高。
3.3.2 實現過程
優化分析是指在操作樣本庫中,搜索某類工況條件下目標[5]的最優值及其對應的強相關的操作變量。其實現過程包括以下六個步驟:數據辨識、主成分分析、參數化建模、建立操作樣本庫、在線滾動優化、模型仿真與尋優。
1)數據辨識
從數據源的角度出發,對單體設備的數據進行數據本身的辨識、分析,找出數據本身的迭代方式、數據之間的相關性以及數據出現的概率、頻率,并校驗是否有數據遺漏造成模型不可用的情況。
2)主成分分析
由于工藝參數、指標參數等的多樣化,并且對應海量的工況因素,因此需要對辨識后的數據進行主成分分析,并且主成分分析執行的過程中需要利用權重、相關性分析等對主成分的耦合性進行綜合判定與建模。
3)參數化建模
根據工藝及優化目標的要求,對數據進行主成分分析,完成降維建模,然后對數據進行聚類、分類以及權重影響分析,同時再次利用灰色預測模型對不確定數據、變量進行預測分析,保證模型的可靠性。
4)建立操作樣本庫
建立中間過程質量、工藝參數以及關鍵指標的操作邏輯及數據矩陣,利用矩陣模型形成全要素的數據鏈條,其字段除時間、工況類型和過程質量字段,其他字段均為與該優化變量強耦合的操作變量。
5)在線滾動優化
輸入歷史數據,對模型進行檢驗,跟蹤運算過程及結果,利用決策樹回歸、K回歸、非線性SVR回歸以及神經網絡回歸等機器學習算法,對模型進行滾動、持續優化。
6)模型仿真與尋優
模型優化完成后,再次利用歷史數據進行檢驗分析,檢驗完成后對接生產控制系統,對實時生產優化進行預測分析,但是不直接控制生產,將優化結果與真實操控結果進行對比分析,找出仍存在誤差的內容,反饋至在線滾動優化模型中進行真實數據滾動優化及持續在線尋優。
生產異常偵測按照實際生產工藝、裝置及指標要求,可分為單一指標及多個指標異常分析,同時根據用戶需求可將兩種分析算法進行結合使用。根據實際需求,用戶可選取關鍵指標、關鍵參數作為監測對象,同時對于異常的影響范圍、調優時間需求以及出現頻率等進行歸檔以記錄操作,形成標準化生產流程以及操作指導庫,相關部門可根據崗位職責、工藝規范等要求,及時有效處理報警及異常,并對某些需要時間進行綜合調整的異常進行提前消除。通過異常偵測模型的分析計算以及指導庫的建立,生產工藝的報警數量可降低20%~25%,操作調優時間節省15%。
產品質量軟測量通過融合機理模型、專家模型、統計學模型、大數據模型,采用數據清洗、降維、關聯分析、構建因果鏈路等手段,連續獲取間歇性結果,為生產和監測提供在線檢測手段。利用前置參數和過程變量可以在線即時甚至提前知道中間關鍵參數的情況以及產品和中間產品的質量情況,可以做到提前參與以增加良品率,對于提高生產效率、合理安排生產是非常有意義的。