李鵬,鄭曉軍,明梁,趙勁松,高金森
(1中國石油化工股份有限公司煉油事業部,北京 100728;2石化盈科信息技術有限責任公司,北京 100007;3清華大學化工系,北京 100084;4中國石油大學(北京)化學工程學院,北京 102249)
?
大數據技術在催化裂化裝置運行分析中的應用
李鵬1,鄭曉軍2,明梁3,趙勁松3,高金森4
(1中國石油化工股份有限公司煉油事業部,北京 100728;2石化盈科信息技術有限責任公司,北京 100007;3清華大學化工系,北京 100084;4中國石油大學(北京)化學工程學院,北京 102249)
摘要:催化裂化裝置是煉油廠生產汽柴油的核心生產裝置,是煉廠效益的重要來源,但催化裂化裝置的運行面臨著結焦、催化劑跑損等影響長周期運行問題。因此本文介紹了在中國石油化工股份有限公司開發的煉油技術分析與遠程診斷平臺上,運用大數據數據處理技術和積累的海量的催化運行數據進行數據挖掘與分析,嘗試對催化裂化裝置報警、結焦等問題進行深入探索研究與分析,解決催化裂化裝置報警問題、結焦問題和收率問題,從而進一步提升催化裂化裝置運行水平。分析表明基于傳遞熵的根原因分析能夠比較全面、準確地找出相關問題的影響因素,從而提高催化裂化裝置平穩運行,而大數據技術一旦工業化應用取得成功,將取得良好的經濟效益和社會效益,進而促進大數據技術在石化行業的推廣應用。
關鍵詞:大數據;催化裂化;技術分析
2001年,Gartner公司的一份研究報告首次出現“大數據”概念的提法[1]。進入2012年,大數據一詞越來越多地被提及,人們用它來描述和定義信息爆炸時代產生的海量數據,并命名與之相關的技術發展與創新。越來越多的政府、企業等機構開始意識到數據正在成為組織最重要的資產[2-4],數據分析能力正在成為組織的核心競爭力。
大數據技術在國內外呈現了快速發展的趨勢,國內外金融業、互聯網、通信、電子商務等行業應用大數據技術都取得了良好的效果。近年來,京東、淘寶、亞馬遜等網絡零售第三方交易平臺和電子商務網站蓬勃發展,聚集了大量的經營者、消費者和商品、服務,并因此產生了大量的商業數據,利用大數據技術對網絡購物、網絡消費、網絡團購、網上支付數據進行深度挖掘、深入分析,可發現大量有價值的信息和統計規律,對布局和推動今后互聯網經濟的健康有序發展、進一步規范經營者和消費者的電子商務活動、加強國家對該領域的宏觀調控和監管等,均產生了積極的作用。在通信行業,中國聯通、中國移動、中國電信3大運營商分別采取了加速推進大數據應用的舉措。
在石化領域,國外已進行試驗性探索,如BP公司對海量管道傳感數據進行分析[5],發現管道壓力數據與管道腐蝕程度的關聯關系可作為管道腐蝕程度的表征,從而更好地安排原油輸運,降低腐蝕風險。但國內石化行業對于大數據技術的應用目前仍是空白。
2012年底中國石油化工股份有限公司(簡稱中國石化)共有催化裂化裝置55套,總加工能力6911萬噸/年,負荷率100.3%,2Mt/a規模以上的催化裂化裝置已增加到9套,平均規模達到127萬噸/年。以2012年為例,中國石化催化裂化裝置生產汽油2532.7萬噸(占當年國內汽油消費量的29%以上),生產柴油1363.6萬噸(占當年國內柴油消費量的10%以上)。盡管催化裂化裝置的運行水平在不斷地提高,但在產品分布、節能減排、運行周期及催化劑技術4方面仍存在一系列亟待解決的問題。以影響催化裂化運行周期的非計劃停工為例,根據中國石化煉油事業部統計:2013年中國石化下屬煉油企業共19套裝置發生非計劃停工,非計劃停工天數共207天。其中,催化裝置非計劃停工占53%,占停工天數72%,而催化裂化裝置非計劃停工主要原因是由裝置結焦引起的(圖1)。此外,催化裂化裝置的生產工藝非常復雜,根據中國石化煉油技術分析與遠程診斷系統統計,催化裂化裝置的生產報警數量遠遠大于其他裝置的生產報警數(圖1),因此降低催化裂化裝置生產報警與結焦,成為催化裂化裝置迫切需要解決的問題。

圖1 裝置報警統計分布圖和催化裂化裝置非計劃停工原因分布圖
針對催化裝置中存在的上述問題,目前一直使用傳統工藝技術分析手段進行分析研究,獲得了一定的成果。但由于數據來源的單一性及不連續性,無法對結焦等問題發生的原因進行深層次的分析,更談不上預警與預防,只能被動的事后分析。
2008年3月,中國石化開始煉油工藝遠程診斷平臺建設[6],截至2013年,中國石化310套煉油主生產裝置全部實現上線運行,系統3分鐘采集一次的數據點數達到16萬個,目前存儲歷史數據約55TB,且每年以18TB左右的速度增長。經過近年煉油技術分析及遠程診斷系統對數據的不斷積累,初步形成了中國石化煉油大數據源,利用這些大數據,來挖掘分析數據背后的關聯,從而對催化裝置運行中存在的一些問題進行分析、預測、預警、可視化展示,從而提供了解決工業問題的新思路和新方法。
針對催化裂化裝置存在的突出問題(報警多、結焦問題及如何提高目的產品收率問題),基于中國石化煉油技術分析及遠程診斷系統,應用大數據技術理念對催化裂化裝置的海量數據進行深層次的數據挖掘,發現問題,找到問題的關聯因子,建立預測模型,通過對試點裝置的驗證后,形成可供推廣的生產操作指導和風險評估技術,開創應用大數據技術解決催化裂化裝置生產問題的新途徑。
2.1 建設完善催化裂化裝置大數據平臺

圖2 催化裝置大數據平臺技術架構
催化裝置大數據平臺是應用大數據開展催化裝置應用的基礎,為問題分析提供良好的數據樣本及分析算法,并支持系統應用。可采用分布式技術架構進行大數據平臺建設,便于數據的快速采集與分析計算;采用組件化的開發技術,實現高度可定制化的用戶界面,便于系統的擴展,改善信息的展現方式。平臺建設包括數據整定及樣本數據模型開發、分析算法開發及模型應用3部分,平臺技術架構見圖2。
2.1.1 數據整定及樣本數據模型開發
數據整定是根據所定義的具體分析問題,對研究所需的數據進行整定形成樣本。樣本庫包括基礎樣本庫和專題樣本庫兩個層面,見圖2。基礎樣本庫開發工作是將中國石化技術分析及遠程診斷系統、企業端ODS及其他信息系統數據進行整定,以時間為統一維度,將不同系統的各業務主題數據串聯,形成基礎樣本庫;專題樣本庫是在基礎樣本庫基礎上,利用領域專家的經驗選取解決專題問題所需的業務主題數據,形成進行專題分析的專題問題樣本庫。
基礎樣本庫包括總部端基礎樣本庫及企業端基礎樣本庫,包括生產物料、質量、計量、操作、工藝等業務主題數據。專題樣本庫針對研究目標,包括催化報警問題分析樣本庫、催化結焦問題分析樣本庫及催化提高汽油(目的產品)收率研究樣本庫3個部分。
數據模型庫是進行大數據分析的直接數據基礎,通過調用平臺大數據分析算法庫中的相關算法,從專題樣本庫中篩選與研究問題高度相關的數據維度,形成專題模型庫。如催化報警問題分析模型庫中,是基于催化報警問題分析樣本庫進行維度篩選,樣本數量不變,數據維度范圍使用數學分析方法進一步縮小。數據模型庫針對研究目標,包括催化報警問題分析模型庫、催化結焦問題分析模型庫及催化提高汽油收率研究模型庫3個部分。
2.1.2 大數據分析算法庫開發
分析算法庫是支持模型庫建立的重要工具,同時也是支持應用的計算引擎。大數據分析算法庫包括聚類算法、分類算法、關聯分析算法及預測算法4個部分,每類算法包含具體應用所需的數據挖掘算法,具體算法見表1。
2.1.3 分析模型應用
分析模型應用是將研究成果可視化,支持關鍵用戶進行在線的操作。應用開發是基于樣本數據模型進行在線的模型調用分析,需要調用大數據分析算法庫中的算法進行分析計算,最終將結果進行可視化展示。
2.2 應用模型開發
2.2.1 報警分析模型
利用工廠生產的歷史數據進行數據挖掘,生成各個位點之間的相關性與因果鏈路,并以因果鏈路圖為指導完成工廠生產異常工況的預警。此外,對中國石化各套催化裂化裝置的報警數據進行篩選,利用報警管理算法降低報警數量。生成各個位點間的相關性與因果鏈路主要通過傳遞熵算法[7],需要選取歷史數據中各個位點平穩的一段數據作為算法輸入,計算后得到各位點兩兩之間的相關性大小(以傳遞熵值大小表示)。根據對相關性的顯著性水平檢驗判斷篩選出各位點之間的因果關系,并以此為依據做出因果鏈路,如圖3所示。

表1 數據挖掘算法
為了驗證分析結果的準確性,將傳遞熵的分析結果分別與中國石化集團FCCU專家、九江FCCU專家的經驗分析結果進行了比對。以再生滑閥壓降(PDIC217)為例,不同層級的專家對再生滑閥壓降影響因素的分析結果不一致,而傳遞熵對再生滑閥壓降影響因素與集團FCCU專家的分析結果的重合率為56%,存在比較大程度的重合;與FCCU專家的經驗分析相比,傳遞熵發現了大量沒有被FCCU 專家分析出的影響因素。
由于生產條件的限制,本文針對兩個位點進行了傳遞熵結果工業驗證,分別為再生滑閥壓降(PDIC217)與二再密相溫度(TI227A)。根據傳遞熵的計算結果,待生滑閥閥位是再生滑閥壓降的影響因素,而FCCU專家并沒有提及,因此以驗證待生滑閥閥位對再生滑閥壓降的影響為例,其具體驗證方案和驗證結果分別見表2和圖4。
由于再生滑閥壓降一直存在較大的波動,因此以平均值衡量其變化。如圖4所示,待生滑閥閥位(從24.1%到25.3%,增加1.2%)時,再生滑閥壓降減小約1MPa;待生滑閥閥位(從24.1%到23.3%,減少0.8%)時,再生滑閥壓降增大約1.5MPa,即待生滑閥閥位越大,再生滑閥壓降越小。上述工業驗證結果表明待生滑閥閥位是再生滑閥壓降的影響因素,驗證了傳遞熵計算結果的準確性和可信度,同時也體現了基于數據分析的傳遞熵算法較人工分析的優勢。

圖3 再生滑閥壓降(PDIC217)的因果鏈路圖

表2 待生滑閥閥位對再生滑閥壓降影響的工業驗證

圖4 驗證期間操作變量及觀察變量趨勢
2.2.2 結焦診斷模型
模型收集催化裝置結焦前后歷史數據,利用非線性主成分分析方法,結合實驗室的結焦機理研究[8],確定結焦關鍵性參數,綜合利用神經網絡算法等預測方法對結焦趨勢(包括結焦速率、累積結焦量、結焦分布,模型建立步驟見圖5)進行長周期預測及優化,并通過聚類算法及互相關函數等時滯分析算法建立關鍵性參數與大量操作數據、原料性質數據、裝置數據等工業數據之間的關聯關系網,并提出具體可執行的減緩結焦的方案。
T時刻沉降器內部的瞬時結焦量的計算方法如式(1)~式(3)。
瞬時結焦量 = 純焦量 + 焦塊中催化劑量 (1)
純焦量 = 重油沉降器內重油液滴生成量×捕獲率×生焦率(2)
重油沉降器內重油液滴生成量 = 油氣平均質量流量×油氣中油漿含量×油漿平均冷凝率 (3)

圖5 神經網絡模型建立步驟
T時刻沉降器內部的總結焦量計算如式(4)。
總結焦量 = 裝置開工到T時刻的瞬時結焦量之和 (4)
結焦量的預測結果見表3。

表3 結焦量的預測結果
2.2.3 汽油收率模型
模型以現有催化裂化操作、設備、原料、催化劑方面的工業過程數據為基礎,采用優秀機器學習算法,如支持向量機(support vector machine,SVM)進行長周期預測模型,確保模型運行的穩健性和自主學習性,并建立優化方案,以提出操作改進建議。
2.3 信息可視化
信息可視化[9](information visualization)旨在進行大規模信息資源的視覺呈現,利用圖形圖像方面的技術與方法,幫助操作人員理解和分析數據,囊括了數據可視化、信息圖形、知識可視化、科學可視化以及視覺設計等方面,見圖6。可視化提供了深入洞察大數據的手段,將擬采用Processing語言,引入電子藝術的概念,輔助進行系統開發的可視化設計。

圖6 結焦量預測可視化界面
本文探討了如何利用大數據技術解決煉油工業中催化裂化裝置運行存在的3個亟需解決的問題(報警問題、結焦問題、收率問題)。由于催化裂化過程的復雜性和不確定性,大數據技術在上述3個問題方面較傳統的基于經驗和過程知識的解決思路體現出較大的優勢。以報警問題為例,基于傳遞熵的根原因分析能夠比較全面、準確地找出相關位點的影響因素,并為下一步預警模型的建立提供重要依據,從而提高催化裂化裝置平穩運行時間。而大數據技術一旦工業化應用取得成功,將取得良好的經濟效益和社會效益,進而促進大數據技術在石化行業的推廣應用。
參 考 文 獻
[1] HIGUCHI F,YAMAMOTO I,TAKAI T,et al. Use of event correlation analysis to reduce number of alarms[J]. Computer Aided Chemical Engineering,2009,27:1521-1526.
[2] 趙云山,劉換換. 大數據技術在電力行業的應用研究[J]. 研究與開發,2014(1):57-62.
[3] 王靜遠,李超,熊章,等. 以數據為中心的智慧城市研究綜述[J]. 計算機研究與進展,2014,51(2):239-259.
[4] 全石峰. 云計算環境下大數據處理對電子商務發展的作用[J]. 電腦知識與技術,2013,19(20):4762-4770.
[5] NISHIGUCHI J,TAKAI T. IPL2 and 3 performance improvement method for process safety using event correlation analysis[J]. Computers & Chemical Engineering,2010,34(12):2007-2013.
[6] 李鵬,鄭曉軍. 中國石化煉油技術分析及遠程診斷系統的開發與實踐[J]. 煉油技術與工程,2012(10):49-53.
[7] SHU Yidan,ZHAO Jinsong. Data-driven causal inference based on a modified transfer entropy[J]. Computers & Chemical Engineering,2013,57:173-180.
[8] 藍興英,高金森,徐春明. 重油催化裂化沉降器結焦歷程分析[J].現代化工,2007(4):46-48.
[9] 羅萬才,雷君虎,李敘庚. 基于Processing的信息可視化研究[J].電腦知識與技術,2009,13:3543-3544,3546.
綜述與專論
Application of big data technology in operation analysis of catalytic cracking
LI Peng1,ZHENG Xiaojun2,MING Liang3,ZHAO Jinsong3,GAO Jinsen4
(1SINOPEC Petroleum Refining Business Unit,Beijing 100728,China;2Petro-Cyber Works Information Technology Co.,Ltd.,Beijing 100007,China;3Department of Chemical Engineering,Tsinghua University,Beijing 100084,China;
4College of Chemical Engineering,China University of Petroleum-Beijing,Beijing 102249,China)
Abstract:FCC as the core equipment for gasoline and diesel oil production,is an important source of refinery economic efficiency,but long period operation of catalytic cracking unit is constrained by coking and loss of catalyst. In order to further enhance operating level of catalytic cracking unit and try to use big data processing technology,China’s petrochemical refining technology analysis and remote fault diagnosis platform was developed and data mining and analysis of accumulated massive data of catalytic cracking was conducted to make exploratory research and analysis of operational problems of coking,alarming,etc. A more comprehensive analysis can accurately identify the factors related to the problems,thereby securing smooth running of catalytic cracking unit. Once industrial applications of big data technology make good economic and social benefits based on the root cause transfer entropy,further application of big data technology in the petrochemical industry is expected.
Key words:big data; catalytic cracking; technical analysis
收稿日期:2015-08-21;修改稿日期:2015-09-06。
DOI:10.16085/j.issn.1000-6613.2016.03.002
中圖分類號:TP 15;TE 626
文獻標志碼:A
文章編號:1000–6613(2016)03–0665–06
第一作者:李鵬(1972—),男,工學博士,教授級高級工程師,在中國石油化工股份有限公司煉油事業部從事技術管理工作。聯系人:鄭曉軍,博士。E-mail steven. zheng@pcitc.com。