李勇,錢鋒,宋育梅
(1 華東理工大學化工過程先進控制和優化技術教育部重點實驗室,上海200237; 2 中國石化上海石油化工股份有限公司,上海200540)
原油是由多種不同沸點的烴類及其他物質組成的極其復雜的混合物。常減壓裝置將原油分離成各種中間產品,用于下游裝置進一步加工或直接作為最終產品,因此對常減壓裝置進行建模并將其用于生產計劃來提升煉廠的利潤效益極為必要[1-2]。常減壓工藝流程包括初餾、常壓蒸餾和減壓蒸餾三部分組成,基本結構如圖1所示,初餾塔主要去除原油中的輕質烴類和水,常壓蒸餾在常壓環境下將大部分原油分解成幾種產品,減壓蒸餾再利用低壓降低餾分閃蒸點將原油的重端分離成幾種產品[3-4]。
由于原油通常由大量的化合物組成,其化學成分復雜,故采用原油分析的形式對原油進行定性[5-6]。原油分析通過提高沸點溫度,使原油的某些部分蒸發,此溫度為實沸點(TBP)。若原油能夠實現完全切割,則產品組分的TBP 曲線與原油TBP 曲線重疊[7],但實際上存在很大差異,如圖2 所示。這是由于原油是由多種不同沸點的烴類及其他物質組成的混合物,常減壓蒸餾為不完全精餾過程,在原油切割計算時存在誤差,導致產品TBP 曲線與原油TBP 曲線有很大差異。在重切割組分中相鄰輕組分的濃度較高,導致TBP 曲線與原油TBP 曲線距離較大,由于相鄰重組分在輕切割組分中的濃度較低,輕產品的末端與原油TBP 曲線之間的距離較小[8-9]。因此,輕組分的末端和相鄰重組分的前端與原油TBP 曲線的距離并不相等,TBP 蒸餾曲線的中點不在原油TBP 蒸餾曲線上[7]。然而,大部分研究均基于兩個等距假設:(1)相鄰產品的末端與前端點與原油蒸餾曲線等距;(2)產品蒸餾油曲線的中點位于原油蒸餾曲線上。由于實際過程不滿足此等距假設,建立不基于此假設條件的產品TBP 預測曲線具有現實意義[10]。

圖1 常減壓裝置Fig.1 Example crude distillation unit

圖2 常減壓裝置原油切割曲線Fig.2 Crude distillation cutting curve for crude distillation unit
常減壓裝置機理模型能夠準確預測常減壓裝置(CDU)產品收率和性能,Boston 等[11]對精餾塔進行嚴格的塔板間的模擬,是當今預測寬沸點混合物蒸餾過程的基礎,Svrcek 等[12]利用硫含量等特性曲線以及偽組分的混合預測除實沸點曲線外的產品性質。除大規模方程組模型(10000 個方程或更多)來模擬常減壓蒸餾過程,也提出了簡化常減壓裝置模型。Brooks 等[13]介紹了固定收率模型,通過預先設定蒸餾物切點,得到固定產量的各蒸餾組分,但是存在切點設置是否最優的問題。根據原油性質、工藝約束和營銷策略等條件定義幾種操作模式,每一種模式都有一組預定的切點,切點設置來自先前生產設置的經驗。Zhang 等[14]介紹了傳統的懸擺切模型,并應用在對于相鄰切點之間具有相同實沸點組分的擺動上,Li 等[15]針對傳統的懸擺切模型存在的問題,改進懸擺切的尺寸以及切割組分的性質,以原油平均累積產量變化為基礎,考慮了每種切割產品的重量轉移比,來改進懸擺切的尺寸,同時基于原油性質的回歸模型來計算常減壓蒸餾過程各餾分的辛烷值、API 比重等。Guerra 等[16-17]應用此改進的懸擺切模型改進了具有多個工藝單元和產品混合物的中型整體煉油規劃模型。Menezes 等[18]為了提高傳統懸擺切模型的精度,把每個懸擺切組分切割成輕組分和重組分來更好的預測蒸餾產品的體積和質量。除上述固定收率模型和懸擺切模型等線性模型外,近幾年提出了簡單的非線性模型應用于常減壓建模的計劃優化中,Alattas 等[19]應用非線性規劃方法預測單期煉廠運行計劃問題,利用分餾指數改進精餾過程的準確性,推導出了一種近似非線性原油蒸餾模型,該模型采用指數逼近的方法,并提出了在不同操作條件下對原油蒸餾指標進行調整的建議。Fu 等[20]利用偏最小二乘(PLS)的方法,搭建了一種應用到計劃、調度和實時優化的原油蒸餾單元(預閃蒸、常壓和減壓塔)的混合模型,從而消除了在決策過程中模型之間的差異,同時該模型不再基于等距假設,改進了之前的模型對產品TBP的預測不夠準確的特點。同時Fu等[21]認為不準確的CDU 模型可能導致煉油作業的成本有很大差異。并通過實驗驗證表明在煉廠的優化模型中使用精確CDU 模型可以獲得可觀的經濟效益,體現了搭建高精度模型的必要性。
本文提出了一種預測常減壓裝置主要分餾產品實沸點(TBP)曲線的建模方法,針對常減壓裝置機理模型方程多,非線性程度高、不易收斂等問題,同時考慮到現有的常減壓蒸餾過程懸擺切割模型精度不夠,且產品實沸點曲線預測不準確,本文在數據建模的基礎上提出常減壓裝置TBP 關系模型,(1)考慮到輸出產品TBP不僅與原油的TBP、流量、溫度以及塔爐、冷凝器溫度等條件相關,同時考慮可以利用輸出各百分比TBP 的相關性,通過構建二次項來表征輸入輸出間的非線性關系,(2)本模型的結構形式通過對非線性方程組求解,得到結構簡單且滿足精度要求的TBP 預測模型,將該模型成為多輸出相互關系模型,并將該模型應用到煉廠計劃優化中,并與傳統懸擺切割模型對比。
為預測常減壓裝置各產品TBP 曲線,在建立回歸模型中,預測包括初餾塔Light、Naphtha 組分,常壓塔HNaphtha、Kerosene、Diesel、AGO 組分,減壓塔LVGO、HVGO 組分在內的TBP 曲線,除了與原油TBP、原油混合比、常減壓塔的爐溫、蒸汽流量等特征相關,產品組分TBP 還與相鄰百分比TBP 存在相關性,與傳統的回歸模型不同的特點在于預測產品某一百分比TBP 時,將產品相鄰百分比的TBP 也作為特征,同時加入二次項、交叉項,模型結構如圖3所示,模型如式(1)所示:

TBPij是常減壓裝置i產品j百分比實沸點,其中常減壓裝置產品i 包括初餾塔Light、Naphtha 組分,常壓塔HNaphtha、Kerosene、Diesel、AGO 組分,減壓塔LVGO、HVGO 組 分。fij函 數 用TBPa、Tb、Fc和Rmix-ratio各特征表征實沸點TBPij,QAP為常壓裝置中段回流熱負荷。gij函數用TBPPFfeed和TBPie來表征TBPa,TBPPFfeed是原油實沸點曲線,TBPie為常減壓裝置i產品e百分比實沸點曲線,為TBPij的相鄰百分比TBP。hij函數用TPFfurn(初餾塔再沸器溫度)、TPFcond(初餾塔冷凝器溫度)、TPFfeed(原油進料溫度)和TPFstr(初餾塔蒸汽溫度)來表征Tb,yij函數用FPFfeed(原油進料流量)、FAPstr(初餾塔蒸汽流量)和Fss1(側線蒸汽流量)來表征Fc,Rmix-ratio是原油混合比,TBP2a為TBPa二次項,但在構建二次項、交叉項以及特征選擇方面具有一定的隨機性,并非所有的項均是有效特征,因此需要篩選有效特征,簡化模型復雜度。

圖3 TBP模型結構Fig.3 Model structure of TBP
本文利用隨機森林[22-23]進行特征選擇,特征選擇主要通過一系列規則,判斷特征重要程度,特征子集相比于原特征集合要小,通過篩選出無關特征減小模型復雜度,提高數據分析效率。隨機森林特征選擇的主要特點:(1)決策樹的生成通過選擇部分樣本及特征,部分程度避免過擬合情況;(2)決策樹的生成隨機選擇樣本和特征,抗噪能力強,性能穩定。
針對上述模型特征結構的篩選步驟如下:
(1)采用Bootstrap抽樣從數據集中抽取N個訓練集,每個訓練集的大小約為原始數據集的2/3,由此訓練集建立分類回歸樹,產生由N 棵決策樹組成的隨機森林;
(2)從式(1)的TBPPFfeed、TBPlight,j、TPFfurn、TPFcode、TPFfeed、TPFstr、FPFfeed、FPFstr及其二次項交叉項等M 個特征中隨機選擇m 個特征,以內部節點Gini 系數最小原則來進行每棵樹的訓練;
(3)對N 棵決策樹組成的隨機森林對數據集中未參與訓練的數據回歸,針對變量重要性的評估問題,采用袋外數據誤差計算式(1)中M 個特征的重要性,根據袋外數據誤差計算隨機森林中每個決策樹的袋外誤差,然后隨機改變袋外數據式(1)中M 個特征中的某一特征,并計算新的袋外誤差,最后特征的重要性由式(2)表示:

特征的變化引起的袋外誤差增加越大,精度減少得越多,說明該變量越重要。因此本文根據隨機森林算法的特點,對式(1)的所有特征排序,可得到各個特征對結果預測的貢獻,刪除掉得分較小的特征,以此來簡化模型。
通過特征選擇,得到簡化回歸模型,以light 組分TBP95為例,見式(3):

式中,aij、bij、cij和dij為公式參數,在實際建模過程中,當預測TBPlight,95時,式(3)回歸模型中的特征TBPlight,s、TBPlight,e均未知,因此,在預測TBPlight,95時,將特征TBPlight,s、TBPlight,e作為未知變量,將TBPa、Tb和Fc公式代入TBPij公式中,將未知變量的參數設為bij,特征變量參數設為aij,以示區分,得到式(4):

依據上述TBPlight,95推導過程,同理可完成TBPlight,j,j = 0,5,10,30,50,70,90,100 的 推 導 ,將[TBPlight,0,TBPlight,5,…,TBPlight,100]構建方程組,等式左邊為包含未知變量的公式,右邊為包含TPFfurn(爐溫)、TBPPFfeed(原油TBP)、TPFcode(冷凝器溫度)等已知變量的公式,把所有的模型聯立起來,得到如下的方程組:

式 (5) 為 關 于 TBPlight,j、TBPlight,i、(TBPlight,i)2、TBPlight,s× TBPlight,e等一次項和二次項的非線性方程組,通過方程組求解器求解得到向量的值。與混合模型[7]的模型結構對比,如式(6)所示,該模型結構通過產品TBP 間的相互關系構建方程組模型,求解聯立的方程組可得到預測組分所有TBP 的值,混合模型則是通過分析各百分比TBP 的不同非線性程度分別搭建模型,對TBP 曲線中段搭建線性模型TBPij,前段和后段添加非線性項TBPdij。從表達形式上,本方法綜合考慮切割產品的實沸點(TBP)與原油TBP、流量、溫度等變量影響,構建非線性方程組模型來表征輸入輸出間的關系,并利用特征選擇方法遴選相關變量(包括進料性質、相鄰TBP 及其二次項等),表達形式更加簡潔。

利用式(5)所示構建方程組的形式描述輸入輸出間的關系,用機理模型數據對模型進行訓練,得到方程組模型存在偏差,若直接對方程組求解,由于等式兩端存在偏差且需把部分變量當作未知變量,導致求解結果不夠精確,因此利用鯨魚優化算法對式(5)的矩陣B與常數項b進行參數優化。
2.2.1 鯨魚優化算法 鯨魚優化算法(whale optimization algorithm, WOA)是Mirjdlili 等[24]提 出 的一種新的群體智能優化算法,其優點在于操作簡單,調整的參數少以及跳出局部最優的能力強[25]。主要步驟如下:
(1)包圍獵物 座頭鯨在狩獵時要包圍獵物,個體與獵物間距離的數學模型如下:

式中,D 為當前個體與獵物間距離,X*(t)表示當前最優的鯨魚位置向量,X(t)表示當前鯨魚的位置向量,A和C為向量系數,由式(9)、式(10)得出

式中,a 在[0,2]范圍內迭代線性下降,r為[0,1]隨機變量。
(2)狩獵行為 根據鯨魚和獵物的位置建立螺旋運動方程,將狩獵行為的描述成如下數學模型:

式中,Dp= |X*(t) - X(t)|表示最優的鯨魚位置和獵物(當前最優解)距離,X*(t)表示當前最優的鯨魚位置向量。
鯨魚以螺旋形狀游向獵物的同時還要收縮包圍圈,根據此兩種行為,其數學模型如下

式中,pi是(0,1)中的任意值,取0.5。除此以外,鯨魚還會隨機搜索獵物。
(3) 搜索獵物 在搜索獵物時,其數學模型如下:

式中,Xrand是隨機位置向量,算法設定當|A|≥1時,使WOA算法能夠進行全局隨機搜索。
2.2.2 目標函數 本優化算法以目標函數適應度值最小為原則,目標函數為該產品TBP 的預測值與真實值的均方根誤差,通過判斷是否達到最大循環迭代次數為循環終止條件,在模型矩陣參數優化中,目標函數定義為:

為了對初餾塔、常壓塔和減壓塔的產品組分TBP進行預測,由于工業現場采集數據較困難,存在測量不準,物料不平衡,有大量異常值缺失值的問題,本文利用Aspen plus[26]來采集樣本數據,流程圖如圖4所示。樣本采集采用拉丁超立方抽樣的方法選取樣本點,得到1200組數據,建模過程用其中900組數據作為訓練樣本,300組作為測試樣本。
以TBPlight,95(light 組分TBP95)組分為例,通過隨機森林的式(2)得到各個特征權重如表1所示,從表1中可以看出,對light 組分變量TBPlight,95影響權重最大的為該組分相鄰百分比TBPlight,s, s = 70,90,TBPlight,e, e = 100及其二次項和交叉項,TBPPFfeed,s對產品性質影響次之,同時TPFcond、TPFfurn等裝置的操作變量、FPFfeed和Rmix-ratio對產品預測也有較大影響,并根據此來預測篩選掉(TBPlight,e)2, e = 0,5,10,30,50 等不相鄰組分的二次項,等原油重端實沸點,TPFfeed、TPFstr等進料溫度影響不大的特征。

表1 隨機森林算法選出的權重排序特征變量Table 1 Weights sort features by Randomforest

圖4 常減壓裝置流程圖Fig.4 Crude distillation cutting curve flowsheet

圖5 PF-Light組分參數優化Fig.5 The parameter optimization of PF-Light
經過特征選擇篩選輸入輸出變量及其二次項和交叉項,然后將模型構建成方程組模型的形式并利用優化算法對模型參數進行優化,以PF-Light(初餾塔輕組分)TBP 模型為例,式(5)中A 矩陣的常數項參數變化曲線如圖5 所示,參數的變化趨勢大體一致,在200次迭代以后參數的變化趨勢與之前相反,可見優化算法跳出局部最優,尋找到更優的參數。將優化過的參數應用到方程組模型公式(5)中,以此得到預測產品PF-Light(初餾塔輕組分)TBP 曲線的最終的模型。
常減壓裝置的建模過程包括以機理模型的采樣產生數據集,利用采樣數據集構建回歸模型,針對模型中的一次、二次項特征進行特征選擇,簡化后的模型構建方程組,并通過鯨魚優化算法優化參數。接下來,將以機理模型的采樣產生的數據作為標準,由于目前常減壓裝置的模型大部分為線性模型,同時式(6)的混合模型[7]為目前常減壓裝置兼顧計算效率與預測精度的最優模型,將該模型的精度與線性模型、混合模型結果對比,以平均絕對百分比誤差(mean absolute percentage error,MAPE)作為評價指標,其中MAPE表示為式(16):

從圖6 可以看出,多輸出相互關系模型預測結果在TBP 曲線中段更接近機理模型的TBP 曲線,在前段和末端與混合模型差距較小,經分析,本模型采用方程組的形式,統一對所有預測變量求解,并通過相鄰TBP 間相互表征,使得預測精度更高。而混合模型對TBP 曲線中段采用線性模型,對前段和末端添加非線性項,模型預測精度不夠。從表2 的平均絕對百分比誤差此衡量指標明顯發現,本模型誤差要明顯小于線性模型和混合模型,以PFNaphtha各百分比TBP對比為例,本模型建模結果的平均絕對百分比誤差比混合模型平均絕對百分比誤差降低了3.4 個百分點,比線性模型降低了4.8 個百分點,可見,該模型在預測產品TBP 曲線時更加精確。

圖6 組分TBP預測對比Fig.6 Compared with hybrid model result and true result
經分析,在建模特征選擇上,混合模型[7]在建模過程中加入切點溫度、每種組分的累計切割寬度,進料密度、汽化熱,組分比熱容等特征來進行建模,本文所述方法則在預測產品的某一TBP 曲線時,不僅關聯原油的TBP、流量、溫度以及塔爐、冷凝器溫度等條件,同時考慮利用輸出各百分比TBP 的相關性,通過構建二次項來表征輸入輸出間的非線性關系,提高模型精度。此外,混合模型需要先對產品的TBP 進行線性預測,再對前后端的非線性部分進行補全,不能有效保證模型精度;多輸出相互關系模型的結構形式通過對聯立方程組求解,可同時得到方程組內所有未知變量值,并利用鯨魚優化算法進一步優化參數,求解方便,收斂性好且精度更高。
煉廠生產計劃的目標為生產利潤最大化,傳統的煉廠生產計劃為線性模型,存在無法修正反饋煉廠生產過程,預測精度不夠等問題[27-28],故本文將搭建的非線性常減壓模型應用到煉廠計劃優化中,并與傳統懸擺切割模型對比,在保證模型收斂性和求解效率的基礎上,提升計劃優化的準確度,同時提高系統對擾動的快速估計,以及對目標的無差別調節[29-30]。
本計劃優化模型涉及裝置為常減壓裝置和催化重整裝置,常減壓裝置生產得到的石腦油,作為催化重整裝置二次加工原料,經催化重整加工得到高辛烷值汽油和芳烴。本計劃優化模型的目標函數為

本目標函數為驗證多輸出相互關系模型在計劃優化中的應用,故簡化計劃優化過程的復雜度,約束混合原油在進入常壓裝置的流量以及常壓裝置用于側線產品的比例是固定的,此約束可使得混合原油進料量和TBP 與側線產品直接相關,α 為固定比例,取值0.8。FRG為普通汽油產品流量,FPG為優質汽油產品流量,此兩類產品由催化重整裝置生產。FKer、FDie分別為煤油和柴油常壓裝置側線產品流量。CRG、CPG、CKer、CDie為各側線產品價格,Coil1、Coil2為兩種原油價格,原油和產品價格見表3,FPFfeed為混合原油進料量,Rmix-ratio為兩原油混合比例。QAPfur為常壓裝置中段回流熱負荷,MMBtu·h-1(百萬英熱每小時);單位功耗費用為5.395× 103USD,CCR為催化重整過程的操作費用,為2.6 USD·bbl-1[1 bbl 代表1桶,1 bbl=137 kg(全球平均)],與FHnaphtha(石腦油組分流量)相關。

表3 產品和原油定價[15]Table 3 Product and crude oil price

表4 決策變量約束Table 4 Decision variables constraints
針對式(17)目標函數的計劃優化問題,采用IPOPT 求解器求解,將求解得到的計劃排產結果中各產品收率和石腦油的實沸點曲線與懸擺切割模型尋優結果對比,產品產率和產品TBP 曲線對比分別如表5 和表6 所示。本文將同操作條件下的Aspen 模擬結果看作為實際值,用來驗證基于本文常減壓模型的計劃模型的準確性。
從表5 產品產率和表6 的實沸點曲線對比看出,針對多種側線組分,本文計劃模型一方面可以平衡各產品產率,生產出價格更高的產品普通汽油(RG)和優質汽油(PG),證明了非線性模型的優勢。另一方面,與Aspen模型結果對比,本文計劃模型獲得的產品收率和實沸點曲線更接近相同操作條件下的實際結果。因此,當其作為二次原料進入催化重整裝置時,對優質汽油和普通汽油的產量預測更準確。由表4 的決策變量約束以及表7 決策變量前后變化的結果看出,原油1 定價更低,在混合比0.2∶0.8 情況下,可生產更多普通汽油,故原油配比優化為0.2∶0.8,同時常壓裝置中段回流熱負荷能優化到最低。基于上述原因,本模型與傳統懸擺切割模型在計劃優化中的對比,利潤平均提高5×104USD。

表5 產品產率對比Table 5 Product yield comparison

表6 AP-HNaphtha實沸點對比Table 6 AP-HNaphtha TBP comparison

表7 決策變量前后變化Table 7 Before and after changes in decision variables
本文提出了一種考慮相鄰TBP 性質的常減壓模型,利用輸出變量相鄰百分比TBP 的相關性,通過構建二次項來表征輸入輸出間的非線性關系,以此搭建常減壓模型,通過隨機森林算法進行特征選擇,篩選相關性高的特征,利用鯨魚優化算法優化模型參數,提高模型精度。此常減壓模型不僅表示相鄰TBP 的相互關系,而且利用相鄰TBP 來相互表征,可降低模型復雜性,在后期通過求解方程組即可求得其值。
多輸出相互關系模型一方面可解決常減壓裝置機理模型方程多,非線性程度高,不易收斂等問題,另一方面解決現有的常減壓蒸餾過程的建模過程中懸擺切割模型精度不夠、產品實沸點曲線預測不準確的問題,并將煉廠生產計劃中的多輸出相互關系模型與傳統的懸擺切割模型對比,得到模型生產利潤結果。