田 旺, 秦 康, 胡元沖, 褚小立, 李明豐
(中國石化 石油化工科學研究院,北京 100083)
石油是一種儲量有限且十分寶貴的能源,對國民經濟的發展具有重要的戰略意義。充分挖掘石油的價值,將其高效利用,一直是石化行業研發人員關注的熱點問題。對石油產品而言,其分子組成決定其物理和化學性質,也決定了其應用市場、價值。因此,為了合理利用石油資源,提高其在石油煉制領域的加工和轉化效率,獲得高價值的石油產品,有必要認識石油的分子組成信息,進而有針對性地為煉油過程開發出相應的催化劑和煉化工藝。
石油是由大量烴類和非烴類組成的混合物,不僅分子種類眾多,而且存在較多的同分異構體,想要弄清其分子結構,十分困難。盡管如此,無數分析工作者做出了大量的努力,開發出多種色譜和高分辨質譜技術,對石油分子結構的認識逐漸深入。結合一系列分離技術,通過全二維氣相色譜質譜(GC×GC/MS)、氣相色譜-質譜聯用儀(GC/MS/MS)、氣相色譜飛行時間質譜(GC/TOF MS)以及傅里葉變化離子回旋共振質譜(FT-ICR MS)等分析手段,能得到烴類、非烴類化合物等石油餾分按碳數分布或者沸點分布的信息[1]。但是,即使是目前最先進的分析技術,依然無法獲取石油中汽油以上餾分的詳細分子組成。為了在現有分析數據的基礎上,仍能得到必要的分子組成信息,經過大量研究發現[2-4],石油中分子結構基團以同系物的形式存在,并且呈現一定的分布規律。這一特點,一方面使輕餾分中結構基團的分布規律可以延伸到重餾分中;另一方面使重餾分中龐大數量的分子可以進行合理的歸類和集總,使歸類后的分子集在模型構建中的應用成為可能。研究人員將石油結構基團的分布規律和先進的數學工具結合,開發出了石油分子重構的技術路線。
石油分子重構技術是一項化學與計算機模擬相結合的技術,基于石油各餾分性質與其化學分子組成息息相關的理論,根據石油餾分有限的分析數據,構建虛擬分子集,該分子集的組成與結構信息由合適的計算機方法表示,在不損失關鍵組分和結構信息的前提下,盡可能壓縮分子集的規模,以便于過程模型開發和物性預測[5]。整個建模過程關鍵在于3個方面:一是選擇表示石油中大量復雜分子的方法;二是準確計算各類石油分子的物性,以及選取合理的混合規則確定石油餾分的宏觀物性;三是以已有的分析數據作為目標函數,通過優化相關參數,對石油分子組成進行合理和準確的定量計算,實現從石油餾分物性到分子組成的轉變。
石油分子重構技術大致可以分為2部分:石油分子的表示方法和石油分子組成的構建方法。石油分子的表示方法主要有:鍵電矩陣法、結構導向集總法、結構單元耦合原子拓撲矩陣、分子同系物矩陣法、偽化合物矩陣法、狀態空間表示法。石油分子組成的構建方法主要有:隨機重構法、最大信息熵法、隨機重構-最大信息熵法。
鍵電矩陣是基于有機化學反應本質上是官能團反應提出的,而官能團發生的反應大多可從文獻上查到。Core[6]首先提出了利用計算機來輔助構造復雜化合物的路線,將化合物分子以二進制的方式存儲于計算機中,并為化合物的反應路徑制定了編寫規則。Ugi等[7-9]認為分子可以由原子、化學鍵、電子組成,由此提出了鍵電矩陣,而化學反應可由反應矩陣表示,鍵電矩陣和反應矩陣可以作為編寫計算機程序的基礎。Horton等[10]將該方法用到石油分子的表示中,并定義了反應矩陣表示分子的操作,官能團拼接由矩陣加法完成,斷鍵操作為-1,成鍵操作為+1,其具體形式如圖1所示。鍵電矩陣法將各種化合物存儲于計算機中,通過合理編寫反應路徑,使化合物合成路徑的網絡構建以及不同化合物之間的化學反應預測成為可能。

圖1 分子反應矩陣[10]Fig.1 Molecular reaction matrix[10]
結構導向集總(SOL)法最早由Quann和Jaffe[11]于1992年提出,即用少部分簡單的結構單元來表示化合物的組成。他們引用基團的概念,選取22種結構基團來描述化合物的分子結構,用這些結構基團的組合向量來表示石油分子。其中,包括3個芳烴結構基團(A6、A4、A2)、6個環烷結構基團(N6、N5、N4、N3、N2、N1)、1個—CH2—側鏈(R)、2個異構側鏈支點(br)和環上的甲基(me)、1個代表不飽和度的氫基團(IH)、1個聯苯間的橋基團(AA);另外還有2個硫基團(NS、RS)、3個氮基團(AN、NN、RN)、3個氧基團(NO、RO、KO)。結構基團如圖2所示。

圖2 結構基團示意圖[11]Fig.2 Schematic diagram of structural groups[11]
為了將結構基團表示化合物的方法用于油品的宏觀物性預測,Ghosh和Jeffe等[12]首先利用SOL法的思想,將氣相色譜法得到的57個碳氫化合物結構基團與汽油辛烷值關聯起來,建立了汽油辛烷值預測的通用模型。隨后,Ghosh等[13]根據相同的思路,建立了柴油十六烷值預測的通用模型。SOL法也適用于分子動力學模型,紀曄等[14]提出了一種基于結構導向集總的催化重整過程建模方法,能夠從分子水平描述催化重整裝置原料分子到產物分子的轉化過程。該方法使用352種原料分子,17條反應規則,建立反應網絡,包含中間產物和產品共533種分子,共有分子反應轉化路徑617條。對于不同的工況,產品分子組成的模型預測,其平均相對誤差均小于3%。Nguyen等[15]建立了基于SOL法的輕瓦斯油加氫脫硫(HDS)的集總動力學模型。該模型包含16個結構基團,以這些基團為基礎建立的模型,能預測出反應溫度范圍為200~375 ℃的輕瓦斯油加氫脫硫反應從原料輸入到產品輸出過程的分子結構類型的變化。最初的SOL法主要用于表示輕油的分子結構。Kumar等[16]針對VGO(減壓蠟油)的分子組成特點,按其特征分為16個基本結構,在此基礎上,將帶有甲基側鏈的異構體劃分為45個亞類,基于化學反應動力學方法,建立了加氫裂化分子反應動力學模型。
為了使該方法推廣到渣油分子結構的表示中,Jaffe等[17]在原有22個結構基團的基礎上,對瀝青質的群島結構基團進行了大量的擴展,加入了Ni、V等結構基團,將其應用到了減壓渣油分子的表示中。倪騰亞等[18]采用SOL法對渣油餾分進行分子重構,設計了21個結構單元來表示烴類結構、雜原子結構及重金屬結構,用55類結構向量來表示2791種典型的渣油分子。采用模擬退火算法計算渣油的分子組成,使烴類組成信息和平均分子結構參數的計算值與分析測定值差異最小,構建了SOL法的渣油分子組成計算模型。模擬結果表明,渣油的殘炭、密度等性質參數,以及芳碳率、芳環數等結構參數的計算值與實驗測定值吻合較好。Tian等[19]以SOL結構向量為基礎,假設渣油分子由92種單核種子分子和46種多核種子分子組成,以7004個結構基團表示各種不同的渣油分子,構建了延遲焦化產品分布預測模型,模擬結果表明,產品液體收率與反應溫度、原料的H/C比和循環油量與新鮮原料油量的比值有關。
Yang等[20]針對傳統集總法的不足,提出了一種基于結構導向集總(SOL)法和蒙特卡羅(MC)相結合的方法來模擬催化裂化(FCC)汽油的二次反應過程。他們采用SOL法來表示原料和產品的分子結構,并建立了60余項反應規律,得到了FCC汽油的所有二次反應網絡。又由蒙特卡羅積分法計算各分子的反應概率,得到產物的分布。以中國工業催化裂化裝置的3個催化裂化汽油樣品為模擬對象,驗證了所提方法的有效性。
He等[21]為了解決SOL法機理模型復雜度高、計算效率低的缺點,提出了一種混合建模的方法。即采用CatBoost算法構建數據模型,彌補簡化SOL機理模型造成的精度損失,結合機理模型,既保證了預測的準確性,又大大縮短了計算時間。對某MIP裝置產物的產量和產率進行了預測,結果表明,模型在保證預測精度的同時,其計算時間大幅減小。
邱彤等[22]為了實現石油煉制全過程的分子管理,基于SOL法中對分子的表示方法,提出了一種新的石油餾分分子重構模型。該模型選取22個結構特征參數來表示石油餾分,通過蒙特卡羅模擬產生虛擬分子,最后用最大信息熵的思想優化調整虛擬分子的含量,建立的模型既能在宏觀上預測石油餾分的物性,又能在微觀上確定石油餾分的分子含量。
雖然用結構基團可以直接計算各分子的元素組成和相對分子質量,從新的結構基團出發也可關聯計算出各分子的沸點和相對密度等物性參數,但隨著分子尺寸的增大,這種方法不再使表示分子的結構向量與該分子一一對應,為此研究者提出了一些約定條件,簡化構建分子的復雜性,取得了不錯的效果。總體來說,SOL法較好地表示了石油分子的結構特征,而且本身具備擴展性,是一種較為合理的分子重構方法。
石油中較重的分子往往含有一些雜原子,這些雜原子與復雜的核心原子和側鏈結構相連,形成雜原子結構向量及雙鍵的位置可能各不相同,使傳統的結構導向集總法不能明確表示。為了減少分子物性數據計算及反應位點的識別錯誤,建立結構單元與鍵電矩陣的準確映射,使石油分子結構的生成更加方便,中國石油大學(北京)分子管理課題組結合鍵電矩陣和結構導向集總的特點,開發出了結構單元耦合原子拓撲矩陣。該課題組Chen等[23]對SOL法進行擴展,并將擴展后的結構單元分為核心結構單元和側鏈結構單元2類,這些結構單元被稱為CUP結構單元,如圖3所示。該表示方法被用于建立催化裂化油漿在滴流床加氫處理裝置中的分子反應動力學模型,模型包含5753個分子和15830個反應網絡,模擬后的結果表明,產品性質的預測結果與實際值吻合較好。隨后,該課題組Liu等[24]選擇CUP結構單元中的部分結構,建立了汽油分子結構與其辛烷值的關聯模型。Cai等[25]以CUP結構單元為基礎選出15個結構基團、20個聯合基團以及相對分子質量作為化學特征量與烴類化合物的黏度進行關聯,基于人工神經網絡,建立了定量結構-性質的關聯模型,該模型能準確預測純碳氫化合物在不同溫度下的黏度。

A6—A six carbon aromatic ring; A4—A four carbon aromatic ring; A2—A two carbon aromatic ring;1,2 represents the number of structure group.圖3 CUP結構單元劃分和實例[23]Fig.3 Division of CUP structural units and instance[23](a) Core structural unit; (b) Side face structural unit; (c) CUP structure unit representation ofphenol containing 4-ring aromatic ring and its combination logic
在鍵電矩陣的基礎上,結構單元原子耦合拓撲矩陣實現了CUP結構單元與鍵電矩陣的映射,有利于分子結構的繪圖,并獲得分子的通用化學標記語言和通用分子存儲格式文件[26],以芘分子的生成為例,如圖4所示。

圖4 芘單分子的多層次構建流程[26]Fig.4 Multilevel construction process of pyrene monolecule[26](a) Structure unit string; (b) Structural element vector; (c) The bond electric matrix of different elements;(d) Atomic connection information table; (e) Eommon chemical markup language information code;(f) Image generation; (g) Calculation of physical and properties
結構單元原子耦合拓撲矩陣不僅有利于調用分子物性預測模塊進行分子的物理化學性質預測,而且容易將分子連接到分子模擬或流程模擬軟件中,是一種較為合理的石油分子表示法。
1999年,英國曼切斯特大學的Peng[27]提出了用分子同系物矩陣(MTHS)法來表示石油餾分的方法。該方法中,矩陣的行數代表該類型分子的總碳數,矩陣的列代表不同的分子類型,行與列的交叉處代表該類型碳數的分子占總分子的質量/摩爾分數,同種類型的分子碳數分布符合Gamma分布。如圖5所示。
MTHS法有2個應用步驟:一是模型分子信息矩陣的建立,根據不同石油餾分所對應的碳數分布范圍和所含分子結構特點確定;二是物性數據的傳遞和優化。將MTHS中烴類分子的物性數據,通過混合規則計算出石油餾分的宏觀物性,與對應的實際石油餾分分析數據進行比較,根據優化算法確定MTHS分子組成[28],如圖6所示。MTHS法在實際應用中,既能通過石油餾分的宏觀物性確定其分子組成,又能由確定的分子組成預測石油餾分的宏觀物性。
Zhang[29]基于Peng[27]的研究工作,將石油餾分的碳數與相對分子質量、沸點和密度相關聯,其他物性數據通過經驗關聯式由沸點和密度數據計算得到。然而,石油餾分宏觀物性的預測是基于簡化后的分子類型進行的,沒有考慮每個矩陣同系物族內同分異構體的貢獻。且由于基本假設過多,而忽視了分子結構對其宏觀物性的影響,例如,辛烷值、蒸氣壓和黏度等。因此,有必要在每個矩陣的內部對同分異構體進行劃分。Aye等[30]充分考慮到同分異構體結構對餾分宏觀物性的影響,通過設置集總規則,對同分異構體結構進行了歸類和簡化,然后利用插值法計算MTHS中餾分的分子組成,但該方法提出的結構-性質關聯式只限于輕餾分。Ranzi[31]研究發現,同分異構體矩陣內部的熱力學平衡是固定的,該規律可以用MTHS法來計算石油餾分的宏觀物性。除了同分異構體的影響,作者還創建自動選擇樣本矩陣的轉換方法,通過線性組合生成新矩陣,新矩陣的數學模型由1個目標函數和幾個約束條件組成,其作用是使MTHS法所計算出來的物性預測值與實際測量值之間的誤差最小。在計算石腦油宏觀物性時,由于物性關聯公式和混合規則均存在一定程度的誤差,使MTHS法計算出來的物性數據偏離真實石腦油物性數據的可能性變大。為了解決上述問題,白媛媛等[32]在預測石腦油宏觀物性時,以簡化后的MHTS表示石腦油分子組成,同時根據石腦油樣本的特點,對決策變量加入一些有效的約束,進一步提高模型預測的準確性。以往MTHS法的研究僅限于汽油等輕質石油餾分,并且只考慮了碳氫分子。為了將其應用擴展到中、重質石油餾分中,Ahmad等[33]利用基團貢獻法,根據石油中化合物的分子結構,通過最小化模擬值和實測值之間的差異來生成石油餾分的分子矩陣,并由MTHS法計算石油餾分中單個分子的宏觀物性;除此之外,還在MTHS的列中引入含硫和含氮同系物結構,對含硫和含氮化合物的物理化學性質和熱力學性質進行預測,使該方法能更好地應用到重油中。
隨著石油餾分變重,碳數分子規模增大,不可避免地導致同分異構體分子的數量大幅度增加,此時確定石油餾分MTHS中的分子組成將變得十分困難。為了解決上述問題,Gomez-Prado等[34]首次提出利用石油餾分沸點切割代替碳數劃分。郭廣娟等[35]根據柴油分子組成特點,以柴油沸點代替碳數劃分,建立MTHS法模型,分別對催化柴油、加氫改質柴油、加氫裂化柴油進行烴類組成預測,結果吻合較好。李洋等[36]利用MTHS法對直餾蠟油、焦化蠟油、催化蠟油進行了分子重構,得到不同烴類結構在各餾分段的分布,模型預測值與實測值吻合較好。侯栓弟等[37]針對環烷烴、芳烴結構協同關聯關系,考慮不同化學結構對蠟油烴類宏觀物性的影響,提出了27個虛擬官能團的分子重構模型。對于不同的原料而言,同一沸程對應的分子組成并不相同,由此建立的模型可能存在多解,導致了模型的泛化能力受到限制。Liu等[38]改變了MTHS的表示方法和變換方法,在碳數行中嵌入偽組分及其化學信息,使得改進后的MTHS很容易地擴展到較重的組分,在保證精度的前提下,極大地提高了模型的可用性。Wu等[28]利用改進的MTHS法對汽油和柴油進行分子組成模擬,在計算模型的分子組成時引入了分布函數的思想,即同類型的分子含量服從Gamma分布的規律,這樣既減少了多解帶來的不確定性,又增加了計算結果的準確性。Wang等[39]提出了表征石腦油餾分分子矩陣的新方法,MTHS法中的虛擬分子由碳數相同的真實分子的同分異構體集總獲得,并用正態分布代替Gamma分布來描述分子矩陣中分子分布,結果表明,這種新型分子矩陣能夠表示更詳細的石腦油分子信息,并以較少的未知參數提高模型預測石腦油餾分宏觀物性的精度。
根據石油不同餾分的碳數分布范圍確定適宜的MTHS大小具有重要的意義。Hu等[40]以MTHS為基礎,建立了一種油品宏觀物性與分子組成互相計算的方法,針對不同的石油餾分,選擇合適碳數分布的MTHS,然后,利用這些分子信息來建立分子模型。這些模型被納入到煉油廠各裝置的整體優化中,可以用來選擇合適的原料、產品以及優化工藝操作條件。
MTHS法以常規分析得到的純物質宏觀物性數據庫和以矩陣表示的石油分子庫為基礎,用石油餾分的分析數據為預測目標,根據混合規則,選取適當的優化算法來確定石油餾分的分子組成。總體而言,MTHS法直觀地表示了石油餾分,對輕油的處理較為成功。
偽化合物矩陣(Pseudo-Compounds Matrix)法由法國石油研究院(IFP)開發,構建方式與分子類型同系物矩陣(MTHS)法相反,矩陣的不同行代表不同的同系物類型,列代表碳數,但劃分的同系物結構更復雜,將烷烴、芳烴等劃分為一環、二環、三環、四環等結構。由于其本質是根據石油餾分的特點選取有代表性的分子建立石油分子庫,所以將與偽化合物矩陣相似的建模方式一起討論。
Hudebine等[41]對比各種分子重構方法之后,開發出偽化合物矩陣,對直餾柴油、輕循環油和焦化汽油的質譜、硫形態、氮分析、密度和模擬蒸餾5個方面進行表征,構造了612種偽化合物,覆蓋28個不同的族組分,在預測黏度、十六烷值、氫含量、芳烴含量等宏觀性質方面取得了較好的精度。
Ramirez等[42]針對柴油加氫裂化裝置,選用40個分子代表原料柴油的組成,113個分子代表柴油加氫裂化產物的組成,并將這些分子導入到穩態過程仿真器(Pro/Ⅱ-Simsci)中,建立了柴油加氫裂化裝置的預測模型。對應的產品產量和其宏觀物性預測結果表明,預測值與實驗值吻合較好。隨后,他們采用由傅里葉變換離子回旋共振質譜聯用正電噴霧電離源、負電噴霧電離源以及常規標準化分析方法獲得的信息,對減壓渣油和常壓渣油進行分子水平表征,每個渣油分子由150個結構特征量表示,將渣油的整體分子結構特征和宏觀物性一一對應起來,建立了渣油宏觀物性的預測模型,以新的渣油樣品驗證了該方法的有效性[43]。
Albahri[44]利用68種純組分建立預測模型,模擬了石腦油在精餾塔上的分離過程。該模型比目前使用的表征方法具有更高的準確性。該方法操作靈活,可根據需要調整任一純組分,并可進一步用于石油餾分宏觀物性的預測。
崔晨等[45]對汽油分子進行適當的簡化,用166個分子構建了汽油分子庫,并采用模擬退火算法進行優化,通過汽油的宏觀物性反算其分子組成。采用一套催化裂化汽油的數據對模型進行了驗證,所得汽油宏觀物性的預測值與實驗值平均相對偏差小于2%,所有宏觀物性數據的平均相對偏差小于5%。
與其他重構方法相比,偽化合物矩陣法建模速度更快更精確。但其需要通過模擬蒸餾、質譜、硫化學發光氣相色譜分析檢測和氮分析等分析方法給出更多的信息;同時,受到核結構數量的限制,故其主要是針對輕、中質石油餾分的分子重構。
最近,Mei等[46]提出了新概念——狀態空間表示法。該方法根據石腦油餾分的特點,將其分為多種不同的同系物。1個系列的同系物用1個向量單元表示,所有的向量單元一起組成多維非負歐幾里得狀態空間。因此,任意1種石腦油都可以表示為狀態空間中的1個點。Mei等認為由同系物組成的向量單元兩兩正交,因此,任意石油餾分在狀態空間中都可以表示成不同向量單元的線性組合。非負矩陣分解(NMF)算法[47-49]利用向量單元預測樣品組成并消除冗余信息和測量誤差。這種表征方法減少了石油分子庫的單元數量,剩余的向量單元即構成狀態空間。與傳統方法相比,石腦油數據庫中向量單元的數量明顯減少,降低了計算成本,更適合實時控制和優化。然而,狀態空間表示法很大程度上取決于向量單元選取的完整性,也需要大量的實驗分析。目前,只應用于對石腦油的分子重構,其普適性還有待驗證。
隨機重構(SR)法的提出,基于石油分子基團分布規律的認識,考慮到這些分子基團的分布規律符合概率密度分布,可以通過隨機抽樣選出大量的分子基團來組成虛擬分子庫,并用這些虛擬分子庫來表示實際的石油餾分。該方法主要包含4個關鍵的步驟:(1)在計算機上生成一系列的結構基團框架。(2)引入概率密度分布函數來表示這些結構基團在石油中的分布。(3)以石油餾分的各種宏觀物性為目標,利用蒙特卡羅法對大量虛擬的基團進行多次隨機抽樣,如圖7所示,優化概率密度分布函數的參數,確定合適的虛擬分子庫。(4)將抽樣所得分子庫的宏觀物性數據與目標分析數據相比較,計算其數學期望、標準偏差等統計特征量,得到所求問題的近似解。
1990年,Neurock等[50]提出用SR法來模擬重油的分子組成。隨后,其所在的Klein組的研究人員[51-53]開展了一系列工作,將SR法用于石油各餾分的分子重構中,通過構建幾萬到幾十萬個虛擬分子,使石油餾分各物性概率分布函數參數保持穩定。但是,大規模虛擬分子的構建不利于當時計算機的處理。1997年Campbell等[54]根據石油餾分的分析數據,使用蒙特卡羅抽樣法對渣油中的基團分布進行抽樣,優化概率密度函數的參數,確定出原料分子庫,此時,對分子庫的宏觀物性進行核算,若模擬所得分子庫的宏觀物性和渣油分析數據差距滿足要求,則保留;若不滿足,則通過全局優化算法對分布函數進行優化,直至分子庫的宏觀物性達到要求,整個過程如圖8所示。若抽樣后所得分子數量過大,則根據Campbell的積分法,將分子數壓縮到幾百個,比較預測的性質數據與實驗值的差異,調整其分子的質量分數,直至獲得最優分子的最優質量分數。

RN—Random number (0—1.0)圖7 蒙特-卡羅抽樣過程[50]Fig.7 The process of Monte-Carlo sampling[50]

SARA—Saturate, aromatic, resin, asphaltene;H/C—Hydrogen/Carbon ratio;NMR—Nuclear magnetic resonance;VPO—Vapor-pressure osmometry;PDF—Probability density function圖8 隨機重構法構建虛擬分子庫[54]Fig.8 Stochastic reconstruction method toconstruct virtual molecular set[54]
Trauth等[55]對渣油體系進行了細化,按四組分進一步劃分,根據各組分的分布規律,選取相應的分布函數類型,如圖9所示。隨后,Verstraete等[56]對Trauth等的工作做了進一步的補充:以渣油為研究對象,除了劃分為四組分外,還引入了硫化物和氮化物。之后這套方法被不斷完善,形成了一套完整的計算體系,與分子動力學軟件KMT和KME整合到一起,實現了從原料到產物的性質預測[57]。

A—Core structure and additional side chains圖9 隨機重構構建渣油分子庫方法[55]Fig.9 Residue molecular set constructed by random reconstruction[55]
雖然經典的SR法在輕、中質石油餾分的應用中能夠產生合理的分子庫,但隨著餾分的變重,要得到精確的分子庫變得愈發困難。Deniz等[58]在傳統的SR法基礎上,引入了擴展的參數集,并將其應用在6種不同瀝青質分子的重構中。相比傳統的SR法,擴展的參數集使瀝青質分子重構模型的預測值與實際值的誤差下降45%~85%,并且在不犧牲生成分子組成空間的情況下提高了SR法的擬合能力。為了減少重構分子所需的時間,Deniz等[59]提出了一種基于人工神經網絡和遺傳算法相結合的石油餾分隨機重構方法。首先,利用人工神經網絡合理的確定了優化空間中初始結構參數集。然后,利用遺傳算法對初始參數集進行優化。模擬結果表明,這種混合方法在保持準確性的前提下,大幅地減少了優化參數集所需的時間。
針對重質石油餾分,要得到更為精確的虛擬分子庫,概率密度函數的分布參數的優化起著至關重要的作用。經典的優化方法需要合理確定石油餾分中分子結構的概率密度分布函數,且極易陷入局部極小值,影響了SR法的準確性,為此,一些研究者選擇隨機優化算法來解決上述問題。Glazov等[60]引入了一種算法,該算法可以根據一些重質石油餾分的統計檢驗分析數據確定哪種分析指標影響結構屬性的分布。其核心思想是根據分析數據和分布參數之間的顯著相關性,優化分布參數的取值。結果表明:不同類型的分析數據會影響重構餾分的不同參數,蒸餾曲線數據是方差分布信息的主要來源;元素分析和PNA有助于確定各種結構屬性的平均值;分子中支鏈數量的信息與13C NMR數據緊密相關。Ashraf等[61]開發了一種軟件來求解模型分布參數,使用了蒙特卡羅(MC)、最大似然估計(MLE)、馬爾可夫鏈蒙特卡羅(MCMC)、動態維數搜索算法(DDS)等10種隨機方法確定出重要的模型分布參數。結果表明,所有算法中,最大似然估計算法和動態維度搜索算法提供的參數更為可靠。
SR法通過隨機抽取一套虛擬分子來表示石油餾分,當抽取的分子數量足夠大時,可以更好地反映石油分子的組成特點。但該方法依然存在不足,一方面,隨機抽取的方式可能會組合出石油中不存在的分子;另一方面,SR法的算法執行速度較慢,對于重油餾分尤其如此。
最大信息熵(EM)最早由Shannon等[62]于1948年提出,其理論本質是根據部分分布確定信息對未知分布不確定的信息進行最合理的推斷。2004年,法國石油研究院的Hudebine等[63]將其引入輕餾分的分子重構中,形成了REM法,作為兩步法(隨機重構-最大信息熵)的第二步(詳見2.3節隨機重構-最大信息熵法),基于最大信息熵的目標函數表達式如下所示。
(1)
(2)
(3)
(4)

該方法以信息熵最大化為目標,根據油品的分析數據及其分子的混合規則,調整優化相關參數,從已經預設好的石油分子庫中確定各分子含量,具體過程如圖10所示。隨后,他們進行了一系列改進[64-67],將該方法應用到重餾分的分子重構中。

圖10 最大信息熵法流程[63]Fig.10 The process of the Entropy Maximization Method[63]
顧江華等[68]使用REM法對石腦油餾分進行了分子重構。研究中選用石腦油餾分密度、餾程數據以及詳細烴族組成數據作為石腦油樣品的物性數據,同時選用合適的方法對預定義的石腦油分子庫中分子物性進行計算,最后使用REM法確定石腦油餾分的分子含量。模擬結果表明,重構出來的混合分子的物性與石腦油餾分的物性相對誤差較小。Alvarez-Majmutov等[69]將先進的建模技術與常規的石油表征方法相結合,重構出中間餾分的分子組成。
該方法將油品分析表征數據作為輸入,根據一套化學/熱力學標準,構建出5000個代表性的虛擬分子。利用蒙特卡羅抽樣法抽取分子,并根據最大信息熵原理優化了各分子的摩爾分數。2個具有代表性的中間餾分樣品的模擬結果表明,模擬出來的中間餾分的物性和烴類組成,與對應樣品的物性分析數據和烴類組成非常接近。Pan等[70]基于最大信息熵理論,結合結構導向集總(SOL)和蒙特卡羅(MC)方法,在分子水平上模擬了催化裂化(FCC)裝置的反應原料,結構導向集總(SOL)法用于表示原料分子結構,蒙特卡羅法用于生成一個預定義的分子庫,最大信息熵法用于確定分子含量,對原料性質的模擬結果中,烷烴、烯烴、環烷烴、芳烴等主要組分的平均相對分子質量和質量分數與對應樣品實驗數據吻合較好。硫化物是石油產品中需要控制的重要指標,由于其結構復雜,不宜對其進行分子重構,Bojkovic等[71]基于REM法,依據有限的分析數據,重構出了常壓蠟油和減壓蠟油中的硫化物分子。需要指出的是,只有在傳統分析指標(如沸點、密度、PINA質量分數、總硫量和芳香硫量)的基礎上,才能準確地重構出含硫化合物的詳細分子組成。牛莉莉[72]將REM法引入對大慶原油的分子重構中,模擬結果表明,原油的碳含量、氫含量、平均分子質量、硫含量、氮含量、窄餾分收率、各組分族組成的模擬值與實驗值基本一致。
石油分子重構技術中,想要得到較為準確的分子含量,參數的優化往往是其關鍵一環。在REM法中,一般采用拉格朗日乘子的形式,將混合規則轉化為線性約束,建立滿足這些線性約束條件的最大熵判據,然后采用共軛梯度法對熵判據進行優化,以確定分子庫中每個分子的摩爾分數。Pyl等[73]比較了最大信息熵、人工神經網絡和多元線性回歸3種方法對于石腦油的分子重構,REM法在有足夠的石腦油蒸餾數據提供碳數分布信息的前提下,不僅石腦油物性的模擬精度媲美人工神經網絡,而且不易受石腦油種類變化的影響。傳統的優化算法比較經典,但訓練效率低,且容易收斂到離初始點最近的局部解。近年來,隨著各種算法逐漸被開發出來,參數的優化算法有了更多的選擇。Chen等[74]開發了一個三步重建算法,根據部分分析數據重構出一組代表性的分子。首先,對石油餾分的結構分布參數進行優化,然后利用優化后的參數確定石油餾分分子庫,最后采用REM法得到分子含量。Bi等[75]提出了一種新的分子重構方法。首先,利用自適應云模型構建了由伽馬分布趨勢、區域特征、權重特征和不確定性組成的有效概率密度函數,然后使用一種遺傳算法-粒子群算法組合的優化方法對概率密度函數的參數進行優化,確定出初始的虛擬分子庫,與其他方法相比,該新的優化方法重構出來的分子更接近實際組成。隨后,Bi等[76]采用遺傳算法-粒子群組合算法(GA-PSO),對用于原油性質預測的支持向量機(SVM)模型進行優化。優化過程和結果表明,新提出的GA-PSO-SVM方法比經典的GA或PSO方法更省時、更準確。與經典的網格搜索支持向量機模型進行比較,組合GA-PSO-SVM模型更加適合用于原油性質預測任務。
REM法根據石油餾分的分析數據,不斷調整預設好的分子庫中各分子的含量,使其模擬值和實驗值相吻合。這種方法強烈地依賴于預設的分子庫。如果初始分子庫的物性數據與所測石油餾分的分析數據差距大,求解過程就會變得困難。該方法的優點是計算迅速,缺點是前期需要做大量的分析工作。
為了減輕SR法的計算負擔,Hudebine等[63]提出了一種結合隨機重構和最大信息熵的建模方法,這種新方法稱為隨機重構-最大信息熵(SR-EM)法。在此兩步法中,第一步是通過SR法生成等摩爾混合物作為初始分子庫。第二步,將限定的線性約束條件調整到最大熵判據的公式中,構建最大熵判據。選取相應的算法并調整初始分子的摩爾分數,使與約束相關的信息熵最大化,求得熵判據的最大值所對應的分子摩爾分數即為最終結果,SR-EM法的流程圖如圖11所示。Hudebine等[63]將SR-EM法應用到輕循環油(LCO)分子重構中。首先,通過SR法獲得5000個等摩爾分數的分子;然后,在第一步得到的5000個初始分子庫的基礎上,結合LCO的分析數據,使用EM法確定最終代表分子的摩爾分數。

SR—Stochastic reconstruction; EM—Entropy maximization圖11 隨機重構-最大信息熵法流程[63]Fig.11 Flow diagram of the SR-EM method[63]
Verstraete等[64]用兩步法實現了減壓蠟油的分子重構,模擬得到的混合分子的物性與真實樣品的物性非常接近。其后,Verstraete等[56]將SR-EM方法擴展到渣油餾分的分子重構中,設計了適合渣油餾分結構屬性的分布圖和結構圖,不僅能表示渣油餾分中的碳化物、氫化物、硫化物結構,而且能表示氧化物和氮化物結構。Oliveira等[77]構建了兩步程序來模擬LCO柴油加氫處理過程, SR-EM法被用于表示第一步的原料,隨后,對SR-EM法進行擴展,使其應用到減壓渣油中。首先,通過SR法獲得一組預定義的分子庫;其次,通過EM法得到分子庫中分子的摩爾分數。SR-EM法的有效性在8個減壓渣油樣本中得到了驗證[78]。緊接著,Oliveira等將SR-EM法應用于減壓渣油加氫處理動力學模型中,利用重構出來的分子庫表示原料,從而克服了減壓渣油分子細節的缺乏[79]。Alvarez-Majmutov等[80]將傳統的SR-EM法與先進的石油表征方法(GC×GC-FID,GC×GC-SCD)結合起來,在分子水平上獲得中間餾分和減壓餾分的分子組成,并進一步開發出減壓蠟油加氫裂化分子水平的結構-反應模型[69,81]。
盡管SR法和REM法都可以作為獨立的方法來構建石油分子,但是每種方法都有其局限性。SR-EM方法克服了這2種方法的缺點。單獨使用SR法時,會將分子結構基團的重復抽樣和迭代放置在優化循環中,這使SR法的計算量很大。單獨使用REM法時,計算量要小得多,但是,這種方法在很大程度上依賴預設好的分子庫,如果初始分子庫的物性數據與實際樣品的分析數據相差較大,則容易導致優化后計算出來的個別分子摩爾分數很大,而大部分分子的摩爾分數為零。SR-EM方法不僅避免了SR法對分子結構基團的重復抽樣,而且還為REM法提供了可靠的分子庫,既大大減輕了計算負擔,又保持了良好的準確性。
雖然不同的石油分子重構方法的表現形式、建模過程和解決方法可能各不相同,但每種方法基本上都要經過6個步驟:分子庫的建立;獲取純組分的物性數據;混合物宏觀物性的計算;建立目標函數;優化相關參數;調整分子的摩爾分數。圖12為整個石油分子重構步驟的流程示意圖。

圖12 石油分子重構方法[82]Fig.12 The petroleum molecular reconstruction method [82]
混合規則被用來計算混合物的平均宏觀物性,石油餾分表征獲得的物性數據用于建立目標函數。此外,還需要選取相應的算法,優化相關參數,調整分子庫中分子的摩爾分數,使得石油餾分的模擬值與目標值的差異最小。目前,各種石油分子重構方法已被成功地應用于石油加工過程中,但仍有一定的改進空間。縱觀石油分子重構方法的發展歷程,早期的文獻主要關注模型對石油餾分宏觀物性的預測誤差,近期的文獻更加關注石油餾分分子組成的模擬精度。值得注意的是,預測石油餾分的宏觀物性往往比預測分子組成的準確性好。
總體而言,石油分子重構技術主要分為石油分子的表示方法和石油分子組成構建方法2個過程。其中,鍵電矩陣法通過矩陣來表示原子的連接方式,比較簡單直觀,但是隨著相對分子質量的增大,所需矩陣的維數也隨之增大。尤其對于重油組分,大的分子數目和相對分子質量會極大地消耗計算機的內存。此外,對于多環化合物,環與環之間重合連接處、原子與原子連接處的表示不夠直觀,也為石油分子的編寫帶來許多麻煩。但其優點是計算機對矩陣表示的分子結構容易處理,并且執行時速度較快。目前,許多現代化學信息學軟件管理系統分子的構建方式依然采取鍵電矩陣法。
結構導向集總(SOL)法的核心思想是:石油分子由有限的結構向量組成,通過結構向量加上側鏈的形式來表示石油分子,既簡單又直觀,同時也方便石油分子物性的計算。但是隨著分子尺度的逐漸變大,該方法的分子向量與分子不再一一對應,而是一個分子向量對應多個分子。此時,由物性分析數據選出來的分子存在多解,導致相同的宏觀物性解出的石油分子差別較大,影響了石油分子計算的重復性和準確率。另一方面,對于分子反應動力學模型而言,用結構導向集總來表示分子反應是一種有效的方法,但由于整個反應部分相當于結構基團的拼接和組合,所以該方法只能做到反應路徑層面,難以深入到機理層面。
同系物矩陣(MTHS)法以矩陣的行代表碳數,列代表同系物族,直觀地將石油分子表示出來。除了有利于石油分子在計算機中的存儲外,還可以通過改進將同分異構體的宏觀物性差異考慮進去,使得重構出來的分子更加符合實際油品組成。另一方面,MTHS法基于預設好的石油分子庫和相應的物性數據,對于選取的石油分子含量的計算更為合理。不過,預設石油分子庫受到分析水平的限制,比柴油更重的油品分子可能并不存在于石油分子庫中,這也使得基于MTHS法重構出來的分子并不準確。除此之外,為了使重構出來的石油分子更加符合實際,石油分子庫的建立需要收集各類不同地區的油品并對其進行詳細的分子組成分析,前期工作量較大。而且由于組成油品分子的數目巨大,有些石油分子的宏觀物性獲取也極為困難,這也給MTHS法的應用帶來不便。總體而言,MTHS法對于柴油餾分以下的油品,其重構出來的分子較為準確。但受限于目前計算機存儲能力和計算能力以及分析水平,MTHS法不容易應用到重油的分子重構中。
隨機重構(SR)法基于石油分子呈現一定的概率密度分布,依靠蒙特卡羅抽樣法,將不同的基團以一定的先后順序確定下來,并采用特定的方式進行拼接。每抽取一組結構基團就能確定一個石油分子,每次模擬過程確定一個石油分子庫,這種方式的好處是,通過確定石油分子中結構基團的分布規律即概率密度分布函數(PDF),進而確定石油分子的分布規律,比較契合實際油品中分子的分布狀況,而且該方法將數量巨大的石油分子進行適當的簡化,減少了變量個數,為其石油分子含量的計算提供了便利。目前SR法被廣泛應用于石油的全餾分分子重構,是一種有效的模擬方法。但該方法除了利用一些算法在計算機中將各種結構基團選取出來,還要逐步確定不同基團之間的拼接重組,進而形成石油分子,使整個過程變得相對復雜。另一方面,抽樣過程中可能生成石油中并不存在的分子,這將導致由SR法模擬出來的宏觀物性的計算結果雖然與實際油品宏觀物性一致,但分子組成并不相同,影響了結果的準確性。
最大信息熵(REM)法提供了一種計算石油分子含量的方法,以石油餾分有限的分析數據為約束條件,根據混合規則,優化相關參數,調整石油分子庫中的分子含量,在保證信息熵最大的同時,使石油的宏觀物性模擬值與實驗值之間的差異最小。依據最大熵判據,該方法除了可以調整石油分子的摩爾分數外,還能剔除不符合要求的分子。但是,REM法的應用除了需要較為完備的分析數據外,還需要輸入確定的分子結構信息,保證計算結果的準確性。
隨機重構-最大信息熵(SR-EM)法結合了SR法和REM法各自的優點。SR法根據石油分子結構基團的分布特點生成一套初始分子庫,較為合理;但后續詳細分子含量的計算比較復雜且速度較慢;而REM法比較依賴于合理的初始分子庫,計算分子含量時比隨機重構法的速度快很多,且準確性更高。實際應用時,相比單獨的SR法或REM法,SR-EM 法進一步提高了模型的準確性和適用性。
石油分子重構技術是石油煉化分子管理的基礎,其根據石油餾分分子的分布和結構特點,結合計算機模擬方法,將有限的分析數據轉化成詳細的分子信息。這些分子信息既可用于預測石油餾分的物理化學性質,也可為下一步分子反應動力學模型的構建提供基礎。但該方法的應用不是為了替代分析技術,而是彌補分析技術的不足。
當前,煉油行業正面臨著產能過剩、國際環境變化多端、市場競爭白熱化等嚴峻問題,同時還面臨著煉油向化工轉型的迫切需求,因此,高效合理地利用石油資源勢在必行。只有充分認識石油原料的分子組成,掌握其轉化成產品分子的規律,才能更好地提高競爭力。在現階段還不具備對石油分子進行完整表征的前提下,以有限的分析數據,通過計算機模擬方法對石油分子進行重構正發揮著越來越重要的作用。盡管如此,石油分子重構技術依然需要進一步的優化和完善。
(1)構建更為準確的石油原料及產品分子庫。一是構建更為合理的分子庫:以當前最先進的分子水平表征平臺為依托,通過分析大量的石油原料和產品,盡可能掌握石油原料及產品分子分布的統計學規律。二是選出更具代表性的分子庫:對結構和性質相似的分子進行適當的歸類和合并,將分子庫的大小壓縮至計算機容易處理的范圍內。
(2)構建更為全面的石油原料及產品物性庫。在充分考慮石油分子熱力學性質、反應動力學性質的基礎上,探究其分子結構與物理性質之間的關系,選取合適的混合規則和數學表達式計算石油原料及產品的宏觀物性。
(3)選擇合適的方法計算石油及產品的分子組成。依據分子庫中分子數量的多少,選用適當的數學工具和優化算法,保證選取出來分子物性的定量計算結果的準確性。
以石油分子重構技術為依托,根據原料的分子組成及其結構特點,選擇適宜的加工方案,使其轉化成理想的目標分子,是今后石油加工發展的重要方向,也是實現石油分子高效轉化的必由之路。