999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于決策樹的三組元精餾序列結構最優(yōu)合成規(guī)則識別

2021-04-09 06:49:14陳熙理孫國銘賈勝坤羅祎青袁希鋼
化工學報 2021年3期
關鍵詞:特征結構

陳熙理,孫國銘,賈勝坤,羅祎青,袁希鋼,2

(1 天津大學化工學院,天津300354; 2 化學工程國家重點實驗室(天津大學),天津300354)

引 言

精餾是化工生產(chǎn)中應用最為廣泛的分離技術,但其能耗高、投資大,同時對于多組元混合物的分離,不同精餾序列結構(簡稱精餾結構)的能耗與投資差別顯著[1],因此如何從眾多可行精餾結構中找到最優(yōu)精餾結構具有重要意義[2-3]。三組元精餾是多組元精餾的基本分離單元,在工業(yè)中應用廣泛,同時由于對隔板精餾塔(dividing wall column,DWC)以及多種熱耦精餾結構研究的深入,三組元精餾結構的最優(yōu)化合成成為了重要的研究課題[4-9]。Tedder等[10]比較了包含側線汽提、側線精餾在內的7 種精餾結構對不同物系的適用情況,指出進料的組成和分離因子(ease of separation index,ESI,即輕組分、中間組分之間的相對揮發(fā)度與中間組分、重組分之間的相對揮發(fā)度之比)以及進料組成是影響精餾流程結構的主要因素,并首次在三元混合物組成三角圖上給出各種最優(yōu)精餾結構所對應的區(qū)域。Agrawal等[11]采用熱力學效率為評價指標,給出了具有最高熱力學效率的三組元精餾流程結構在三元組成三角圖上對應的區(qū)域。田芳等[8]針對理想三元混合物,通過嚴格模擬和優(yōu)化,針對不同ESI值給出了具有最小年度總費用(total annual cost,TAC)精餾結構在三元組成三角圖上所對應的區(qū)域。Wang 等[12]發(fā)現(xiàn),除了進料組成和ESI,影響三組元最優(yōu)精餾結構的還有產(chǎn)品純度要求,即分離難度,進而定義了廣義ESI(generalized ease of separation index,GESI),用以考慮分離難度的影響。Lin 等[13]采用三元組成三角圖的方式,擴充了序列選擇范圍,探究3種不同隔板位置的隔板塔隨物系、進料組成改變的選擇。

然而,上述研究中沿用的進料組成三角圖區(qū)域劃分的方法具有明顯的局限性。這主要在于采用ESI或GESI(即相對揮發(fā)度的比值)代表物系對最優(yōu)精餾序列結構的影響存在不確定性,組分的潛熱[12]、泡點溫度等因素均會對最優(yōu)精餾結構對應的分區(qū)有影響,導致即便ESI相同,不同的物系所對應的最優(yōu)精餾結構分區(qū)會有不同。如果考慮更多的因素,三元組成三角圖分區(qū)會十分復雜,導致基于這種三角圖分區(qū)劃分的三組元精餾結構的決策十分困難。為解決這一問題,袁野[14]以及王磊[15]均嘗試通過三角圖上的區(qū)域劃分歸納出用于最優(yōu)精餾結構決策的規(guī)則。然而,這種歸納是基于人為圖形觀察,由于上述不確定性的存在,歸納出的規(guī)則很難具有良好的適用性。

決策樹是一種經(jīng)典的機器學習方法[16-17],它以信息熵、基尼系數(shù)等指標作為判據(jù)依次對系統(tǒng)影響的主要因素加以判別,最終按影響因素的重要性對數(shù)據(jù)進行有效的分類。上述基于組成三角圖劃分的三組元精餾分析方法雖然不便于精餾序列結構的優(yōu)化決策,但可提供主要影響因素與最優(yōu)精餾結構的一一對應關系數(shù)據(jù),為通過訓練決策樹進而獲得系統(tǒng)化的決策方法提供了可能。本文針對三組元最優(yōu)精餾結構的決策,引入分類回歸樹(classification and regression tree,CART)方法,采用嚴格模擬建立數(shù)據(jù)集,提出采用數(shù)據(jù)信息熵的方法實現(xiàn)影響最優(yōu)精餾序列結構選擇的特征識別方法,進而建立了一種可根據(jù)進料物系、組成以及分離要求等已知條件快速確定三組元精餾最優(yōu)流程序列結構的決策序列,即決策樹的方法。

1 數(shù)據(jù)與決策樹模型

1.1 數(shù)據(jù)的產(chǎn)生

針對三組元精餾,通??煽紤]9種序列結構,即直接序列(D)、間接序列(I)、間接序列熱耦合(IS)、直接序列熱耦合(DS)、直接序列反饋能量集成(DI)、直接序列前饋能量集成、間接序列前饋能量集成(II)、間接序列反饋能量集成和隔板塔(DWC)。由于直接序列前饋能量集成和間接序列反饋能量集成已被證明可操作性差,同時不具有優(yōu)勢[18],故本文僅考慮除這兩種結構外的其他7 種作為候選的結構,即D、I、IS、DS、DI、II 和DWC。相應的精餾序列結構如圖1所示。

本文數(shù)據(jù)引自文獻[14-15],選擇四種理想物系:異丁烷/正丁烷/異戊烷、正戊烷/正乙烷/正庚烷、正乙烷/正庚烷/正辛烷、苯/甲苯/乙苯作為對象。隨機選擇的分離要求如表1所示。其中混合物三個組分按揮發(fā)度從大到小依次命名為A、B 和C。針對表1 中每一種分離要求均選取34種不同的進料組成,該34個進料組成均勻分布于進料組成的三角圖上,以近似涵蓋所有可能的進料組成。進料流率為300 kmol/h,并規(guī)定泡點進料。GESI 是表示一個三組元混合物精餾分離特性的指標[14],由式(1)給出,定義為在全回流的條件下分別將B/C 和A/B 二元混合物分離到給定產(chǎn)品純度所需最小理論板數(shù)之比,度量的是兩種分離難度之比。

使用Aspen Plus 嚴格模擬軟件,以表1 中6 種分離要求以及34 種進料組成(共204 個組合)作為已知條件分別對7 種精餾序列進行模擬和優(yōu)化,并計算相應的TAC,計算公式參考文獻[19]。通過比對7 個序列的TAC,給出對應每一組已知條件的最優(yōu)流程結構,以此建立已知條件和最優(yōu)精餾結構的一一對應關系。

圖1 本研究考察的三組元精餾結構Fig.1 Ternary distillation sequences considered in this study

表1 三組元物系和分離要求Table 1 Ternary mixtures and separation requirement

上述已知條件包括所有物性數(shù)據(jù)、進料摩爾分率和產(chǎn)品純度規(guī)定,按照已知條件與最優(yōu)精餾結構的對應關系,與一個最優(yōu)精餾結構對應的那一組已知條件值可被視為該最優(yōu)精餾結構的特征,用實數(shù)表示,則有特征矩陣X,每一最優(yōu)精餾結構所對應的那一組特征構成矩陣X 中的一行,即xi,亦稱為特征行。X 中的行數(shù)N 亦稱為數(shù)據(jù)X 的規(guī)模。X 中的第j列為第j 個特征。設特征總數(shù)為M,即X 的列數(shù),則j≤M。特征行xi所對應的最優(yōu)精餾結構記為yi,yi亦稱為類。與所有特征行相對應的最優(yōu)精餾結構組成列向量y,亦稱類向量。X和y構成了數(shù)據(jù)集D,即

若將X 視為集合,xi為其中的第i 個元素,類似地,y 為集合,yi為其中第i 個元素,則X 中某些元素的組合Xs為X的一個子集,即Xs?X,對應地,ys?y,其中s為子集的說明符。于是可定義D的子集

且有Ds?D。由子集Xs的定義可知,如果Xs和ys分別包含X 和y 的所有元素,則D 可以被視為它本身的一個子集,即Ds=D。

1.2 分類回歸決策樹模型

分類回歸樹,簡稱CART 決策樹[17],是一種經(jīng)典決策樹模型[20-24]。通過CART 算法得到的決策樹稱為CART決策樹。CART決策樹呈二叉樹形結構,其結構如圖2 所示,包括位于頂部的一個根節(jié)點(開始節(jié)點)、若干個中間節(jié)點以及終端節(jié)點,亦稱葉子節(jié)點。

CART 決策樹在每一個非葉子節(jié)點上選擇影響最大的特征及其對應的分割點,從而將當前節(jié)點的數(shù)據(jù)集Ds劃分為更“純”的左、右兩個子集。一個數(shù)據(jù)集Ds的純度,即ys中類的一致性,可用數(shù)據(jù)集的信息熵(Shannon entropy)E(Ds)[25]衡量,其定義式為

圖2 CART決策樹結構示意圖Fig.2 A CART decision tree classifier

其中,K 為ys中出現(xiàn)的精餾結構種類的總數(shù),k為種類的序號,p(k,ys)表示在向量ys中第k 個種類的數(shù)量與ys中所有種類的總數(shù)之比。由上述定義可知,與熱力學熵相類似,信息熵值越大,ys中的種類越多樣,越不純,反之則ys中的元素類趨于同種類。對于數(shù)據(jù)集Ds,CART 的分類是指在Xs中挑選一個特征j,即Xs中的第j 列,以實數(shù)tj為分割點將數(shù)據(jù)集Ds劃分為由式(5)給出的左、右兩個子集DsL和DsR

其中,xij為Xs中第i 行第j 列元素。CART 中對j和tj的選擇遵循分類最有效原則,即挑選能夠實現(xiàn)最有效分類的j*和tj*。對分類的有效性則采用信息熵增益IG(information gain)作為判別準則。一次分類的信息熵增益被定義為

其中,|Ds|表示集合Ds中元素的數(shù)量。熵增益代表了分類的有效程度,即分類后各個子集中的類越純,則熵增益越大,因此j*和tj*由式(7)給出

當數(shù)據(jù)集被劃分為左、右子集后,各自可以按照相同原理遞歸繼續(xù)劃分各自的左、右子集,直到?jīng)Q策樹生長到足夠的深度或得到子集無法繼續(xù)分割。

2 三組元精餾系統(tǒng)合成算例

2.1 影響因素與特征

本文選擇三組元混合物中各組元的進料組成F1、F2、F3以及廣義分離因子GESI[12]作為特征(即已知條件),即在矩陣X 中共有4列;X 中的每一行xi對應一個特征組合,以此為已知條件分別對7 種精餾結構進行最優(yōu)化并通過比較選出最優(yōu)精餾結構,該最優(yōu)精餾結構名稱為yi,即類向量y 中的第i 個元素。1.1 節(jié)采用的204 組已知條件構成X 中的204 行,每組行對應的最優(yōu)精餾結構的名稱構成y。

2.2 決策樹的構建與分析

本文使用1.1 節(jié)模擬優(yōu)化得到204 個數(shù)據(jù)點作為訓練集D,在Python/Scikit-learn[26]平臺上構建CART 決策樹模型,并使用Graphviz[27]繪制出樹狀格式進行表示。

基于數(shù)據(jù)集D 形成的CART 決策樹如圖3(a)所示。以圖3(a)決策樹根節(jié)點為例,其中的信息說明如圖4所示。第一行代表在該節(jié)點由式(7)計算得到的xij為特征GESI,tj值為0.802,并以此為判據(jù)將數(shù)據(jù)集D 劃分為左右兩個子集,即滿足判據(jù)的特征行及其對應的類被劃分到左子樹,形成左子集,不滿足的數(shù)據(jù)被劃分到右子樹,形成右子集;entropy 表示當前節(jié)點的信息熵;samples 代表當前節(jié)點的數(shù)據(jù)量,即D 中的元素數(shù);value 代表sample 中屬于不同類別的數(shù)據(jù)數(shù)量;在本例數(shù)據(jù)集D 的構建中,嚴格模擬、優(yōu)化計算表明,表1 給出的物系和分離要求,以及34 種進料組成所對應的最優(yōu)精餾結構僅有SS、DWC 和DI,即數(shù)據(jù)集D 中的類向量y 中有3 種精餾結構,value 中的三個數(shù)據(jù)分別給出了這3 種精餾結構在本節(jié)點的數(shù)量;class返回的是在value中值最大數(shù)據(jù)對應的類別,即DWC。圖3(a)表明,在根節(jié)點如果選擇xij為GESI且tGESI=0.802對根節(jié)點204個數(shù)據(jù)進行分類,即滿足GESI ≤0.802 的數(shù)據(jù)進入左子樹,否則進入右子樹,則可以獲得最大的信息增益,由式(6)可知這一最大信息增益為0.4159。在分類過程中信息增益為正,表明分類后的信息熵下降,表明子集數(shù)據(jù)純度增加。

節(jié)點信息中的class 可視為當前節(jié)點可優(yōu)選的精餾結構分類,其依據(jù)是該分類在value中對應的數(shù)量最多。例如根節(jié)點的優(yōu)選分類為DWC,因為在數(shù)據(jù)集D 的204 個數(shù)據(jù)中有92 個以DWC 為最優(yōu)精餾結構,占45%(92/204)。亦即,對于表1 中的物系在任何情況下如果選擇DWC 精餾結構,則有45%的概率是正確的。而這一正確率隨著決策樹分類的進行逐步提高,例如,圖3(a)中第3 層各節(jié)點優(yōu)選精餾結構(即class 的值)的正確率從左至右分別為93%、96%、91%和64%,這是信息熵逐層下降的結果。將該層最左邊的節(jié)點繼續(xù)分類,其左子節(jié)點的class 值為IS,其正確率提高到了95%(38/40);右子節(jié)點選擇DI的正確率為50%,但這一不確定性僅涉及在2 個數(shù)據(jù)點中選取1 個,其對總誤差的貢獻率為0.5%。如考察圖3(a)所有末端節(jié)點,其總誤差為11.8%,即該決策樹用于預測表1所示的三元物系最優(yōu)精餾結構的準確率為88.2%。

圖3 算例的CART可視化圖(a),CART左子樹(b)和右子樹(c)可視化三角圖Fig.3 The visualization of CART for case(a),the left subtree branch(b)and the right subtree branch(c)of CART

圖4 CART決策樹節(jié)點信息指示Fig.4 Introduction for node in CART decision tree

圖3(b)為根節(jié)點的左子樹精餾結構在進料組成三角圖上的分布,從圖中可看出,對于劃分到左子樹的數(shù)據(jù)點,僅有2種序列是占優(yōu)的,根據(jù)其進料組成不同,在IS 和DWC 兩種結構中選擇,即對于異構烷烴物系,其余的5 個候選序列始終不占優(yōu)[28]。根節(jié)點的右子樹可以按照相同方法總結另外三條規(guī)則:當F1≤0.15 且F2≤0.15 時,IS 結構占優(yōu);當F1≤0.15且F2>0.15時,DWC占優(yōu);當F1>0.15且F3≤0.45時,DI 結構相比其他序列更具有經(jīng)濟性。圖3(c)為決策樹右子樹的可視化,可以清晰地看出對于苯物系和正構烷烴物系,在不同的條件下,7 個候選序列僅有3 個序列分布在三角圖中,這表明其余的4 個序列是始終不占優(yōu)的,僅需從IS、DWC、DI三個序列中做選擇即可進行最優(yōu)精餾序列選擇。此外,IS 的區(qū)域要遠小于DWC 和DI各自的區(qū)域,僅在輕組分、中間組分含量均很小的時候才會占優(yōu);與之相反,DWC 和DI 近似均分了三角圖剩下區(qū)域,這說明對于大多數(shù)分離任務,DWC 和DI 序列都具有更好的經(jīng)濟性[29-30]。

3 結果與討論

基于圖3(a)所示的CARD 決策樹,可以提取出用于最優(yōu)精餾結構設計的決策序列。決策樹中的每一個結點均對應一條規(guī)則,例如根節(jié)點的規(guī)則即為GESI≤0.802 時,應考察F2≤0.35 是否滿足,若滿足應進而考察F1≤0.75是否滿足,如滿足則應該采用IS精餾結構,否則采用DI;當F2≤0.35 不滿足時則應考察F3≤0.45 是否滿足,如滿足則采用DWC 為精餾結構,否則采用IS;當GESI≤0.802 不能滿足時則應考察F1≤0.15 是否滿足,若滿足應進而考察F2≤0.15 是否滿足,如滿足則應該采用IS 精餾結構,否則采用DWC;當F1≤0.15 不滿足時則應考察F3≤0.45 是否滿足,如滿足則采用DI為精餾結構,否則采用DWC。

由于CART 決策樹會在每一個非葉子節(jié)點選擇一個特征將數(shù)據(jù)集劃分為更純的兩個子集,該特征使得在該節(jié)點進行分類信息熵下降最多,即在該節(jié)點影響最大的特征。類比三組元精餾結構選擇問題,一個特征造成信息熵在分類過程中下降的程度可視為該特征對最優(yōu)精餾序列選擇影響的重要性。在分類中特征的重要性可以由FI 因子(features importance)定義,特征的FI 因子定義為該特征在決策樹學習過程中使數(shù)據(jù)集的信息熵下降累加的歸一化值,F(xiàn)I 因子可以定量給出不同特征對序列選擇的影響。本模型中CART 決策樹訓練過程中得到的FI 因子如圖5 所示。從圖中可以看出,選擇的四個特征中,對三組元序列選擇影響最大的是GESI 指標,即不同的分離難度會顯著影響序列選擇。此外,三個組分進料組成對序列選擇的影響并不相等,中間組分進料流率占比(F2)對選擇的影響要高于其他兩個組分。

圖5 基于信息熵的變量重要性(FI)Fig.5 Feature importance(FI)measurements on entropy

應該指出,圖3(a)所示的決策樹是基于表1 中的三元物系的訓練結果,所得準確率也是針對這些物系而言的。因此若將本文結果用于其他物系則準確率會有所下降,特別對于非理想物系誤差可能較大。但提出的訓練過程的意義在于它為建立三組元精餾設計最優(yōu)決策提供了一種有效的方法,通過在數(shù)據(jù)集中增加新的數(shù)據(jù)增加決策的正確率。通過應用規(guī)則進行決策是三組元精餾結構最優(yōu)化設計的快速、高效的方法,然而傳統(tǒng)的經(jīng)驗規(guī)則雖然也具有這些優(yōu)勢,但存在多條規(guī)則之間矛盾、規(guī)則運用順序不確定性等顯著弱點。由決策樹產(chǎn)生的規(guī)則可有效避免上述弱點,同時隨著決策樹的提出,通過數(shù)據(jù)集的不斷補充、積累,準確、有效、確定的三元精餾結構最優(yōu)決策規(guī)則型設計將成為可能。

4 結 論

(1)本文針對三組元精餾結構最優(yōu)合成,采用決策樹的方法提出了一種基于數(shù)據(jù)驅動的決策模型,該模型具有可視化性、可解釋性,且可以實現(xiàn)復雜的三組元最優(yōu)序列選擇。

(2)提出的決策模型可以在決策的同時輸出決策規(guī)則。在算例演示中,使用該方法找出了一套三組元精餾結構最優(yōu)合成規(guī)則,且發(fā)現(xiàn)的規(guī)則與傳統(tǒng)經(jīng)驗規(guī)則相比具有確定性。

(3)提出了一種基于信息熵降的衡量不同特征對三組元精餾序列選擇的定量化指標FI 因子。FI因子越大特征對于序列選擇影響越大,反之,對序列選擇的影響越小。

(4)提出的方法是一種數(shù)據(jù)驅動的方法,相比于前人依賴工程師經(jīng)驗的主觀分析,不僅不會因為待分析的數(shù)據(jù)量增加而處理困難,反而會隨著數(shù)據(jù)規(guī)模的日益擴大,得到更多、更準確的決策規(guī)則。

值得指出的是,目前提出的方法僅在理想物系的算例上驗證了方法的有效性,針對更普適的最優(yōu)精餾序列選擇,仍需通過添加數(shù)據(jù),涵蓋更多的考察物系以及分離要求進一步分析。由于決策樹方法是數(shù)據(jù)驅動的,依賴于精準高效的數(shù)據(jù),因此快速高效地產(chǎn)生充足且質量高的訓練數(shù)據(jù),這也將是今后應解決的問題。

符 號 說 明

D——數(shù)據(jù)集

Ds——數(shù)據(jù)集D子集

DsL——Ds的左子集

DsR——Ds的右子集

E(D)——數(shù)據(jù)集D的信息熵

ESI——分離因子

GESI——通用分離因子

j——X矩陣第j列(第j個特征)

j*——決策樹節(jié)點最優(yōu)劃分特征

K——類別總數(shù)

k——類別序號

N——數(shù)據(jù)集D樣本數(shù)

NAB——分離A/B二元混合物所需的最小理論塔板數(shù)

NBC——分離B/C二元混合物所需的最小理論塔板數(shù)

p(k,y)——第k 個種類的數(shù)量與y 中所有種類的總數(shù)之比

TAC——年度總費用

tj——第j個特征對應的分割點

tj*——最優(yōu)劃分特征對應的最優(yōu)分割點

X——分離任務矩陣

Xs——X矩陣子集

xi——X矩陣中第i個元素

xij——Xs中第i行第j列元素

y——最優(yōu)精餾序列向量

yi——y矩陣中第i個元素

ys——y向量子集

αAB——輕組分、中間組分間相對揮發(fā)度

αBC——中間組分、重組分間相對揮發(fā)度

猜你喜歡
特征結構
抓住特征巧觀察
《形而上學》△卷的結構和位置
哲學評論(2021年2期)2021-08-22 01:53:34
新型冠狀病毒及其流行病學特征認識
如何表達“特征”
論結構
中華詩詞(2019年7期)2019-11-25 01:43:04
新型平衡塊結構的應用
模具制造(2019年3期)2019-06-06 02:10:54
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
論《日出》的結構
創(chuàng)新治理結構促進中小企業(yè)持續(xù)成長
主站蜘蛛池模板: 综合色婷婷| 精品久久香蕉国产线看观看gif| 狠狠ⅴ日韩v欧美v天堂| 欧美精品在线观看视频| 亚洲男人天堂久久| 国产色网站| 在线观看网站国产| 亚洲最大情网站在线观看| 国产精品入口麻豆| 国产成人精品一区二区| 日本在线亚洲| 精品一区二区三区四区五区| 成人自拍视频在线观看| 九九热视频精品在线| 99热6这里只有精品| 58av国产精品| 国产欧美高清| 毛片免费在线视频| 老司机午夜精品网站在线观看 | 久草热视频在线| 最新国语自产精品视频在| 熟妇人妻无乱码中文字幕真矢织江 | 久久综合色视频| 精品视频在线观看你懂的一区| 久久久久青草大香线综合精品| 成人福利在线视频免费观看| 国产菊爆视频在线观看| 亚洲精品在线影院| 91啦中文字幕| 九九九久久国产精品| 欧洲精品视频在线观看| 日韩国产一区二区三区无码| 亚洲天堂自拍| 亚洲欧洲免费视频| 97视频精品全国在线观看| 丝袜久久剧情精品国产| 青青草原国产| 亚洲精品第一页不卡| 色婷婷成人| 玖玖精品在线| 好紧太爽了视频免费无码| 国产第二十一页| 国产一区二区三区夜色| 免费a在线观看播放| 欧美精品1区2区| 毛片视频网| 国产成人亚洲无吗淙合青草| 亚洲资源站av无码网址| 一级毛片无毒不卡直接观看| 97视频免费看| yjizz视频最新网站在线| 国产成人狂喷潮在线观看2345| 国产精品欧美日本韩免费一区二区三区不卡| 成人一级免费视频| 999福利激情视频| 99这里只有精品在线| 久青草网站| 自拍偷拍欧美| 精品人妻AV区| 99在线小视频| 无码综合天天久久综合网| 婷婷五月在线| 亚洲欧美综合在线观看| 波多野结衣无码视频在线观看| 极品av一区二区| 波多野结衣第一页| 欧美色图第一页| 欧美综合区自拍亚洲综合绿色| 又黄又爽视频好爽视频| 国产白浆在线| 中国国产A一级毛片| 色网站在线视频| 成人综合久久综合| 久久久久亚洲精品成人网| 中文字幕永久在线观看| 67194在线午夜亚洲| 久久黄色影院| 无码福利日韩神码福利片| 精品無碼一區在線觀看 | 91麻豆精品国产91久久久久| 视频二区国产精品职场同事| 欧美日韩精品在线播放|