999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于定量結構-性質關系預測含水二元共沸物的共沸溫度與組成

2020-08-22 09:40:56曾行艷呂利平
化學工業與工程 2020年4期
關鍵詞:能力模型

曾行艷,諸 林*,呂利平,,李 兵

(1. 西南石油大學化學化工學院,成都 610500; 2. 長江師范學院化學化工學院,重慶 408100)

由于水具有安全、無毒、可再生能力強及溶解性能好的特點,被廣泛應用于化工和醫藥等行業。在生產過程中,水和其他原料直接或間接的參與生產過程,會產生大量的含水共沸廢液,如乙腈/水[1]、乙二胺/水[2]及四氫呋喃/水[3]等二元共沸物。 為了實現資源循環利用及環境保護的目的,需要采用特殊精餾對其進行分離。

共沸特性數據是分離工藝設計、模擬及優化的基礎。 如果僅僅依靠實驗來獲取該類數據,會花費大量的時間和經濟成本。 相比之下,狀態方程法[4-5]、活度系數法[6-7]、經驗法[8-9]以及定量結構-性質關系(QSPR)模型[10-11]等理論計算方法就具有簡單、快速的特點。 目前,很多研究者利用理論計算方法預測了部分共沸物及混合物的相平衡數據,并取得了較好的效果[4,7-8,12-13]。 但是,前3 種方法在預測共沸物的共沸特性數據時,需要一些必要的實驗參數或擬合參數,而通常這類參數的獲取難度是比較大的。 QSPR模型具有計算量小、耗時短及精度高等優點,而且相關所需參數均可由分子結構計算所得,并不需要任何額外的實驗數據,被廣泛應用于化工等領域[14-17],如Liang 等從QSPR 中探索變壓蒸餾過程設計和動態控制的關系,且利用QSPR 確定萃取精餾中溶劑對分離混合物相對揮發性的影響[18-20]。

基于此,本研究以125 種含水二元共沸物為研究對象,利用定量結構-性質關系分別構建可以高精度預測含水二元共沸物共沸溫度及組成的QSPR 模型,以獲取常壓下該類共沸物的共沸特性數據;同時,也可為其他特殊種類二元共沸物共沸數據的預測提供參考和思路。

1 樣本數據獲取及分子描述符篩選

1.1 樣本數據的獲取

為保證所建的QSPR 模型不受數據源的影響,本文涉及到的125 種含水二元共沸物的共沸特性數據均選自溶劑手冊[21]。 同時,本研究根據“Mixtures out”樣本劃分法[22]隨機將整個數據集分為訓練集(80%)和測試集(20%),以達到有效表征各類含水二元共沸物體系的目的,詳見附件1 表1。 其中,訓練集用于篩選特征描述符及建立QSPR 模型,測試集則用于評估所建模型的預測能力及泛化推廣能力[13]。

1.2 分子結構的優化

常見分子結構繪制和優化軟件有Symyx Draw、HyperChem、Gauss 和ChemOffice 等[15,23]。 本 研 究采用HyperChem 8.0 軟件繪制和優化純組分的三維分子結構以獲取分子的最小能量構象。 相關優化步驟如下:先通過分子力學方法(MM+)預優化;再由量子力學半經驗方法(PM3)進一步優化。 在優化過程中采用Polack-Ribiere 算法,且所有計算在Hartree-Fock 能級進行,至均方根梯度極限達到4.18×107kJ·m-1·mol-1[24]。

2 共沸溫度及共沸組成QSPR 模型

2.1 分子描述符的篩選與模型構建

2.1.1 分子描述符的篩選

為準確的表征分子的結構特性,需要對分子描述符進行篩選,包括預篩選和進一步篩選,其篩選過程示意圖如圖1 所示。 本研究利用Materials Studio 8.0 軟件計算純物質的分子描述符,得到包括拓撲描述符、結構描述符及空間描述符等的15 類共344 種分子描述符;再以何培等選用的2 個基本原則[25]對其進行預篩選,以消除無用及冗余信息,減少共線性出現的概率,經預篩選后得到76 種分子描述符;再根據“Kay’s mixing rule”混合規則[26]計算得到二元共沸物的混合描述符,并采用遺傳算法對其進一步篩選[27]。

2.1.2 共沸溫度及組成模型的構建

經篩選后的混合描述符即可用于建立共沸溫度及組成的QSPR 模型,模型的構建過程如圖1 所示。 式(1)~(6)給出了不同混合描述符個數(4 ~9)的共沸溫度預測模型,模型中的描述符以Ai表示;而式(7) ~(11)給出了不同混合描述符個數(2 ~6)的共沸組成預測模型,模型中的描述符以Bi表示,表1 列出了建模所涉及的全部描述符。

圖1 特征描述符篩選及多元線性回歸建模選示意圖Fig.1 A schematic diagram of feature descriptor screening and multiple linear regression modeling

2.1.2.1 共沸溫度模型

模型1:

表1 共沸溫度及組成預測模型構建所涉及的全部描述符Table 1 The descriptors involved in the establishment of the azeotropic temperature and composition prediction models

2.1.2.2 共沸組成模型

2.2 模型篩選

圖2 和圖3 分別為所建共沸溫度及組成預測模型的復相關系數( R2),調整復相關系數( R2adj)和留一法交叉驗證系數( Q2LOO)與混合描述符個數(n)的變化趨勢關系圖。 從圖2 可以看出,當n 由4 增加到8 時,共沸溫度預測模型的R2,R2adj和Q2LOO曲線穩健上升,而當增加第9 個混合描述符時3 個參數曲線均變得十分平緩,說明增加第9 個混合描述符對模型的擬合能力及穩定性提升不大。 從圖3 可以看出,當n 由2 增加到3 時,共沸組成預測模型的R2,R2adj和Q2LOO曲線急劇上升;當n 由3 增加到5 時,3 個參數曲線緩慢上升;當增加第6 個混合描述符時參數曲線幾乎沒有變化;這說明增加第6 個混合描述符對模型的擬合能力及穩定性幾乎不影響。由此可知,最適宜共沸溫度及組成預測模型的最適宜描述符個數是8/5。

圖2 共沸溫度預測模型的描述符個數與R2,的關系Fig.2 The relationship between the number of descriptors and R2, of azeotropic temperature prediction models

圖3 共沸組成預測模型的描述符個數與R2,R2adj, 的關系Fig.3 The relationship between the number of descriptors and R2,, of azeotropic composition prediction models

2.2.2 過擬合及顯著性比較

擬合缺失分數(LOF)作為遺傳函數算法的適度函數,其變化趨勢可用于判斷模型是否出現過擬合;而F 檢驗值的大小代表著方程的顯著性,F 檢驗值越大則表明該模型的回歸假設因果關系顯著性越高。 圖4 和圖5 分別是共沸溫度及組成預測模型的LOF 和F 值與混合描述符個數的關系圖。 由圖4可知,當n 由4 增加到8 時,LOF 值隨n 的增加而快速下降,說明利用8 個特征描述符構建的模型不存在過擬合現象;而F 檢驗值隨n 的增加有略微降低,但當n 增加到8 時,F 值也比較高(280.51),說明混合描述符數為8 時,共沸溫度模型的回歸假設因果關系顯著性良好。 由圖5 可知,當n 由2 變化到5 時,LOF 值隨n 的增加先急劇下降隨后逐漸減小,說明利用5 個特征描述符數構建的模型不存在過擬合現象,而F 檢驗值隨n 的增加先快速增加隨后在一定范圍內波動,當混合描述符數為5 時,模型的回歸假設因果關系顯著性稍弱。 綜上所述,利用8/5 個混合描述符所構建的共沸溫度及組成預測模型不存在過擬合問題,且模型的假設因果關系顯著性高。

2.3 最適宜模型分析

圖4 共沸溫度預測模型的混合描述符個數與LOF 和F 的關系Fig.4 The relationship between the number of mixed descriptors and the LOF and F of azeotropic temperature prediction models

圖5 共沸組成預測模型的混合描述符個數與LOF 和F 的關系Fig.5 The relationship between the number of mixed descriptors and the LOF and F of azeotropic composition prediction models

表2 給出了最適宜的共沸溫度及組成QSPR 模型(模型5/模型10)的特征描述符(以下稱之為變量)及統計學參數。 從表2 中可知,模型5 的8 個變量的標準系數分別為0.784、0.287、-0.235、0.184、0.156、0.097、0.150 和0.104,由 此 可 知 其 中 僅 有Chi (5): path/cluster 與共沸溫度呈負相關;模型10的5 個變量的標準系數分別為- 0.131、0.252、0.457、0.497 和-0.118,由此可知其中Hydroxy 和Vertex adjacency/magnitude 描述符與共沸組成呈負相關,2 個模型各變量的具體數據如附件1 表2 和表3 所示。 此外,上述的13 個變量t-概率值均小于或等于0.005,說明這些變量對含水二元共沸物的共沸溫度及組成的影響均是顯著的。 模型5 和模型10 的R2和R2adj分別為0.960 6/0.997 0 和0.957 2/0.996 9,2 個模型的MAE 和RMSE 的值均較小,分別為1.890 0/0.010 4 和2.940 0/0.016 1,說明2 個模型分別對訓練集共沸溫度及組成的實驗數據具有較好的擬合能力和預測能力。

圖6 和圖7 分別是變量對各QSPR 模型的影響占比情況。 從圖6 可以看出模型5 的8 個變量對含水二元共沸物共沸溫度的影響程度由大到小排序為:Hydrogen bond donor >Chi (4): path >Chi (5): path/cluster >Chi (4): path/cluster (valence modified)>Complementary information content (CIC)>Estate keys (indicators): I_sCH3>Molecular shadow area fraction: ZX plane >E-state keys (sums): S_dO。從圖7 中可以看出模型10 的5 個變量對含水二元共沸物共沸組成的影響程度由大到小排序為Structural information content (SIC)>Complementary information content ( CIC) >Bond information content (BIC)>Hydroxy>Vertex adjacency/magnitude。

表2 最適宜的QSPR 模型的變量及統計學參數Table 2 The variables and statistical parameters of the optimal QSPR model

圖6 特征描述符對共沸溫度預測模型的影響Fig.6 Effect of each feature descriptors on the optimal azeotropic temperature model

2.4 模型驗證

2.4.1 內部及外部驗證

圖7 特征描述符對共沸組成預測模型的影響Fig.7 Effect of each feature descriptors on the optimal azeotropic composition model

利用留一法交叉驗證對模型的內部穩定性進行了分析,2 個模型的留一法交叉驗證系數Q2LOO分別為0.947 5 和0.995 7,說明數據的擬合度良好,所建模型非常穩定。 在內部驗證的基礎上進行外部驗證能進一步證明模型的真實有效性及外部預測能力,因此,本研究對測試集樣本的共沸溫度及組成進行了預測。 圖8 和圖9 是共沸溫度及組成的實驗值與預測值的關系圖,從圖8 和圖9 中可以看出,2 個模型的測試集的預測效果和訓練集的預測效果一致,散點均位于對角線附近,僅存在1 個共沸組成預測數據偏離對角線稍遠,2 個模型的外部驗證系數分別為0.943 9 和0.997 6,說明2 個模型的預測準確性高,泛化推廣能力好。

圖8 共沸溫度的實驗值和預測值的比較Fig.8 Comparison of experimental and predicted values of azeotropic temperature

圖9 共沸組成的實驗值與預測值的比較Fig.9 Comparison of experimental and predicted values of azeotropic composition

2.4.2 殘差分析

為了排除“偶然相關”的可能,需對2 個所建模型進行殘差分析。 圖10 和圖11 分別是模型5 和模型10 的殘差關系圖,由圖10 和圖11 可知,2 個模型的計算殘差均隨機且無規律的均勻分布于基準線(0 線)兩側,說明在建模過程中均未產生系統誤差。 同時,可以發現所有殘差分布點均集中于基線附近,且大部分離基線較近,這也說明2 個模型的預測誤差較小。

2.4.3 應用域分析

應用域分析最常用的方法是利用標準化殘差和leverage 值作圖,即Williams 圖[26]。 圖12 和 圖13 分別是對模型5 和模型10 應用域分析的直觀呈現圖。 從圖12 可以清晰的看出絕大部分樣本落在該應用域以內,只有8 個樣本落在應用域以外;由圖13 可知,只有2 個樣本落在應用域以外,另外有2 個樣本落在邊界線上。 究其原因可能是這類共沸物中有1 個分子的某些結構對于整個樣本集來說比較特殊。 綜上可知,最適宜共沸溫度及組成模型具有較強的泛化推廣能力。

圖10 最適宜的共沸溫度預測模型的殘差與實驗值的關系圖Fig. 10 The Residuals versus experimental values of the optimal azeotropic temperature prediction model

圖11 最適宜的共沸組成QSPR 模型的殘差與實驗值的關系圖Fig.11 The Residuals versus experimental values of the optimal azeotropic composition prediction mode

圖12 最適宜的共沸溫度預測模型的應用領域的Williams 圖Fig.12 Plot of Williams of AD of the optimal azeotropic temperature prediction model

圖13 最適宜的共沸組成預測模型的應用領域的Williams 圖Fig.13 Plot of Williams of AD of the optimal azeotropic composition prediction model

3 模型比較

將這2 個模型與同類文獻模型及UNIFAC 基團貢獻法進行比較,表3 列出了不同來源的共沸溫度及組成預測模型的主要性能參數。 從表3 中可以看出,所建模型所涉及的變量個數與已有模型相近,但是本研究所建模型的R2和比其他QSPR 模型高,說明本研究所建模型的擬合能力和內部穩定性比其他模型高;從各個模型的外推預測效果來看,可以發現所建模型的遠大于其他模型及UNIFAC 基團貢獻法,且UNIFAC 基團貢獻法對一些含水二元共沸體系存在無法計算的問題,即對所選數據集中的26 種二元共沸體系都未能計算出共沸溫度及組成的預測值,表明所建模型的預測能力和泛化推廣能力均優于現有模型,其預測結果數據詳見附件1;從各個模型的RMSE 和AAE 來看,本研究所建模型的RMSE 和AAE 也遠小于其他現有模型,這說明所建模型的預測精度高。 綜上,可以看出所建立的模型不但擬合能力和內部穩定性有所提高,而且具備較強的預測能力和泛化推廣能力。

表3 不同共沸溫度及組成預測模型的主要性能參數Table 3 The main statistical parameters of QSPR model of azeotropic temperature and composition in different literatures

4 結論

本研究基于定量結構-性質關系探究含水二元共沸物的共沸溫度及組成與分子結構之間的內在關系,對共沸溫度及組成數據進行了預測。 得出以下結論:

1)經分子的三維結構繪制、優化,分子描述符的計算、篩選以及QSPR 模型構建與分析比較,確定最適宜的共沸溫度預測模型和共沸組成預測模型分別是利用8/5 個特征描述符所建立的模型(模型5/模型10),2 個模型均具有方程顯著性高、不存在過擬合、對實驗數據具有良好擬合能力等優點,即含水二元共沸物的共沸溫度及組成能被所建模型準確的預測。 模型5 和模型10 的F,LOF,R2,,RMSE 及MAE 分別為280.51/6 373.60、39.880 0/0.001 1、0.960 6/0.997 0、0.957 2/0.996 9、2.940 0/0.016 1 和1.890 0/0.010 4。

2)對2 個模型分別進行內部驗證、外部驗證、應用域分析,發現所建的2 個模型均具有較強的預測能力和泛化推廣性能,其O和分別為0.947 5/0.995 7 和0.9439/0.997 6。

3)與同類模型和UNIFAC 基團貢獻法相比,結果表明,本研究所建共沸溫度及組成QSPR 模型對測試集樣本的預測準確性和泛化推廣能力均優于現有模型,可為工程上其他特殊種類的共沸特性數據的獲取提供一定的參考和借鑒。

猜你喜歡
能力模型
一半模型
消防安全四個能力
幽默是一種能力
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
大興學習之風 提升履職能力
人大建設(2018年6期)2018-08-16 07:23:10
你的換位思考能力如何
努力拓展無人機飛行能力
無人機(2017年10期)2017-07-06 03:04:36
3D打印中的模型分割與打包
抄能力
主站蜘蛛池模板: 久久先锋资源| 中文字幕一区二区人妻电影| 88av在线看| 91福利在线观看视频| 亚洲精品国产自在现线最新| 成人在线综合| 欧美三级日韩三级| 潮喷在线无码白浆| 国产免费好大好硬视频| 亚州AV秘 一区二区三区| 国产精品综合久久久| 欧美日韩91| 国产小视频a在线观看| 亚洲美女高潮久久久久久久| 欧美国产三级| 无码专区在线观看| 一级毛片视频免费| 国产精品性| 亚洲欧美h| 亚洲色欲色欲www在线观看| 国产激情第一页| 伊人精品视频免费在线| 伊人久久精品亚洲午夜| 国产精品冒白浆免费视频| 四虎在线高清无码| 久久精品人人做人人| 国产成人高精品免费视频| 亚洲swag精品自拍一区| 亚洲浓毛av| 就去吻亚洲精品国产欧美| 国产在线观看91精品亚瑟| 无码电影在线观看| 免费在线一区| 亚洲一区二区日韩欧美gif| 免费av一区二区三区在线| 亚洲国产AV无码综合原创| 无码免费视频| 五月天福利视频| 国产精品尤物在线| 精品国产一区二区三区在线观看| 网友自拍视频精品区| 亚洲系列中文字幕一区二区| 毛片基地视频| 国产精品久线在线观看| 久久永久精品免费视频| 亚洲精品视频免费| 国产精品真实对白精彩久久| 精品夜恋影院亚洲欧洲| 狠狠干欧美| 国产精品亚洲专区一区| 国产成人艳妇AA视频在线| 久久久久久久蜜桃| 亚洲综合第一区| 亚洲欧美日韩综合二区三区| 一级成人a毛片免费播放| 婷婷午夜影院| 国产浮力第一页永久地址| 54pao国产成人免费视频| 高清不卡毛片| 经典三级久久| 国产91av在线| 国产日本一区二区三区| 成人福利在线视频免费观看| 亚洲午夜久久久精品电影院| 欧美一级大片在线观看| 人妻熟妇日韩AV在线播放| 国产精品视屏| 黄色网站在线观看无码| 久久99热66这里只有精品一| 国产成人精品优优av| 免费人成黄页在线观看国产| 国产欧美日韩另类精彩视频| 91毛片网| 国产va在线观看免费| 色婷婷综合在线| 亚洲人成网站日本片| 欧美自慰一级看片免费| 香蕉色综合| 亚洲精品第五页| 国产情侣一区| 亚洲成AV人手机在线观看网站| 无码丝袜人妻|