999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

飲用水中揮發性有機物色譜保留時間的神經網絡研究

2018-10-31 00:52:24堵錫華
食品科學 2018年20期
關鍵詞:分子結構模型

堵錫華,王 超

(徐州工程學院化學化工學院,江蘇 徐州 221018)

水是環境中化學物質遷移、循環的重要介質,隨著工業廢水、生活污水的排放,大量的化學污染物進入水體,這些水污染對工農業生產造成了重大的影響,特別是對飲用水及飲料生產造成了大的危害。揮發性有機物是水體中重要的污染物,它包括烯烴、芳烴、鹵代烴等化合物,這些揮發性化合物性質穩定、不易分解,而且有強致癌、致畸、致突變性及致生殖系統和神經系統毒性[1-3],所以評價水質質量的一項特征指標即是飲用水中的揮發性有機物,因此有效并快速鑒別水中痕量揮發性有機物的分析方法和手段成為一項重要工作,目前快速檢測生活飲用水中揮發性有機物的方法主要采用吹掃捕集-氣相色譜-質譜聯用方法[4-6],還有膜萃取分離技術/微捕集與色譜儀聯用技術方法也逐漸成為一種對水中揮發性有機物分析測試的新型手段[7]。另外還有采用偏最小二乘法回歸建立定量結構-保留相關性(quantitative structure-retention relationship,QSRR)模型的方法對飲用水中揮發性有機物進行分析研究有少量的報道[8],在該方法基礎上,進一步結合人工神經網絡方法對飲用水中揮發性有機物進行研究,較少見有報道[9]。

人工神經網絡是一個多學科交叉的前沿學科,它主要以模擬人的大腦,對相關信息進行處理,在食品科學[10]、環境化學[11]、建筑學[12]、農業科學[13]、氣象學[14]、色譜學[15-16]等諸多領域得到廣泛應用。在前期[17-19]工作基礎上,根據文獻[8]所列的56 個飲用水中揮發性有機物的色譜保留數據,采用MATLAB軟件,按照文獻[20-21]方法編寫計算應用程序,計算得到了分子連接性指數、分子形狀指數、電性拓撲狀態指數以及電性距離矢量4類分子結構參數,利用MINITAB 14軟件的最佳變量子集回歸方法,從中篩選了7 種分子結構參數作為神經網絡的輸入神經元,將這些揮發性有機物的氣相色譜保留時間(tR)作為輸出神經元,建立了神經網絡QSRR模型,所得結果顯示,飲用水中揮發性有機物的分子結構參數與其氣相色譜保留值之間具有高度相關的非線性關系,利用該模型計算得到的色譜保留時間預測值與文獻實驗值吻合度較好,本研究可為解決對飲用水中揮發性有機污染物儀器檢測中存在的樣品需要量大、耗費有機溶劑且帶來另外的污染、操作復雜、靈敏度低等問題提供一定的理論幫助,為水中揮發性有機物成分分析提供了參考,而且該法具有準確度高、快速、操作簡單、無污染的一些優點,故對提高生態水質質量的社會環境問題具有現實意義。

1 參數計算及最佳變量選擇

根據文獻[22-24]提出的幾種分子的結構參數——分子連接性指數、分子形狀指數、電性拓撲狀態指數,以及劉樹深[25]、張亞輝[26]等提出的電性距離矢量的計算方法,首先采用Chemoffice 2005中的Chem3D 9.0應用畫圖軟件,勾畫文獻[8]中列出的56 種水中揮發性有機物的分子結構,在MATLAB軟件中用自編程序,計算得到了4類分子結構參數作為描述符,采用最佳變量子集回歸方法,針對揮發性有機物色譜保留時間回歸統計分析,進行結構指數的最優變量篩選,結果見表1。

表1 tR與參數的最佳變量子集回歸結果Table 1 Results of nX, Kn, In, Mn and tR with optimal subset regression

表中R、R2Adj、F、S、FIT依次為相關系數、調整的判定系數、Fischer檢驗值、標準誤差、Kubinyi函數,FIT的計算公式[27]為:

式(1)中:n為有機化合物分子的樣本個數;b為模型采用的變量數;R2為模型的決定系數。FIT值越大,說明建構的模型越穩定,預測能力也就越高。

從表1可以看出,從4類分子結構參數篩選取7 個參數時,所得模型調整的判定系數值最大、標準誤差值最小,將56 個水中揮發性有機物分子及其相關結構參數如表2所示。

表2 揮發性有機物的結構參數Table 2 Structural parameters of volatile organics

續表2

2 模型的建構

2.1 多元回歸模型的建構

文獻[8]中列出的56 種水中揮發性有機物的色譜保留時間,其數據來源于姚祺等[28]通過同一次實驗獲取,該實驗采用7890/5975氣相色譜-質譜聯用儀進行檢測,利用文獻[8]所列的保留時間數據,與優化篩選出的7 種分子結構參數0X、1X、2X、3X、K1、E43和M91進行多元回歸分析,得到七元回歸方程為:

利用式(2)對水中揮發性有機物的色譜保留時間進行預測,所得預測值(表2中的預測值1)與實驗值之間基本吻合。

2.2 模型穩健性與預測能力的檢驗

為檢驗模型的穩健性、預測能力大小,這里應用MINITAB應用軟件中的留一交叉驗證法,對多元回歸模型(2)進行分析檢驗,得到交叉驗證相關系數為0.945,遠大于0.5,說明建立的模型具有較好的預測能力。一般模型的越接近于1,模型的穩定性就越好,預測能力也越強[29],這里所建模型的達到0.945,說明穩定性和預測能力均較強。

評判模型是否具有離域的“異常數據”,雷達圖法是比較典型、直觀和形象的圖形評價方法,可對各種評價對象進行定性評價,通過勾畫56 個分子的Jackknifed調整的判定系數的雷達圖(圖1),可進一步評價判斷模型的穩定性。這里以0.950為圓心,0.002為間距,56 個分子的值全部落在0.950~0.962之間,波動性不大,說明所建模型不存在異常數據。當模型的-值小于0.3時,一般認為模型不存在過擬合現象,這里模型的Jackknifed(0.957)與交互檢驗相關系數(0.945)差值為0.012,值小于0.3,說明本模型既沒有過擬合也沒有離域值存在。

圖1 Jackknifed判定系數R2Adj的雷達圖Fig. 1 Radar map of determination coef fi cient R2Adj

2.3 神經網絡模型的建構

為更好地提高預測色譜保留時間的準確度,采用神經網絡法進一步進行研究。根據表1篩選出的0X、1X、2X、3X、K1、E43和M91共7 個參數,將這7 個參數作為神經網絡的輸入神經元,將56 種揮發性化合物色譜保留時間作為神經網絡的輸出神經元,按照Andrea和許祿[30]等學者的建議規則:

式(3)中:n為樣本個數;M為網絡總權重。

M的計算公式如下:

式(4)中:I、H、Q分別為神經網絡中輸入層、隱含層及輸出層的神經單元數。這里的輸入神經元I為7(即篩選出的7 個分子結構參數);輸出神經元Q為1(即揮發性有機物的色譜保留時間);故根據式(3)和式(4)進行計算,當H取3或4時,可符合規則條件;經反復測試,當H取4時,所得結果最優,故本神經網絡結構采用7∶4∶1的結構方式。

為防止過擬合,將全部樣本數據分為3 組:訓練集(每5 個數據為一組,取其中的第1、3、5個數據)、測試集(第2個數據)、驗證集(第4個數據),由此得到了BP(back propagation)神經網絡預測模型的總相關系數r總為0.999 1,訓練集相關系數r1為0.999 3、測試集相關系數r2為0.998 7、驗證集相關系數r3為0.999 1,利用新建構的神經網絡模型,計算得到水中揮發性有機物的色譜保留時間預測值2見表2,該預測值與實驗值吻合度比較理想,兩者的相對平均誤差僅為2.17%,遠小于利用多元回歸方法模型的預測誤差9.01%,說明神經網絡法建立模型的相關性明顯優于多元回歸分析方法,而且本法結果明顯優于文獻。預測值1、預測值2與實驗值的關系圖見圖2,神經網絡法預測的色譜保留時間,與實驗值的吻合度更好。神經網絡模型的權重和偏置見表3。

圖2 保留時間預測值及其實驗值的關系圖Fig. 2 Relationship between predicted and calculated values of tR

表3 BP-人工神經網絡模型的權重和偏置Table 3 Weights and bias of BP-ANN model

這里所得的預測值為根據模型理論計算所得,模型是否具有更好的普適性,還需要通過實驗測定其他分子的色譜保留時間進行檢驗,這需要下一步開展更多的研究工作進行完善。

3 討 論

根據表1的最優變量子集回歸可以看出,選用分子連接性指數中的0X、1X、2X和3X、分子形狀指數中的K1、電性拓撲狀態指數中的E43和電性距離矢量的M91共7 個變量,與色譜保留時間相關性最優,這些變量中,分子連接性指數中的0X、1X、2X和3X分別代表0~3階路徑指數、分子形狀指數中的K1代表1階形狀特征參數、電性拓撲狀態指數中的E43代表氯原子基團的參數值、電性距離矢量中的M91代表的是第13類原子(—F、—Cl、—Br、—I)之間的相互作用,這7 個變量所代表的基團對方程貢獻最大,這說明在分子的空間結構中,原子之間的連接形式、連接的基團、相鄰原子之間的相互作用對色譜保留時間均能產生影響,其中以空間連接的形式或連接何種基團對分子的貢獻最大。從表2可以看出,隨著揮發性有機物分子中碳原子數目的增加或吸電子基團的存在,分子的體積逐漸增大,分子原子之間的色散作用會逐漸增強,相應的色譜保留時間會逐漸增大[31]。由于單一類的結構參數不能完全反映分子中原子之間復雜的相關影響關系,故將蘊含了空間拓撲結構和電性結構信息的4類結構參數有機融合,在一定程度上揭示分子基團之間的相互作用,充分反映水中揮發性有機物色譜保留時間的變化規律,指數與色譜保留時間之間呈現了良好的非線性關系,利用優化篩選的7個分子結構參數建立的神經網絡模型,對色譜保留時間作出預測的相對平均誤差達到2.17%,結果較為理想,而且通過檢驗穩定性,得到交叉驗證相關系數達到0.945,遠大于0.5,說明模型具有好的穩定性和預測能力。通過對全部56個水中揮發性有機物分子的色譜保留時間進行預測,只有對二氯乙烷和反式-1,1-二氯乙烯2 個分子的預測結果相對誤差偏大,這可能是與連接在相鄰2 個碳原子上的氯原子對空間結構的影響較大、或反式結構的色譜保留時間相對偏小有關。

4 結 論

水中揮發性有機物分子的7 種分子結構參數0X、1X、2X、3X、K1、E43、M91與其色譜保留時間之間,能建立良好的神經網絡QSRR數學模型,所得模型的總相關系數r總與訓練集r1、測試集r2、驗證集r3的相關系數較為吻合,不存在異常的離域值,經留一法交叉檢驗,模型具有良好的穩健性、較強的預測能力(= 0.945);神經網絡法比多元回歸分析具有更好的預測準確度、更強的糾錯能力,能很好地反映蘊含影響色譜保留時間的結構信息,同時也反映出4 類結構參數與其色譜保留時間之間具有良好的非線性關系。

猜你喜歡
分子結構模型
把握分子結構理解物質的性質
中學化學(2024年5期)2024-07-08 09:24:57
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
三步法確定有機物的分子結構
壓裂返排液中瓜膠濃度檢測及分子結構解析
解讀分子結構考點
中學化學(2016年10期)2017-01-07 08:37:06
外電場中BiH分子結構的研究
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 欧美精品二区| 亚洲国产成人精品无码区性色 | 亚洲色中色| 亚洲性视频网站| 国产精品视频猛进猛出| 精品伊人久久久久7777人| 啪啪永久免费av| 久久久久亚洲精品成人网| 免费视频在线2021入口| 黄色网站在线观看无码| 亚洲成a人片77777在线播放| 日本草草视频在线观看| 国产精品久久久久鬼色| 日本黄色不卡视频| 久久黄色免费电影| 婷婷六月综合| 中文字幕人成人乱码亚洲电影| 91啪在线| 日韩av在线直播| 国产精品美女网站| 国产免费好大好硬视频| 国产网友愉拍精品视频| 久久免费视频6| 久久香蕉欧美精品| 午夜精品影院| 亚洲综合狠狠| 免费观看亚洲人成网站| 亚洲男人的天堂网| 狠狠色丁香婷婷综合| 久久亚洲高清国产| 久久综合结合久久狠狠狠97色| 爆操波多野结衣| 九月婷婷亚洲综合在线| 日本精品视频一区二区| 精品综合久久久久久97超人| 国产爽妇精品| 亚洲欧美综合在线观看| 亚洲无码四虎黄色网站| 国产福利2021最新在线观看| 久久国产亚洲偷自| 午夜在线不卡| 欧美精品一区在线看| 伦伦影院精品一区| 国产二级毛片| 亚洲无线视频| 青草精品视频| 她的性爱视频| 亚洲一区二区约美女探花| 日韩色图区| 中文字幕乱妇无码AV在线 | P尤物久久99国产综合精品| 亚国产欧美在线人成| 色综合五月| 亚洲天堂免费| 香蕉蕉亚亚洲aav综合| 亚洲一区二区黄色| 丝袜高跟美脚国产1区| 2021国产在线视频| 亚洲三级影院| 欧美日韩在线亚洲国产人| 亚洲无码免费黄色网址| 欧美午夜视频在线| 中国特黄美女一级视频| 久青草免费在线视频| 亚洲三级a| 国产精品欧美激情| 亚洲综合精品香蕉久久网| 9久久伊人精品综合| 伊人久久精品亚洲午夜| 极品av一区二区| 男人的天堂久久精品激情| 国产亚洲精品97在线观看| 日本91在线| 亚洲免费黄色网| 国产精品久久国产精麻豆99网站| 91毛片网| 熟妇丰满人妻av无码区| 久久这里只精品国产99热8| 欧美一区二区精品久久久| 亚洲无码一区在线观看| 国产拍揄自揄精品视频网站| 国产精品xxx|