朱騰義,李毛,吳晶
揚州大學環境科學與工程學院,揚州 225127
疏水性有機污染物(hydrophobic organic contaminants,HOCs)具有致癌、致畸和致突變性,且難以在環境中徹底去除[1-2],在環境中常以痕量甚至超痕量的形式存在,并對生物體造成嚴重危害,因此測定環境介質中的HOCs濃度是一項十分有必要的工作。傳統的采樣方法(主動采樣)難以有效地監測污染物,具有很多局限性,比如主動采樣法需要大量的時間和精力,成本較高,僅能提供污染物濃度的瞬時值等[3]。而被動式采樣技術是一種可以實現大量采樣來監測HOCs在環境介質中濃度的技術,它是一種基于分子擴散或滲透原理來富集環境介質中有機污染物的平衡采樣技術[4]。被動采樣技術不需要外部提供能量,集采樣、分離、濃縮、分析于一體,實現了少溶劑甚至零溶劑操作。因此,該技術被稱為一種“綠色化學分析方法”[5]。目前,被動式采樣已成為環境中HOCs濃度監測技術,在歐洲、北美洲、澳大利亞、新西蘭、日本及我國的香港臺灣地區都得到了廣泛的研究和應用[6-8]。
近年來,很多研究應用聚乙烯被動采樣器采集水相[9-14]和氣相[15-17]中的有機污染物。聚乙烯被動采樣器由于成本低、操作容易、吸附行為簡單、較快達到吸附平衡等優點[18],而廣泛應用于痕量有機污染物的檢測。有機污染物在被動采樣材料與水相或氣相之間的平衡分配系數(KPW或KPA),是權衡被動采樣器性能的重要指標[19]。但有機污染物的KPW值和KPA值很有限,大部分都需要經過實驗測定獲得,然而實驗方法卻非常繁瑣[20],無法逐個測定數量繁多的污染物,因而需開發一種預測方法以定量預測有機污染物的KPW值或KPA值。
定量結構性質關系(QSPR)和基于線性溶解能關系(LSER)的方法能夠有效預測有機污染物的物化性質、毒性效應和環境行為[21]。Sacks和Lohmann[13]用正十六烷-水分配系數預測了烷基酚和二氯苯氧氯酚的聚乙烯-水分配系數,其決定系數R2為0.984;Josefsson等[22]用正辛醇-水分配系數預測了8種PAHs(多環芳香烴)和11種氧化PAHs的聚甲醛-水分配系數,決定系數R2分別為0.96和0.91。Endo等[19]基于線性溶解能關系(LSER)建立了79種化合物的聚丙烯酸酯-水分配系數模型,決定系數R2為0.97。然而,關于預測有機污染物在聚乙烯被動采樣器與氣相之間的平衡分配系數(KPA)的研究鮮有報道。本文搜集整理了一些多環芳香烴(PAHs)和多氯聯苯(PCBs)的KPA的實測值,首次嘗試構建基于理論線性溶解能關系(TLSER)和定量結構性質關系(QSPR)的2種預測模型,并對模型進行表征和機理解釋。
經文獻檢索和數據整理[23-24],得到3個多環芳香烴(PAHs)和27個多氯聯苯(PCBs)在聚乙烯被動采樣材料與氣相之間的平衡分配系數KPA的實測值。對應的溫度范圍為20~25 ℃,其logKPA的數值范圍為6.30~10.10。
將30個有機物以4:1的比例隨機拆分為訓練集和驗證集,訓練集中的數據用于建立模型,驗證集中的數據用于驗證模型。
采用ChemBio3D Ultra 12.0軟件生成初始有機物分子結構,運用Minimize Energy及MOPAC 2016模塊的PM7算法,對化合物結構進行優化并獲得穩定構型。其次,根據優化后有機物的穩定結構,運用PaDEL-Descriptor[25]軟件計算分子結構描述符。
1) 基于理論線性溶解能關系(TLSER)的模型的構建
Wilson等[26]和Famini等[27]提出理論線性溶解能關系(TLSER)模型,即采用通過理論計算得到的參數,而非實驗測定的參數來構建LSER模型。
SP=k+aVmc+bα+cεb+dqD-+eεa+fqH+
其中,SP表示有機物溶解或分配的性質,Vmc為分子McGowan體積,α表示分子極化率,εb表示有機物提供質子的能力(為溶質的最高占據軌道能-水的最低占據軌道能),εa表示有機物接受質子的能力(為溶質的最低占據軌道能-水的最高占據軌道能),k為常數項,a、b、c、d、e和f為多元線性回歸系數。
使用SPSS 20.0軟件中的多元線性回歸(MLR)構建基于理論線性溶解能關系(TLSER)的預測模型。
2) 定量結構性質關系(QSPR)模型的構建

采用基于標準殘差(δ)和leverage值(以hi表示,i代表不同的有機物)定義的Williams圖[28]表征預測模型的應用域。
1)基于理論線性溶解能關系(TLSER)的預測模型
logKPA=0.037α+0.787
(1)

2)QSPR預測模型
logKPA=0.105SPabs_Dzm+1.188
(2)

模型的驗證在QSPR建模過程中非常重要,分為內部驗證和外部驗證。內部驗證可檢驗模型的穩健性,而外部驗證檢驗模型的預測能力。需對模型的性能進行綜合評價的基礎上應用模型。
已證明統計上顯著有效,且穩健的模型,也并不能對所有化合物作出準確可靠的預測,即有必要對建立的模型定義應用范圍。主要基于范圍、距離、幾何、概率密度分布等方法定義訓練集樣本的特征空間,即模型的應用域[29]。
2種模型的應用域表征如圖2所示。訓練集和驗證集中的有機物的標準殘差|δ|<3,且所有有機物的leverage值均小于警戒值h*,說明模型中沒有離群點。因此,2種預測模型均能用于預測應用域內的其他有機物的logKPA值。

圖1 logKPA的實測值與預測值擬合關系圖Fig. 1 Plot of the experimental and predicted logKPAvalues

表1 疏水性有機污染物(HOCs)的logKPA值及參數值Table 1 The logKPA of hydrophobic organic contaminants (HOCs) and descriptor values
注: 帶*的化合物為驗證集。Note: The compounds with*selected as the validation set.

表2 2種模型和前人模型參數的比較Table 2 Comparison of two models from the current study with previous studies
注: —表示來源文獻中未報道。Note: —Unreported.
理論線性溶解能關系(TLSER)模型包含一個描述符,即α,其與logKPA值呈正相關。平均極化率α表征分子的體積性質,分子體積是形成空穴時吸收能量效應的量度。具有較大體積的分子在空氣中形成空穴所需要的能量遠大于在弱極性有機物中所需要的能量,于是有機物分子更偏向借助空穴的形成分配在被動采樣材料內,即具有較大α值的分子更容易分配到聚乙烯相中,即logKPA值也越大。

本文構建的2種模型與前人的一些模型進行比較,見表2。與前人模型相比,本文構建的2種模型所用的有機物種類和數量更多,且對模型進行了外部驗證和應用域表征。
綜上,本研究基于理論線性溶解能關系和定量結構關系,構建了KPA的TLSER和QSPR預測模型,統計參數表明2種模型均具有良好的擬合優度、預測能力和穩健性。此外,對模型進行了應用域表征,結果表明,2種模型可用于預測應用域內其他有機污染物的logKPA值,可為快速獲取疏水性有機污染物在被動采樣材料與環境介質中的分配系數,提供理論基礎和技術支持。