王柔荑,王中鈺,于洋,林軍,傅志強,*,李雪花,陳景文
1. 工業生態與環境工程教育部重點實驗室,大連市化學品風險防控及污染防治技術重點實驗室,大連理工大學環境學院,大連 116024 2. 生態環境部固體廢物與化學品管理技術中心,北京 100029
化學品對經濟發展和人類生活質量改善至關重要。近年來,我國化學品市場需求不斷增長,化學品銷售額預計將于2030年占全球近一半[1]。然而,化學品的潛在危害性會對生態和人體健康構成嚴重威脅[1-3]。有必要對化學品進行合理管控,以保障公眾健康和環境安全,實現社會可持續發展。
風險評價是對化學品進行健全管理和污染防治的前提,其關鍵在于化學品的暴露和危害性評價。化學品暴露是導致風險的前提,可分為外暴露和內暴露。外暴露一般指環境暴露,由化學品的源釋放及其環境遷移分配、降解轉化行為所決定;內暴露即化學品在生物體內或者特定靶點的暴露,與危害性直接關聯;危害性指化學品在特定暴露條件下對生物體或生態系統產生有害效應的能力[4]。傳統的化學品風險評價方法依賴于實驗測試。然而,由于目前全球市場中注冊的化學品及其混合物已超過35萬種[5],且化學品的環境行為與毒性效應機制高度復雜,實驗測試方法在高效、低成本地獲取化學品暴露和危害性參數方面存在局限,難以滿足化學品風險評價的需求[6-8]。
計算毒理學技術被視為應對上述挑戰的重要工具[9-10]。計算毒理學基于計算化學、系統生物學等原理構建數學或計算機模型,可銜接化學品的源釋放量、環境介質濃度、靶點暴露劑量、毒性效應閾值等關鍵數據,實現不同種類化學品從暴露到導致危害效應連續過程的高通量準確預測。其中,定量構效關系(QSAR)模型可為化學品暴露和效應模擬提供關鍵參數、填補相關數據空白,是計算毒理學的核心工具[4]。
歐美國家較早認識到計算毒理學方法的應用潛力,積極開展相關研究推動其發展和應用,形成了一系列面向化學品風險預測的計算毒理學軟件[11-13]。一些可預測化學品暴露或/和危害性參數的軟件已在化學品信息申報、優先測試化學品篩選和綠色化學品研發等活動中得到了廣泛應用。本研究選取目前已發展的、可預測化學品環境暴露/危害性質參數的計算毒理學軟件作為研究對象,從多個維度對它們進行比較,討論其開發條件、應用現狀和未來的進步空間,以期為我國在化學品管理中發展和應用此類軟件或平臺提供參考。
本研究系統地搜集并選取國內外25款可預測化學品暴露/危害性的計算毒理學軟件進行比較研究。通過瀏覽軟件網頁介紹和閱讀用戶指導手冊,統計軟件的所屬國別、授權方式(免費/商用)、發行方式(單機/網絡)、發行時間和主要開發者等基本信息。
“終點(endpoint)”指在特定實驗條件下被測量和建模的物理化學、環境或生物效應指標[14]。本文考察了不同軟件對理化性質、環境行為、生態毒性、人體健康毒性和毒代動力學性質參數等5類終點的覆蓋情況,并利用Python軟件(版本3.9)將結果以熱圖形式呈現。
以軟件名稱為關鍵詞,在Web of Science檢索預測方法相關文獻,并利用軟件自帶的模型介紹和歐盟委員會聯合研究中心(JRC)的QSAR模型數據庫[15],對軟件的預測手段、模型建模方法、分子描述符及應用域表征方法進行統計。
實際操作和試用了12款可免費獲取的軟件,分別是EPI Suite (版本4.1.1)、OECD QSAR Toolbox (版本4.2.2)、T.E.S.T. (版本4.2.1)、Toxtree (版本3.1.0)、Lazar (版本1.4.2)、OncoLogic (版本8.0)、VEGA (版本1.1.5)、OPERA (版本2.6)、Danish QSAR Database/Models、ProTox Ⅱ、AdmetSAR 2和CPTP。統計了軟件具有的功能,并從模型和預測不確定性等方面考察軟件的信息完整度。
此外,為了分析上述軟件的預測準確度,對軟件中提供的模型預測性能信息進行了統計,共統計了正辛醇/水分配系數、魚類急性毒性、生物富集因子、生物降解性和致突變性模型的內外部驗證準確性指標。進一步選擇常用的廣譜殺菌劑“百菌清”作為預測對象(CAS: 1897-45-6),選擇正辛醇/水分配系數(octanol-water partition coefficient,Kow)、黑頭軟口鰷96 h半數致死濃度(lethal concentration 50%, LC50)(mg·L-1)和魚類生物富集因子(bioconcentration factor, BCF)(L·kg-1)作為預測終點,比較各軟件的預測準確度。
統計的25款軟件中,20款由歐洲和美國開發,2款由中國開發,日本、加拿大、經濟合作與發展組織(OECD)開發的軟件各有1款(表1)。這些軟件的開發應用與其服務的國家或地區的化學品管理制度密切相關。EPI Suite、ECOSAR (已被整合于EPI Suite中)和Oncologic等由美國環境保護局(US EPA)開發,輔助其在《有毒物質控制法》(TSCA)下開展化學品風險評價工作。Toxtree、OECD QSAR Toolbox和VEGA等主要服務歐盟的《化學品注冊、評估、許可和限制》(REACH)法規,鼓勵企業利用計算工具對產品進行風險篩查,或幫助企業填補化學品申報所需信息。Leadscope、CaseUltra、ToxGPS和Derek Nexus等面向美國食品和藥物管理局(US FDA),提供滿足《人用藥品注冊技術要求國際協調會(ICH)三方協調導則》要求的預測模型。另外,REACH法規和TSCA對化學品風險評價成本的內部化,催生了面向綠色化工設計的商用軟件,如ACD/Percepta、ADMET Predictor和ChemTunes/ToxGPS等。
歐美國家的軟件開發參與者跨越了政、商、研各界。首先,歐美國家的政府較早組建了多學科背景的研究團隊,并由政府機構如US EPA、JRC等組織收集建模關鍵數據與模型資源,為監管機構主導開發預測軟件提供了充分的條件。發達國家嚴格的管理法規還催生了一批提供化學品風險評價服務的商業公司,可獨立開發預測軟件。此外,非盈利性的獨立研究團隊開發了部分免費軟件,如ProTox Ⅱ、AdmetSAR 2等,作為QSAR模型的共享平臺。大部分預測軟件的開發涉及了政、商、研三方或兩兩合作,還有在大型國際合作項目下開發的軟件如VEGA和OECD QSAR Toolbox,體現了社會各界良好的合作模式以及數據共享機制對計算毒理學軟件開發的重要性。統計表明,2款由我國研發的軟件:CPTP和AdmetSAR 2,均由高校研究團隊獨立開發。鑒于計算毒理學軟件在化學品風險評價和管理中的先進性和實用性,未來需要彌補我國政府和商業界在此類工具開發中的缺位。
軟件的預測終點覆蓋度體現了其應用范圍(圖1)。統計結果表明,上述25款計算毒理學軟件的預測終點涵蓋了理化性質、環境行為、生態毒性、人體健康毒性和毒代動力學參數等5類。其中,理化性質類參數表征化學品的基本性質,一方面可評估化學品的物理危害,為其儲存、運輸和使用方式提供參考;另一方面可作為預測化學品環境行為及毒性的重要輸入參數;環境行為類參數描述化學品的遷移、轉化和歸趨,評估化學品的環境持久性或從環境轉移到生物體中的潛力;生態毒性終點考察化學品對非人類物種產生危害的能力,評估化學品對生態系統結構和功能造成的影響;人體健康毒性終點包含了化學品對人體不同尺度層級(個體、器官、細胞和生物大分子)的有害效應,評估化學品的人類健康風險;毒代動力學參數包括與毒物在生物體吸收、分布、代謝及排泄過程相關的參數,可預測化學品的生物有效濃度和作用于特定靶點的濃度,輔助體外(invitro)-體內(invivo)毒性效應閾值的外推[16]。
統計表明,水溶解度、正辛醇/水分配系數、生物降解性、水生生物積累性、淡水水生生物毒性、體外致突變性和致癌性等是軟件中常見的預測終點。相比之下,軟件對環境光化學降解性,陸生生物的生物積累性和急性毒性,免疫、神經、生殖毒性,以及大部分毒代動力學參數覆蓋較少。不同終點被覆蓋次數的差異,可能與法規對該終點的重視程度,對應實驗數據的數量和質量,以及對終點相關機理的理解程度有關[13]。

表1 面向化學品風險預測的計算毒理學軟件Table 1 Computational toxicology software for chemical risk prediction
此外,EPI Suite、PBT Profiler中包含了Ⅲ級多介質環境逸度模型,可結合環境參數、分配參數和降解參數,預測物質在環境各相中的半衰期,有助于評價物質的總體環境持久性[17]。部分軟件的人體健康毒性相關終點中涵蓋了分子層級的毒性信號通路,如物質與核受體(雌激素、雄激素和甲狀腺激素等)的結合能力(Danish QSAR Models, AdmetSAR2, ProTox Ⅱ等)、hERG通道抑制作用(ACD/Percepta, AdmetSAR2, CASE Ultra)等。這些終點對應頂層毒性的分子起始事件(MIEs),可與有害結局路徑(AOP)框架結合,從毒性作用機理出發預測化學品潛在疾病風險[18]。

圖1 軟件涵蓋的預測終點注:A1-水溶解度;A2-正辛醇/水分配系數(Kow);A3-沸點;A4-蒸汽壓;A5-熔點;A6-正辛醇/空氣分配系數(Koa);A7-解離常數;A8-亨利定律常數;A9-有機碳吸附系數(Koc);A10-密度;A11-表面張力;A12-顆粒物/空氣分配系數(Kp);A13-黏度;A14-閃點;A15-空氣/水分配系數(Kaw);A16-自燃點;A17-極化度;A18-熱導率;A19-爆炸性;A20-氧化性;A21-可燃性;A22-脂溶性;B1-生物降解性;B2-生物富集因子(BCF);B3-水解性;B4-大氣氧化性;B5-生物轉化速率(魚);B6-環境相間分配;B7-生物積累因子(BAF);B8-各介質內半衰期;B9-光降解性;B10-生物放大因子(BMF);C1-水生生物物毒性;C2-陸生生物毒性;C3-微生物抑制作用;C4-沉積物生物毒性;D1-致突變性;D2-致癌性;D3-致敏性;D4-急性毒性;D5-皮膚刺激性/腐蝕性;D6-基因毒性;D7-眼損傷/刺激性;D8-發育毒性;D9-毒性信號通路;D10-肝毒性;D11-生殖毒性;D12-心臟毒性;D13-重復劑量毒性;D14-神經毒性;D15-免疫毒性;D16-光致毒性;E1-代謝;E2-DNA/蛋白質結合能力;E3-血腦屏障穿透性;E4-皮膚滲透性;E5-胃腸道吸收;E6-排泄。Fig.1 Prediction endpoints covered by the softwareNote: A1-Water solubility; A2-Octanol-water partition coefficient (Kow); A3-Boiling point; A4-Vapor pressure; A5-Melting point; A6-Octanol-air partition coefficient (Koa); A7-Dissociation constant; A8-Henry’s Law constant; A9-Organic carbon-sorption partition coefficient (Koc); A10-Density; A11-Surface tension; A12-Particle-gas partition (Kp); A13-Viscosity; A14-Flashpoint; A15-Air-water partition coefficient (Kaw); A16-Self-ignition point; A17-Polarizability; A18-Thermal conductivity; A19-Explosive properties; A20-Oxidizing properties; A21-Flammability; A22-Fat solubility; B1-Biodegradation; B2-Bioconcentration factor (BCF); B3-Hydrolysis; B4-Atmospheric oxidation; B5-Biotransformation; B6-Distribution between environmental compartments; B7-Bioaccumulation factor (BAF); B8-Half life in each medium; B9-Photodegradation; B10-Biomagnification factor (BMF); C1-Aquatic toxicity; C2-Terrestrial toxicity; C3-Microbial inhibition; C4-Sediment toxicity; D1-Mutagenicity; D2-Carcinogenicity; D3-Skin/respiratory sensitization; D4-Acute toxicity; D5-Skin irritation/corrosion; D6-Genotoxicity; D7-Eye damage/irritation; D8-Developmental toxicity; D9-Toxicological signal pathways; D10-Hepatotoxicity; D11-Reproductive toxicity; D12-Cardiotoxicity; D13-Repeated dose toxicity; D14-Neurotoxicity; D15-Immunotoxicity; D16-Photoinduced toxicity; E1-Metabolism; E2-DNA/protein binding; E3-Blood-brain barrier penetration; E4-Skin penetration; E5-Gastrointestinal absorption; E6-Excretion.
化學品的部分參數值如Kow和大氣氧化性等,與溫度、pH值等環境條件相關。多數軟件僅能預測單一環境條件下的參數值。在統計的軟件中,ACD/Percepta考慮了pH值對可解離化學品Kow值的影響,可預測化學品在pH從1到9時的Kow值。CPTP軟件可在用戶設定的環境溫度下,預測化學品與羥基自由基或臭氧的反應速率常數。
軟件使用的預測方法、分子描述符和模型的應用域表征方法共同構成軟件的方法體系,是影響其預測機理透明度和結果可靠性的重要因素。
2.3.1 預測方法
統計的計算毒理學軟件中用到的預測手段可分為交叉參照(read-across, RA)、QSAR和專家系統3種(表2)。它們均基于“結構相似的化合物往往具有相似活性”的相似性原理,但應用于化學品管理時存在不同的優勢和局限。
RA將化學品按相似性分組,再利用相似化合物的已知實驗數據推測目標物對應的數據空缺,結果可靠性很大程度上取決于分組步驟的相似性判斷依據[19]。統計中以RA方法為主的軟件Toxmatch和OECD QSAR Toolbox都包含多種相似性度量方法。Toxmatch中包含了基于描述符的相似度指標,如Euclidean距離指數、Tanimoto和Hodgkin-Richards系數,同時包含了基于結構的相似度指標,如Tanimoto指數、Hellinger距離指數和最大公共子結構(maximum common substructure, MCS),以及多個針對毒性預測的預定義分類方案。OECD QSAR Toolbox軟件支持用戶根據預測終點選用不同特征定義相似物質并分組,包括了物質結構(特定結構碎片、活性基團、有機官能團或化學元素)、理化性質(性質參數如logKow、分子量的數值范圍)、作用機制(警示結構)或毒理學效應(與生物大分子相互作用的大小)等[20-21]。RA軟件不需要預先構建模型,但要求用戶對與終點相關的機理有一定的認識,更適合具有專業背景的人使用。
QSAR模型基于特定的原始數據集(訓練集),建立物質微觀結構與其理化性質/環境行為/毒理效應參數的統計學關系,在化學品性質預測中得到了廣泛的應用[22]。在統計的軟件中,QSAR模型用到了多元線性回歸、偏最小二乘回歸、隨機森林、邏輯回歸、k近鄰學習、支持向量機、神經網絡等統計學方法和機器學習算法構建模型(表3)。訓練集物質在結構或作用機制上的差異可能影響QSAR模型的預測性能。為了應對這一問題,Lazar軟件將k近鄰學習與支持向量機結合,在預測時自動篩選相似化合物作為訓練集生成局部模型[23]。T.E.S.T.軟件中也包含一種類似的局部多元線性回歸模型[24]。UL’s Cheminformatics Tool Kit軟件使用的RASAR模型,利用相似度作為特征向量構建隨機森林模型,也增加了個體預測結果的置信度[25]。
專家系統是使用規則預測物質活性的方法,一般用到了“警示結構(structure alerts, SAs)”的概念。SAs指與物質毒性相關的化學結構[26]。統計的專家系統軟件利用從文獻中獲取的專家知識(OncoLogic, Hazard Expert, Derek Nexus, Toxtree, Leadscope)或對原始數據集的統計分析(Case Ultra),構建闡明SAs與毒性關系的規則模型。基于引發活性的SAs建模,導致大部分專家系統難以識別非活性化合物,容易給出假陽性預測,因此在化學品風險評價中不能用于給出結論性的毒性預測,但可在化學品風險的分層評價策略中用于篩查毒性潛力,確定需優先進行invitro測試的化合物[27]。除此之外,專家系統還可應用于RA,基于毒性作用機制進行物質分組;可與QSAR模型結合使用,進行模型的機理域表征,但這一功能在統計的軟件中沒有得到應用。

表2 軟件的預測手段Table 2 Prediction approaches of software
2.3.2 分子描述符類型
分子描述符是關聯分子結構與活性的重要媒介,是QSAR建模的核心。統計的軟件普遍使用易于獲取和計算的分子性質、組成、拓撲描述符或分子指紋表征分子特征(表4)。其中,分子性質為分子的理化參數,如正辛醇/水分配系數、水溶解度、分子量等,可通過實驗或計算方式獲取;組成描述符反映分子的化學成分,包括原子、鍵、環或結構片段的數量等;拓撲描述符基于表征分子圖的矩陣計算獲得,編碼關于原子排列和連通性的信息[28-29];分子指紋是通過構造布爾或整型向量,描述子結構或碎片模式存在與否的分子結構表征方式,常用于化合物相似性搜索、聚類和分類[30]。相比之下,基于分子立體結構計算的描述符,如幾何描述符、量化描述符,由于涉及復雜的構象優化過程,在軟件中應用較少。其中,幾何描述符可表征分子三維構象信息,能更深層次地闡釋分子結構特征[28];量化描述符呈現分子的電子結構與能量信息,物理意義明確,可解釋性強,適用于光解、大氣降解、氧化還原等化學反應性主導的終點的預測[31],在未來有較大的應用潛力。
2.3.3 應用域表征方法
QSAR和專家系統模型都僅在一定的化學空間內適用,該空間被稱為應用域[22]。部分軟件能給出預測是否在應用域內的提示,以幫助用戶評估預測結果的可靠性。
統計中的部分軟件采用基于描述符空間范圍(描述符域)或/和目標物與訓練集化合物的結構相似性(結構域)的方法表征模型應用域[32]。其中,軟件采用的描述符域表征方法普遍為考察描述符取值范圍,OPERA和CPTP軟件采用了基于杠桿值計算目標物與訓練集在描述符空間中的距離的方法[33-34]。軟件的結構域表征方法主要為計算結構相似性指數,如Tanimoto系數。EPI Suite、BIOVIA和VEGA采用了篩查比對訓練集與目標物結構特征的方法,當目標物中出現訓練集未包括的子結構時,判斷為在模型結構域外(表5)。對于宏觀毒性效應,分子結構細微的變化也可能引起活性的突變[28],致使前2種應用域表征方法無法保證預測的可靠性。ACD/Percepta、T.E.S.T.和VEGA可通過考察模型對相似物的預測性能識別這種情況,隱含了對模型機理域的考慮[35]。

表3 軟件中QSAR模型使用的建模方法Table 3 Modeling techniques used by QSAR models in software
早期的專家系統軟件大多以引發SAs作為預測在應用域內的判斷依據。但警示結構也只有在特定的化學結構空間內才有效,導致模型常給出假陽性的預測。Derek、OECD QSAR Toolbox和Case Ultra軟件中通過加入判斷警示結構應用域的方法,增強了模型的預測性能[36-38]。
2.4.1 軟件功能
統計的軟件都支持多種輸入形式,具有將CAS號或分子平面圖轉換為簡化分子線性輸入規范(simplified molecular input line entry system, SMILES)的功能。部分軟件允許以不同形式的文件下載預測結果。其中,OECD QSAR Toolbox能生成符合歐洲化學品管理局(ECHA)官方要求的結論報告,直接用于物質申報。部分軟件能實現化合物的批量處理和多終點預測,提高了軟件使用效率(表6)。
除了基本的預測功能外,部分軟件還包含了特殊功能,進一步提升軟件結果科學性、用戶友好度、或滿足用戶多方面的需求。Danish QSAR Database/Models和AdmetSAR 2提供了數據庫查詢功能,AdmetSAR 2還能輔助用戶進行分子優化,拓展了其在化學品研發中的應用。基于警示結構的專家系統軟件Toxtree支持用戶對軟件中的決策樹進行查詢和修改,并擁有自定義決策樹的功能。利用RA進行預測的OECD QSAR Toolbox軟件,由物質識別、物質分析、物質分類、數據收集、預測和報告六大模塊構成了一套可供用戶自主操作的工作流程,允許用戶自選數據庫、相似性判斷依據和數據填充方法,還支持人為替換趨勢分析公式中的自變量,為具有專業背景的用戶提供更好的服務。

表4 軟件使用的分子描述符Table 4 Molecular descriptors used in the software

表5 應用域表征方法Table 5 Methods used to characterize the applicability domain

表6 軟件功能比較Table 6 Comparison of software functions
2.4.2 軟件的信息完整度
面向化學品風險評價的計算毒理學軟件作為管理中的決策支持工具,有必要對使用的模型和預測結果不確定性提供詳細的信息,以幫助用戶對模型有效性和預測結果可靠性進行評估。12款可免費獲取的軟件提供信息的情況如表7所示。
研究以OECD的QSAR驗證導則為依據,考察各軟件的模型信息完整度。根據導則對用于管理活動的QSAR模型的要求,軟件應對其使用的QSAR模型同時提供明確定義的預測終點、明確的算法、模型應用域、模型性能的度量以及盡可能提供模型的機理解釋[14]。另外,考慮到建模數據質量和數量對模型性能的影響[39],是否提供建模原始數據也被納入考察范圍。統計中,EPI Suite、VEGA、OECD QSAR Toolbox包含模型信息較為完整,但部分軟件存在信息的缺失,可能限制其在管理中的實際應用。軟件可通過給出應用域評估、目標物實驗值及類似物數據,幫助用戶評估預測結果的不確定性。統計中,OECD QSAR Toolbox、T.E.S.T.、Lazar、VEGA和OPERA同時給出了這3種信息,EPI Suite、Toxtree、OncoLogic、AdmetSAR 2和CPTP軟件給出相關信息較少。此外,部分軟件通過提供開發背景信息發揮軟件的科普功能,通過提供用戶手冊或界面操作提示等方式掃除用戶的使用障礙,增強了軟件對非專業用戶的友好度。
2.4.3 QSAR軟件預測準確度比較
表8統計了7款軟件中具有代表性的QSAR模型的預測性能指標。在回歸模型中,各軟件的正辛醇/水分配系數和生物富集因子模型對驗證集和測試集的R2均在0.8左右,具有較好的預測能力,然而魚類急性毒性模型的R2均在0.7以下,預測性能相對較低。各軟件中生物降解性和致突變性2種分類模型的準確度均在0.8左右,具有較好的分類效果。
將軟件對“百菌清”3個終點(endpoint)的預測結果與實驗值比較(表9),各軟件對LC50的預測結果差異大且均與文獻值有較大差距,表明上述軟件對水生生物毒性的預測性能有待提高。正辛醇水分配系數(logKow)和生物富集因子(logBCF)的預測值與實驗值接近,其中CPTP對logKow的預測值和EPI Suite、VEGA對logBCF的預測與實驗值最接近。
綜合用戶友好度、終點覆蓋數量、信息全面度和軟件功能對實際操作的12款軟件進行評價,推薦目前在化學品管理中可使用EPI Suite、VEGA和OECD QSAR Toolbox軟件。這3款軟件都具有操作簡單、界面友好、覆蓋終點數量較多、模型信息全面的特點。其中EPI Suite和VEGA軟件可實現批量預測和多終點同時預測,適合輔助監管機構開展大量化學品的風險評價;OECD QSAR Toolbox具有極高操作自由度,可提供詳細的預測報告,適合輔助企業的化學品注冊登記時所需的信息申報。
根據統計分析,所搜集的軟件在預測終點覆蓋度、預測結果可靠性、應用方法先進性和實用性等方面仍存在局限。軟件對部分值得關注的終點,如環境光化學降解性、陸生生物積累性的覆蓋較少,對不同終點的預測性能存在差異,且大多未能考慮環境條件對性質參數的影響。統計軟件中對三維分子描述符及復雜模型算法,如深度神經網絡的應用較少,未能發揮新興建模技術在大數據分析和預測性能提升方面的應用潛力[40-41]。未來應逐漸擴充軟件的預測終點,積累高質量的數據資源作為建模原始數據,擴增軟件對三維描述符的運算和存儲功能,并將深度神經網絡等先進方法應用于軟件模型的構建,以提升軟件的預測性能,并擴大其應用范圍。此外,還應保證軟件的用戶友好度和信息完整度,以引導公眾探索興趣,增強專業用戶使用信心,以及支持化學品管理決策。
在功能方面,軟件可支持用戶發展自定義的預測模型,還可提供數據查詢等拓展功能,以滿足用戶多方面的需求。可將多介質環境模型、毒代動力學模型和系統生物學模型等納入軟件的模型體系,結合軟件的參數預測功能,實現對化學品從暴露到導致危害效應連續過程的模擬預測。另外,除了作為性質預測工具,計算毒理學軟件還可納入集成評估框架和決策分析工具,形成集預測、評估和決策分析于一體的智能決策支持系統,在未來的化學品管理活動中發揮更大的作用。

表7 軟件信息完整度比較Table 7 Comparison of software information comprehensiveness

表8 軟件中代表性QSAR模型的預測性能Table 8 Predictive performance of representative QSAR models in the software

表9 百菌清代表性終點的實驗值和預測值比較Table 9 Comparison of experimental and predicted values of the representative endpoints of chlorothalonil
歐美國家較早開始重視計算毒理學工具在化學品風險管理中的應用,在法規層面上將其納入化學品風險評價的方法體系,并通過社會各界合作交流促進了信息共享和多學科的融合,為計算毒理學軟件的開發創造了良好的條件。這些軟件又為歐美國家的化學品管理提供了信息化技術支持。與國外相比,我國的計算毒理學研究還處于起步階段,相關技術的應用潛力未能得到充分發揮。近年來,我國的化學品生產規模不斷擴大,化學品管理任務日益艱巨,因此急需借鑒美國和歐盟的成功經驗,推進計算毒理學研究和預測工具的開發和應用,以輔助化學品風險評價和管理工作的開展。結合我國的實際情況,提出以下幾點建議。
(1)健全我國化學品管理法規,形成對新化學物質和市場現有化學品的全面風險管理,增加化學品管理中應用計算毒理學技術的需求。
(2)制定化學品風險預測技術方法規范和導則,指導實用性預測工具的開發與應用。
(3)加強交叉學科人才培養及多學科合作交流平臺的搭建,推動計算毒理學研究團隊的組建與發展。
(4)加強學術界與政府、企業的合作。政府通過政策和資金方面的支持,鼓勵高校及科研機構面向國家化學品管理與相關企業進行化學品注冊登記、綠色設計等需求,有針對性、系統性地進行計算毒理學研究及相關實用工具的研發。
(5)加強社會各界及化學品管理機構之間的信息共享,探索數據持有者與模型開發者的數據共享的機制,鼓勵研究機構搭建大型的模型庫或模型網絡共享平臺,為軟件開發積累數據和模型資源。
通訊作者簡介:傅志強(1989—),男,博士,主要研究方向為環境新污染物的代謝轉化行為及毒理效應的模擬預測。