姚建華 徐雯麗 李佳 黃迎 凌敏 胡靜 蔣舒仰 周紅 高映新
1 中國科學院上海有機化學研究所 (上海 200032)
2 環保部環境研究總院新化學品登記中心 (北京 100012)
綜述
化學品信息管理與環境保護
姚建華1徐雯麗1李佳1黃迎1凌敏1胡靜1蔣舒仰1周紅1高映新2
1 中國科學院上海有機化學研究所 (上海 200032)
2 環保部環境研究總院新化學品登記中心 (北京 100012)
隨著人類社會的發展,人們對物質的種類需求越來越多、數量越來越大。由于已有的天然資源已不能滿足這樣的需求,必須使用大量的人造制品來彌補這樣的空缺,而人造制品中的絕大部分是化學類物質。這些化學物質在極大地滿足了人類社會需求的同時,也給人類賴以生存的環境造成了一定的污染。為此,必須應用有效的方法管理化學品,以保證人類能夠安全有效使用化學品的同時確保生活環境的安全。隨著計算機技術的發展,計算機信息管理系統幾乎承擔了所有領域的信息管理工作。目前,在化學領域,用于化學信息管理的系統有:SciFinder、ISIS/Base、ELN和CISOC-ChIMS等。化學品信息的有效管理,將對環境保護起到積極的作用。
信息管理 數據庫系統 化學品 環境保護
信息管理(Information management)是人類為了有效地開發和利用信息資源,以現代信息技術為手段,對信息資源進行計劃、組織、領導和控制的社會活動。簡單地說,信息管理是指在整個管理過程中,人們收集、加工、輸入和輸出信息的總稱。信息管理是人類綜合采用技術、經濟、政策、法律和人文的方法和手段對信息流進行控制,以提高信息利用的效率,最大限度地實現信息使用價值為目的的一種活動。
化學品信息主要分為化學物質的化學信息以及媒體形式的化學信息。化學物質的化學信息是使用科學的原理和方法通過實際測量得到的關于化學成分的一些信息,包括化學物質的物理、化學性質,物質中各個成分的含量比例以及化合物的結構信息、分子間相互作用的關系、化學反應、對環境的影響、化合物的生物活性參數等內容。而媒體形式的化學信息則是指化學信息的記錄形式,包括圖書、期刊、數據庫、專利等,通過對化學信息的傳播使研究者能夠共享測量的原理、方法以及結果等化學物質的化學信息。
目前,在環境保護領域,人們只關注已經被確定為污染物的化學品及其相關信息、該類化學品的檢測、污染處理和控制方法。對于目前未被確定或未列入管控的化學品,并不關注。這是值得重視的現象。
隨著合成方法和技術的發展,化合物數量的增長速度已有很大的提高。目前,在美國化學文摘社登記的化合物已多達8800萬個。鑒于這樣的數量,傳統的人工管理方法已無法實現如此大量信息的有效管理。而計算機技術的發展,為實現化學品信息的高效管理和應用提供了有效的技術。在此,我們認為化學品的信息管理對環境保護具有積極的作用。
化學品信息的管理過程主要包括:化學品信息的采集;化學品信息的處理、加工;化學信息管理系統管理、信息的質量控制等。
1.1 化學品信息的采集
化學品信息的采集是化學品管理過程中的第一步。由于化學品信息內容的多樣性和信息來源的多樣性,我們需要對所需采集的化學品信息進行分析,設計信息采集方案。
首先,我們將需要采集的數據進行分析,查找已有的數據庫確定哪些內容可以在現有的可得到的數據庫中查到。現有數據庫中沒有的內容,可以分別通過互聯網或者紙質載體進行數據查找。另外,也可以直接收集實驗數據。
由于計算機的普及以及網絡的發展,商業數據庫是我們的首選,它提供了多樣化的檢索方式,并且提供的信息是經過校驗和處理的,內容更可靠。而互聯網上免費的大型搜索引擎例如谷歌、百度等通常提供大量的命中結果,當我們需要新的或者少見的化學品信息時,這些大型搜索引擎是很好的選擇,但其信息的來源并不十分可靠,處理這部分信息時需要謹慎。相對于在計算機上進行的快速搜索,紙質出版物的查找顯得費時又費力。而且由于紙質出版物出版條件的復雜,它所提供的信息比網絡資源落后,并且有相當一部分的紙質出版物通過掃描、輸入等方式被放在互聯網上供人們在計算機上閱讀,所以紙質載體的查詢是不被人們所重視的。
雖然紙質載體的查詢不方便,信息相對于網絡較落后,但也有其存在的價值。由于它的出版是經過層層篩查的,所以紙質載體所攜帶的信息的可信度較高,其內容很多是對某一方面問題的總結、概述。當我們接觸一個新的領域或事物時,可以通過書本來了解它的概況、發展情況等信息。對于所要查找的化合物信息來說,當一些內容無法通過計算機找到時,我們可以查找一些化合物的工具書。
書的查找和網絡搜索是不同的,它不是通過關鍵詞來進行查詢的,而要根據學科的分類一層一層地縮小科目的范圍來進行查詢。這就需要我們掌握科目的分類系統,從而找到相關書籍。
實驗數據價值眾所周知,為此收集和管理實驗數據的重要性顯而易見。可見,利用已有的信息管理系統,建立相應的數據庫,將有助于數據的管理,方便使用。
對于環境保護而言,化學品信息應該包括以下幾類:化學品名稱、CAS號、化學結構、相關物化性質、化學品穩定性、環境毒性和毒理學數據等。
1.2 化學品信息的處理、加工
由于查詢的載體、信息的來源不同,采集到的信息的顯示方式、儲存形式也是多種多樣的。所以我們需要對采集到的化學品信息進行處理、加工,去除多余的、重復的信息,將需要的信息進行編輯、轉換成電腦可識別、處理的信息,以便于我們使用化學信息管理系統對化學品信息進行有效的管理。化學品信息的處理包括化合物結構的編輯、化合物性質的預處理以及數據的規范化處理。
在大多數情況下,我們通過信息采集收集到的化合物結構都是以圖片的形式存儲的,不能直接使用計算機進行計算、編輯,自然無法很好地利用這些信息進行管理。所以,要使用結構編碼將化學結構轉換成計算機可識別、計算的文件格式,以便在計算機中操作化學結構。用于儲存分子結構信息的文件格式有很多,例如Molfile是應用較為廣泛的連接表格式的文件(見表1)。
通過不同渠道采集的化學品性質的數據多種多樣,不同實驗條件下的結果不同。所以要對性質數據進行處理,盡量選取相同條件下的數據,并注明實驗條件。除此以外,將不同來源的數據進行篩選、整理,最終得到較為準確、全面的數據。
在處理化學品的結構和性質時需要規范化的操作,包括統一的單位、制定選取數據的規則、統一的顯示方式等。
1.3 化學信息管理系統
對于處理好的大量的信息最有效的管理方法就是數據庫管理。在數據庫中可以對信息進行輸入、搜索、輸出、編輯等操作。建立數據庫需要使用化學信息管理系統。
SciFinder是最常用的數據庫檢索系統,用來訪問CAS出版的系列數據庫,其中Registry數據庫是世界上最大最全更新最快的物質數據庫。ISIS/Base是一個基于桌面的化學信息管理系統,利用ISIS/Base可以對化學結構及相關的科學數據進行存儲、搜尋和檢索等管理工作,也可以作為客戶端應用程序通過網絡訪問服務端數據庫,是工業標準級的化學信息管理系統。ELN是一種復合式的電子實驗記錄系統,主要用于實驗過程及結果的存儲、管理。CISOC-Ch IMS是中國科學院上海有機化學研究所自主研制并獲得中國軟件著作權的化學信息管理系統。它具有化學結構檢索和文字檢索兩大檢索功能,可以進行數據庫的維護、中文處理、圖形存貯,尤其是中文處理功能彌補了其他國外開發的化學信息管理系統在中文處理上的不足。
2003年,以色列化學家Arnon Shani發表了一篇題為《化學無處不在》的文章。文章闡述了化學與社會的關系,化學品的作用、與人類及環境的關系。一個具有一定應用價值的化學品(如農藥、醫藥、食品添加劑或顏料),同時也存在對人類健康不利或污染環境的可能性。有些化合物,可能在它剛剛出現時,是一種特殊功能的物質,人們只關注其功能,沒有意識到它對環境和人類健康的危險性。如香蘭素,哈爾曼博士和泰曼博士在1874年成功合成了該化合物,并被用作食品添加劑,聯合國糖農組織/世界衛生組織(FAO/WHO)在1992年規定:用于方便食品的罐頭、嬰兒食品和谷類食品的最高允許用量為70mg/kg。直到2005年,才有實驗報道,該化合物有致畸毒性。如溴代叔丁烷,在化學研究或化工生產中,是一種常用試劑,它的急性毒性為中低毒,但它有致畸和致癌毒性。
以上例子說明,化學品對人類健康和環境的不利影響,可能是在它被發現的若干年之后,才會被察覺和認識,化學品與環境和人類健康有著極為密切的關系。
本文簡要介紹了化學信息學方法和技術實現化學品信息管理的方法,以及現有化學信息系統的狀況。目前,收錄與環境保護相關信息的化學品信息管理系統建設還處于初始階段,即主要以文字檢索來實現信息檢索,且系統中收錄與環境保護相關的信息還不能滿足環境保護工作的需求,如應急污染處理、修復信息不完整等。
使用化學信息管理系統建立的化學品信息管理系統,不僅可以用于信息查詢和信息管理,另外,還是建立化學品相關性質預測系統不可缺失的信息資源。
目前,已建立的與環境相關的化學品性質的數據庫有:化合物的酸堿離解常數數據庫、化合物疏水常數數據庫等。用戶可以通過網絡,輸入提問結構或相關性質參數,查詢對應的性質參數或化學結構。利用數據庫中的數據資源與相關的數據分析技術,已經建立了化合物致癌毒性、致突變毒性、疏水常數預測和酸堿離解常數預測系統。用戶只需提交需預測的化合物的結構,預測系統即在線返回預測結果。以上提及的系統,已在國家973項目和環保部的公益項目中體現出實際效應。
Management of Chemical Information and Protection of Environment
Yao Jianhua Xu Wenli Li Jia Huang Ying Ling Min Hu Jing Jiang Shuyang Zhou Hong Gao Yingxin
With the development of human society,people need more and more kinds of substances and the quantity also becomes larger.As the nature resources can'tmeet the demands,many artificialmaterials have been used tomake up for the vacancy and mostof them are chemical substances.When these chemical substancesmeet the needs of human society,they also make pollution.Therefore,we should take measures to manage the chemicals effectively to ensure the chemicals can be used safely,and to ensure the safety of the living environment.With the development of the computer technology,the computer information management system almost undertakes the information management of all fields.At present,in the chemical field,the database systems,such as SciFinder,ISIS'Base,ELN and CISOC-ChIMSetc.are used in management of chem ical information.The effectivemanagement of chemicals information will play an important role in environment protection.
Informationmanagement;Database system;Chemicals;Environment protection
(略)
TP 3
2014年6月
姚建華 女 1963年生 研究員 獲法國巴黎第七大學博士學位 目前主要從事化學信息學及其應用工作