*劉菁 孔茹
(1.山東省生態環境監測中心 山東 250000 2.山東省煙臺生態環境監測中心 山東 264000)
隨著大數據時代的到來,數據的重要性不言而喻,環境監測數據更是支持環境保護工作的重要基礎,如何保證環境監測數據的完整性、一致性、歷史延續性,是決定環境監測數據庫的主要因素。在不同歷史階段中,所使用的數據系統,它們在操作平臺、用戶界面、數據處理方式、表征形式以及對硬件資源的利用上各有不同,下面就針對幾個具有代表性的環境監測數據庫結構進行分析,并提出改進建議,以解決因數據庫結構的不完善而帶來的各種問題。
(1)dBASEIII或Foxbase建立的數據庫
環境監測數據庫,是90年代普遍使用的一種庫結構,這種數據庫結構采用dBASEIII或Foxbase系統建設[1],符合巴斯范式要求,基本信息分解為多個數據表。以河流基本信息為例,基本信息由河流名稱數據表,斷面名稱數據表,所屬城市數據表,監測項目代碼4個數據表構成,監測數據表又分為必測數據表和選測數據表,必測數據表鍵值只有斷面代碼和日期,選測數據表增加了監測項目代碼。這種數據庫結構在使用時,要關聯這6個數據表,才能得到一條完整的監測數據。該歷史數據庫導出到第三方數據統計軟件后,很難直接查閱。即便是專業人員做導入,也要反復測試、核對,特別需要注意各數據庫之間的關聯順序,否則很容易造成數據疏漏。數據庫中的監測數據采用數值型存儲,未檢出的監測項目要在檢出限前加“-”號進行標識,在統計均值等問題時,需要特別注意“-”號帶來的問題。……