陳晶 羅俊
摘要:檢測管理信息系統利用計算機網絡技術、數據存儲技術、快速數據處理技術對環境衛生檢測的流程和相關信息進行全方位管理。本文從發展歷程、系統功能、關鍵技術及新技術應用四個方面對檢測管理信息系統的國內外研究工作進行了論述。
關鍵詞:管理信息系統,UML,工作流
1 前 言
檢測管理信息系統利用計算機網絡技術、數據存儲技術、快速數據處理技術對實驗室檢測的流程和相關信息進行全方位管理。國內外對檢測管理信息系統的研發工作已經持續多年。
檢測管理信息系統的概念最早于20世紀60年代末提出,80年代中期發展出第一代檢測管理信息系統 ,操作都集中在中心計算機上完成,屬于集中式管理,數據處理能力較小。 第二階段是完全商品化的軟件,即把各種實驗室所需要的功能都設計到了自己的信息系統中去,缺點是為了滿足用戶的需求,必須在安裝后編寫適應性程序]。第三階段為80年代末期到90年代中后期,基于C/S架構的數據管理模式成為主流,并開始將面向對象設計軟件的概念引入檢測管理信息系統。第四階段為90年代末到近幾年,檢測管理信息系統應用Web技術,采用統一的瀏覽器界面,以分布式應用結構為核心,把編程和業務表示分開,提高了系統的可維護性。
2 系統功能
目前國內外正在投入使用的相關管理信息系統一般都能實現對環境衛生檢測數據的管理,其功能包括數據的采集、傳輸、存儲、處理 、簡單的數理統計分析、數據合格與否的自動判定、輸出、報表的展現與管理等。這些系統能滿足環境衛生檢測工作的基本需要,功能比較單一,網絡結構一般比較簡單,容易實現,投資較少,在設計好之后,一般可以在較長的時間里不需要對網絡軟硬件進行大的變動。
現在國內外正在研發的環境衛生管理信息系統,主要實現對環境衛生檢測數據和信息的全面管理。這類管理信息系統除了實現對數據的管理功能外,一般還增加了對樣品、資源(如材料、設備、備品、備件、固定資產等)和事務(如工作量統計與工資獎金、文件資料和檔案)等功能模塊,能組成一套完整的綜合管理體系和檢測工作質量監控體系。由于檢測相關業務部門的設置、職責、管理模式和其他特點可能會隨著業務發展的需求而發生變化,可能需要經常對系統的軟硬件進行改變。
環境衛生檢測管理信息系統的功能根據實際工作流程和應用規模而有所不同,但總的來說,系統的主要功能包括:樣品信息錄入、檢測流程管理、報告管理、報表打印、系統維護、基礎數據維護、檢測人員材料設備管理。樣品信息錄入主要包括樣品收樣,將樣品的性狀、規格、數量、檢測日期、檢測項目等信息錄入到數據庫中。檢測流程管理實現樣品從檢測申請到報告發放的完整檢測過程中的所有步驟。報告管理完成報告的建立、修改和銷毀工作。報表打印主要完成對系統生成的各類報表的查詢和打印工作。系統維護主要包括對用戶的管理和配置,清除過期的數據,備份有用的數據?;A數據維護對實驗室、樣品、檢測項目、儀器設備等進行管理。檢測人員材料設備管理完成檢測相關人員信息、材料和儀器的查詢統計功能。
3 關鍵技術
隨著Web技術的發展,現在的環境衛生檢測管理信息系統普遍采用了瀏覽器/服務器開發模式,以Web服務器為應用中心,使用方便,數據的共享和發布更為簡單,功能更為全面,軟件的二次開發更為容易。Web服務的基本架構包括web服務提供者(service provider)、服務請求者(service requester)和服務代理(service broker)以及他們之間的通信、XML格式的消息傳遞機制等。應用Web服務,可以實現Web上的文檔瀏覽,自動調用事件,可以增強管理信息系統的靈活性。此外,通過應用Web service技術為系統提供了統一的數據處理編程接口,便于增加各種儀器的接口,提升了系統的可擴展性。
隨著檢測項目和業務量的不斷增加以及對質量要求的不斷提高,環境衛生檢測信息管理系統的復雜度也在不斷增加。為了幫助用戶對軟件系統進行面向對象的描述,不少管理信息系統采用UML(Unified Modeling Language)進行建模。UML提供了一整套描述軟件系統模型的概念和圖形表示法,包括具體語法、抽象語法、語義和用例圖、順序圖、協作圖、類圖、狀態圖、活動圖、構件圖、部署圖,可以完成衛生檢測信息管理系統開發過程從需求分析到實現和測試的全過程。 UML采取直觀的圖形化建模方式,被廣泛應用于管理信息系統的建模中。UML中的用例圖對系統、子系統的動態行為進行建模,將系統參與者以及他們之間的關系顯示出來。順序圖用于描述對象間的動態交互關系,著重體現對象間消息傳遞的時間順序,按照時間順序表達軟件對象之間的交互情況。協作圖也是UML交互圖的一種,用來描述協作對象之間的交互和鏈接,包括對象及對象間通信的關聯。類圖描述了一個類的定義(包括類名、屬性和操作的集合),顯示一組類和接口,并表達類之間的基本關系(包括繼承、關聯等)。狀態圖用來描述一個特定對象的所有可能狀態及引起狀態轉移的事件,一個對象的狀態是其所有成員屬性值和成員狀態的組合,通過狀態間的轉換來描述其動態性?;顒訄D經常被用來描述一個用例的處理流程,遇到復雜聯系,可以通過活動圖來集成用例,描述同一抽象層次上用例間的聯系。構件圖是結構圖的一種,用來表示構件本身的信息,其中包括邏輯類或實現類的信息。部署圖是結構圖的一種,用來定義系統運行中的硬件和物理體系結構。上述的用例圖、類圖、構件圖、部署圖可以歸納為UML的靜態建模機制,狀態圖、活動圖、順序圖、協作圖可以歸納為動態建模機制。
4 新技術應用
環境衛生檢測信息管理系統涵蓋的關鍵業務流程繁多,包括檢測流程、質量管理流程、編制報告流程等??梢牍ぷ髁鞯母拍睿纬晒ぷ髁鞒痰挠嬎隳P停磳⒐ぷ髁鞒讨械墓ぷ靼凑者壿嫼鸵巹t前后組織在一起,在計算機中以恰當的模型進行表示并對其實施計算。比如為報告編制工作流程,可以應用工作流技術在多個具有不同權限的用戶之間,按照預定的報告編制規則完成自動傳遞文檔和撰寫編制審核的任務。工作流是通過計算機軟件進行定義、執行并監控的整體過程,工作流模型是對工作流的一種抽象表示。工作流模型通常采用形式化語義,這樣可以直觀地表達業務邏輯,并對業務邏輯的過程、路由、角色分配、時間等控制條件加以描述。工作流管理系統通常都提供以下幾種功能:①在工作流的建立階段,對工作流過程進行定義和建模;②在運行階段,執行工作流過程,完成過程中的活動調度;③在運行階段,實現活動執行過程中與軟件工具之間的交互。對于工作流建模,國外許多學者提出了不少有價值的建模方法:基于狀態和活動圖的建模方法、基于Petri網的建模方法、基于事務的建模方法?;跔顟B和活動圖的建模方法:通過這種方法得到的工作流模型可將業務過程中的數據流和過程流明確地表達出來,數據的輸入和輸出流向明確,多應用于以文檔傳遞功能為主的檢測管理信息系統中。基于Petri網的建模方法:這種方法有精確的定義,可對工作流系統進行定性和定量分析,在過程建模、分析和優化領域此種方法已成為主要的方法之一?;谑聞盏慕7椒ǎ哼@種建模方法的出發點是實現業務過程受到另一業務事件的驅動,整個業務過程實有一個或者多個事件構成的活動鏈,其中也包含過程中事件的業務活動。
一些環境衛生檢測信息管理系統集合了海量檢測實驗數據和相關管理信息,傳統的統計手段無法對海量數據進行有效的分析,常用的數據庫管理系統的查詢檢索機制已遠遠不能滿足現實需要,使用數據挖掘技術可將海量數據背后隱藏的有價值的信息挖掘出來。這些挖掘技術包括人工神經網絡、關聯規則挖掘、貝葉斯算法、決策樹法、挖掘OLAP立方體等。利用數據挖掘技術構建數據挖掘模型、選用適當算法可實現預測來年的檢測任務量、各類樣品的合格率情況等問題。人工神經網絡(artificial neural network, ANN)包含一組節點(神經元)和邊,這組節點和邊形成一個網絡,網絡對外部輸入的信息進行動態響應,在數據訓練過程中會為網絡中的邊找出最好的一組權值,在實現過程中,需要大量的數據來進行充足的訓練和測試樣本模式集。關聯規則挖掘的目的是為了挖掘出隱藏在數據間的相互關系,考察出現在同一事件中的不同項的相關性,首先找出事物數據庫中所有的頻繁項的集合,再從所有頻繁項的集合中產生關聯規則。貝葉斯算法以概率密度函數為基礎,描述分類系統中條件屬性和分類屬性之間的映射關系。這種算法出錯率小、準確率高,支持快速創建有預測功能的挖掘模型,這個算法通過感興趣的變量與所有其他變量之間的相關性進行計數來學習“證據”。決策樹方法結構簡單,便于理解,模型效率高,在訓練集數據量較大的情況下較為合適。決策樹的分類算法包括ID3、C4.5、CART、SLIQ等。挖掘OLAP立方體是一種自上而下、不斷深入的分析工具,并以可視化的方式呈獻給用戶。與關系數據庫包含了許多表類似,OLAP數據庫包含了許多立方體。立方體包含一組定義明確的維和度量。維是一個分析對象,它提供了可用于提問的軸,而度量是一個數字,存在于立方體的坐標中。幾乎所有的分析立方體都有一個time維,每個維包含一個或多個層次??傊琌LAP的作用是基于維的層次來聚集度量,以特定的數據結構來存儲這些預先計算的聚集,通過預聚集和特定索引的幫助,可以查詢聚集的數據并實時返回決策支持查詢的結果。數據挖掘的任務包括分類、聚類、關聯、回歸、預測、偏差分析、序列分析。一個完整的數據挖掘生命周期包括問題的形成、數據收集、數據清理和轉換、模型構建、模型評估、報告和預測、應用集成和模型管理。
主要參考文獻
[1] 蔣蕾蕾.環境監測實驗室信息管理系統建設的探討. 實驗室研究與探索, 2009, 28(9):160-161.
[2] 楊海鷹.影響LIMS成功實施的幾個關鍵因素. 現代科學儀器, 2005(2):64-65.