楊同標 林王兵* 成艷 王衛
(南京理工大學泰州科技學院,江蘇泰州 225300)
高校實驗室是學生實踐訓練的主戰場,是教師科研創新的重要基地,也是為社會培養實踐能力強、具備創新能力的高素質技能人才的重要平臺。伴隨著高校對教學、科研實驗室的投入力度不斷加大,實驗室安全事故屢見不鮮,也引起高校和社會的廣泛關注。
由于實驗室安全的風險的類型和成因復雜,存在的安全隱患多種多樣[1-3]。在實驗室安全管理研究上,專家和學者主要研究成果有:高惠玲、董鵬等提出構建一種基于危險源辨識分類實驗室、基于風險評價劃分實驗室級別、依據管理措施及成效開展達標驗收的“三位一體”的新型管理模式[4]。潘越等,設計出高校實驗室危化品安全預警評價體系[5]。張煜炯,提出基于DHGF 算法的高職院校實驗室安全管理評價[6]。目前,國內對實驗室安全預警主要針對風險評價進行研究,而對安全預警研究較少。本文將在汲取信息融合在其他安全領域預警研究的基礎上,將其應用在高校實驗室安全預警機制構建上,結合了D-S證據理論與信息熵理論,以求對其高校實驗室安全管理做出更為客觀和準確的科學評價。
Glaser 和Strauss 首創并發展的扎根理論是一種質化研究方法,其基本宗旨是從經驗資料的基礎上建立理論,從最初作為方法工具應用在社會學研究,逐漸被引入管理學研究領域[7]。
高校實驗室安全信息數據來源多樣,應用扎根理論,通過問卷調查、深入訪談、案例分析等方法獲得第一手資料,進一步歸納提升至高一級的范疇[8]。
K-means 聚類算法是由Steinhuas 等人分別在不同的科學研究領域獨立提出來的一種聚類算法[9]。它的核心思想是用兩個數據元之間的距離來確定是否是一個簇,這個數據元與質心距離越小,相異度就越小,這兩個數據元就屬于一個簇[10]。
算法的具體過程:


(2)對樣本中的點xi,計算其與簇心cj的歐氏距離并獲取其類別標號:

(4)重復步驟2 和步驟3,迭代n 次取到最優解。
不同指標在評價體系中所占權重顯然是不同的,Shannon 引入了信息熵的概念,解決了對信息的量化度量的問題,且在信息預測中得到了廣泛的應用[11]。
算法的具體過程:
(1)設原始評價矩陣En,m其中指標個數為m,對象個數為n,先對En,m進行規范化處理,得到規范化矩陣Rn,m,步驟如下:


D-S 證據理論是基于辨識框架的一種決策理論,辨識框架Ω 定義了一個互不相容事件的完備集合。貝葉斯推理是對Ω中的元素進行運算, 而D-S 證據理論則是對2Ω中的元素進行運算[12]。該理論給出上、下概率的概念及合成規則和不滿足可加性的概率。G Shafer 在此基礎引入信任函數概念,形成了一套基于“證據”和“組合”來處理不確定性推理問題的數學方法[13]。
算法的具體過程:
(1)基本概率分配函數M:

Bel 函數也稱為下限函數,表示對A 的全部信任。由概率分配函數的定義容易得到

A 的不確定性由下式表示

安全預警模型的確立離不開監測指標的確立,本文從安全監管視角,運用扎根理論的方法,采用訪談、問卷等形式向高校實驗室管理人員等20 多人進行了咨詢,對高校實驗室安全影響因素進行了識別。共設置4 個主范疇作為預警一級指標、并從44 個相關概念中提取16 個范疇作為預警二級指標,預警指標體系如圖1 所示,其中A1、A3、A4 為正向指標,數值越大越安全,評分方法參考文獻[5],A2 為負向指標,數值越大越危險。

圖1 高校實驗室安全預警指標體系
信息融合技術又被稱之為數據融合,其目的是通過多源信息的高效融合避免單指標評判的誤差性[14]。影響高校實驗室安全的因素種類繁多,如何將多信息進行有效的融合是安全預警是否科學的關鍵。
本文通過對某高校的調研,選擇S1、S2、S3、S4、S5 五個實驗室作為分析樣本,通過以下步驟完成對多信息融合預警模型的建立,流程圖如圖2 所示。

圖2 高校實驗室多信息融合預警模型建立流程
(1)通過2.1 預警指標體系的建立,可對每個實驗室的具體情況進行打分。A2 指標選取K-means 算法,對一段時間內的實驗室流量數據進行聚類計算,得到簇中心數據后在對各中心點進行加權平均,以此作為該實驗室的人流量數據。A1、A3、A4 指標則可以通過專家打分獲得相應分數。
(2)不同指標權重不同,本文利用已有數據將安全等級分為四級分別是無警、輕警、中警和重警,將各個指標的閾值對應安全級別進行劃分,再利用信息熵計算各指標權重。
(3)根據D-S 理論設置不同焦元對應不同指標,通過D-S計算規則得到多個實驗室數據融合后的基本概率分配函數,選取主焦元作為預測結果。
本文通過對某高校的調研,選擇S1、S2、S3、S4、S5 五個實驗室作為分析樣本,其中A2 指標的分值獲取過程如下:
(1)以實驗室S1 為例,選取其16 天的人流量數據進行聚類分析。
(2)結合2.2 中K-means 算法對S1 數據進行聚類處理,其中橫坐標為時間(1-8 節課),縱坐標為人數(流量),k 值取4,聚類結果如圖3 所示。

圖3 K-means 聚類后數據
(3)聚類后得到四個簇中心,坐標如表1 所示,其余實驗室同理。

表1 人流量數據簇心坐標表
實驗室S1 的設計人流量70,對四個簇心點加權平均,得到實驗室1 對于人流量指標的分數0.60,其他實驗室同理,A2 指標的打分情況如表2 所示。

表2 各實驗室人流量指標得分表
結合3.1 中對A1、A3、A4 指標的打分情況,可以得到實驗室S1-S5 的預警指標得分情況,結果如表3 所示。

表3 實驗室S1-S5 預警指標數據
(1)預警指標閾值的確定:
根據已有的實驗室安全評級制度,結合表3 中的實際預警指標數據對閾值進行劃分,將樣本實驗室安全等級分為四級,結果如表4 所示。

表4 實驗室安全指標預警等級表
(2)原始預警數據的規范化:
設原始評價矩陣En,m 其中指標個數為m,對象個數為n,先對En,m 進行規范化處理,規范化后矩陣如表5 所示。

表5 預警數據規范化矩陣
(3)權重計算
對表5 中的數據利用信息熵算法求各指標在綜合體系中所占的權重。公式(4)計算指標j 熵值Hj,由式(5)計算熵權(即權重ωj),結果如表6 所示。

表6 高校實驗室安全預警指標權重
3.3信息融合后的基本概率函數
在本案例中,針對不同的指標選取三個元素A、B、C,用M(A)、M(B)、M(C)、M(AB)分別對應無、輕、警、警四個等級的基本概率分配函數,由表3 的指標數據和表4 的警限閾值,得出每個實驗室不同的預警指標所對應的基本概率分配函數焦元[15],如表7 所示。

表7 樣本實驗室預警指標對應的焦元
根據表6 給出的權重,加權合成基本概率分配函數,結果如表8 所示。

表8 基本概率分配函數
根據公式(8)合成5 個基本概率分配函數,結果如表9 所示。

表9 實驗室融合結果
根據表9,我們可以選取四個證據中的主焦元作為分析依據。根據前文敘述的焦元與預警等級的映射關系,對五個樣本實驗室的預警判定結果如表10 所示。

表10 高校實驗室安全預警結果
通過表10 可以得出結論:實驗室S1-S2 為無警狀態,實驗室S3、S5 為輕警狀態,實驗室S4 的預警等級為重警狀態。結合表2 的打分數據,可確定出實驗室S4 的4 項指標的預警等級分別為重警、輕警、中警、重警,該結果與表10 給出的實驗室S4 安全等級為重警的結論完全吻合。說明基于D-S 證據理論的多信息融合模型在高校實驗室安全預警方面具有很好的可行性與適用性。
4.1 本文依托多信息融合技術,以扎根理論構建高校實驗室安全預警指標體系,運用D-S 證據理論與信息熵理論實現了不同信息源、不同量綱信息的有機融合,建立預警融合模型輸出預警結果,避免了單一指標預警的片面性[15]。
4.2 通過對樣本實驗室的四項預警指標數據進行打分,通過k-means 算法對人流量數據進行聚類,克服了實驗人數不固定的缺點,又通過信息熵確定了各指標在預警系統中的權重。最后結合D-S 證據理論將各項證據融合,給出預警評價。實證表明,預警判定結果客觀的反映了各實驗室的風險類別,與真實情況吻合,對高校實驗室安全預警管理有一定的指導意義。
4.3 本文也存在不盡完善之處。雖然D-S 證據理論多用于信息融合領域,但其受限于證據的獨立性,在很多情況下此條件不易成立;另外D-S 的合成算法,其合理性和有效性還存在一定的爭議。