曲靖野+高俊峰



〔摘 要〕本文提出一個面向增值的應急知識挖掘模型。以形式概念分析和概念格理論為基礎,建立應急知識形式背景和應急知識概念格,通過格上作業,發現應急知識定域隱含的知識關系,達到應急知識增維的目的。實證結果表明,該模型具有良好的應急知識挖掘表現,所獲得的高維應急知識能在一定程度上給下次同類型突發事件的應對提供啟迪。
〔關鍵詞〕危機管理;應急知識挖掘;概念格;模型
DOI:10.3969/j.issn.1008-0821.2017.11.006
〔中圖分類號〕G203 〔文獻標識碼〕A 〔文章編號〕1008-0821(2017)11-0034-06
Study on a Model for Emergency Knowledge Mining Based on Concept Lattice
Qu Jingye1,2 Gao Junfeng3
(1.Institute of Scientific and Technical Information of China,Beijing 100038,China;
2.College of Information Technology and Media,Beihua University,Jilin 132013,China;
3.Library,Beihua University,Jilin 132013,China)
〔Abstract〕This paper proposed an emergency knowledge mining model for knowledge increment.Based on formal concept analysis and concept lattice theory,formal background and concept lattice of emergency knowledge had been established.Through the lattice operation,the implicit knowledge relation of emergency knowledge domain was found,and the goal of increasing the dimension of emergency knowledge had been achieved.The empirical results showed that the model had good performance for emergency knowledge mining,and the acquired high dimension emergency knowledge could provide some enlightenment for the next same type of emergency.
〔Key words〕crisis management;emergency knowledge mining;concept lattice;model
1 研究背景
隨著后工業化社會的發展,自然環境遭到持續破壞,而其也因此報復性地導致一系列的天災人禍,人類社會正面臨著空前復雜的突發性危機事件地考驗。以往的經驗表明無論何種類型的突發事件,其應急決策與管理過程都受到危機事件所處的自然環境、經濟水平、政治規律、文化習俗等諸多因素的制約。此外,突發事件應急過程中所涉及到的諸多部門與組織,也增加了應急管理決策任務的復雜性[1],因此對于過往應急知識的總結、分享、增值和復用變得尤為重要??偹苤?,知識具有顯性和隱性的區分,顯性知識通常能夠通過某種載體以結構化的形式進行表述;而隱性知識更具有個體性,存在于個體潛意識中的隱性知識,由于個體語言邏輯上的匱乏而無法將隱性知識外顯[2]。有鑒于此,本文所提出的應急知識增值模型主要著眼于能夠被形式化描述和編碼的外顯型應急知識,對于模糊生澀且不容易表述的內隱型應急知識暫不考慮。
概念格(Concept Lattice)作為形式概念分析(Formal Concept Analysis,FCA)理論的核心算法[3],一經提出即在知識發現、數據分析與知識描述等領域展現出一定的優勢。本研究嘗試借助概念格強大的頻繁項目集生成和關聯規則運算功能,以突發事件應急管理過程中應急知識之間的關聯關系挖掘為目標,構建應急知識挖掘模型,通過對過往的應急數據、應急信息和應急知識進行整合,探索其中的應急管理規律,進而實現對應急知識的增值再利用。
2 研究現狀綜述
2.1 應急知識管理的研究現狀
通過文獻回溯發現,國內外學者在應急知識的描述、序化和管理等方面已經取得了一定的研究成果:2011年,國外就有學者提出將突發事件的具體情境與應急知識片段相結合來進行應急管理[4],在此基礎上,基于應急知識描述框架的應急決策支持系統[5]、基于知識單元的應急管理方法集成模型[6]、面向知識管理的應急知識庫結構與功能描述[7]、城市危機事件的應急策略[8]等一系列研究得到了相應的討論。由此可見,應急知識在突發事件處理過程中所起到的關鍵作用及其重要性已經逐漸被認可,但如何就應急知識進行深度挖掘以便發現知識間的隱含規律,進而實現應急知識增值等方面的探索研究仍稍顯稀疏。
2.2 基于概念格的知識挖掘研究現狀
由于形式概念分析理論在生成數據頻繁項目集和發現蘊含規則方面具有天然的優勢[9],因此利用FCA和概念格進行數據挖掘與知識發現的相關研究并不罕見,例如:應用概念格對數字圖書館用戶的信息習慣進行規則挖掘,進而實現個性化知識服務[10]、運用概念格分析企業競爭情報的差異性需求,從而揭示需求之間的共現和關聯[11]、基于用戶在虛擬社區的被動知識行為構建被動知識需求概念格,并在格上進行規則挖掘,建立用戶社區知識“推式”服務模型的基礎[12]。此外,基于概念格理論進行三支決策算法改進[13]、利用概念格進行案例集成學習[14]等研究也在陸續開展。但形式概念分析和概念格理論應用于應急信息挖掘、應急知識發現等方面的成果尚不常見,且概念格在該領域所具有的天然優勢尚未得到彰顯。因此,本文嘗試構建基于概念格的應急知識挖掘模型,以期為應急人員的危機事件管理和決策提供一定的借鑒和知識支持。endprint
3 基于概念格的應急知識挖掘模型構建
3.1 面向增值的應急知識挖掘原理和路徑
設Event={e1,e2,…,en}表示已發危機事件的集合,Emergency knowledge={ek1,ek2,…,ekn}表示從事件集中抽取出的應急知識單元的集合,Rule={r1,r2,…,rn}表示應急知識與危機事件之間的關系集合。那么一個完整的應急知識定域可通過一個三元組加以描述:EKS=(Event,Emergencyknowledge,Rule),“(e,ek)∈R”表示在此定域中的某事件“e”中蘊含某應急知識單元“ek”。
反觀形式概念分析與概念格理論,應急知識定域恰好能與形式背景三元組K=(G,M,I)無縫對應。其中K(形式背景)=EKS(應急知識定域),G(對象)=Event(危機事件),M(屬性)=Emergency knowledge(應急知識),I(偏序關系)=Rule(應急知識與危機事件的隸屬關系)。那么應急知識定域即可以形式概念分析的方法來對其進行描述和處理。例如現存某應急知識事件集EventX={e1,e2,e3,e4,e5,e6},其中蘊含的應急知識單元集為Emergency knowledgeX={ek1,ek2,ek3,ek4,ek5},那么二者之間的蘊含關系集合RuleX則可以表示成一個二模的矩陣,該矩陣即形式概念分析理論中的形式背景:
矩陣中的行與列分別代表突發事件和應急知識元,其中行列交叉部分的“X”代表某事件的應對活動中包含某應急知識元。顯然事件與應急知識元的關系集“Rule”已然蘊含于上述矩陣之中。若要實現以增值為目的的應急知識挖掘,必須通過概念格上的作業才可實現,因此,根據表1中隱含著的偏序關系采用概念格生成軟件LatticeMiner[15]將表1中的形式背景轉換成應急知識概念格如圖1所示。
圖1的概念格實質上是將表1中的應急知識定域以形式概念分析的方法進行了一次分化與重新整合。在知識系統中,知識分化是從整個知識定域中細分出各種專門的知識[16],在自頂向下遍歷應急知識概念格的過程中,已然實現了對應急知識系統中的應急知識細分。例如節點[e3,e5\ek3],是指突發事件“e3”和“e5”在應急活動中共同用到了知識“ek3”(并不是說上兩個突發事件只需一個知識單元),應急知識“ek3”構成了應對突發事件“e3”和“e5”的一個必要條件。反之,在自底層向上層遍歷應急知識概念格的過程中則實現了對應急知識單元的整合,因為即使是同災源、同類型的突發事件,在管控處理過程中所應用到的手段和策略也不能保證完全相同,所以各個事件所總結析出的應急知識單元也并非完全一致。概念格的結構特征能將紛繁眾多的甚至在知識系統中相距甚遠的知識單元進行整合,例如節點[e3,e5\ek3],概念格中與其直接相連的子節點包括第二層的節點[e5\ek3,ek4]和第三層的節點[e3\ek1,ek2,ek3,ek5],也就是分別將突發事件“e3”和“e5”在應急處理過程中所涉獵的應急知識加以枚舉。節點[e3,e〕5\ek3]成為了上述兩個突發事件的知識交集,通過概念格的數據結構能準確的發現節點之間的鏈接關系,從而將應急知識定域以有機的整體形式加以展現。
在明確概念格對于應急知識系統處理的重要作用后,進一步探討基于概念格的應急知識挖掘功能。所謂知識挖掘,是指對某個應急知識論域中具有一定程度上聯系性的應急知識單元以某一形式集成輸出,其實質與數據挖掘中的關聯規則挖掘并無二致。而關聯規則挖掘的基礎性工作在于計算事物數據庫中項目的頻繁項目集(Frequent Itemsets),經典的關聯規則算法諸如“Apriori”或“Hash”等,由于需多次掃描全域數據以便將支持度不小于給定閾值的項目進行聚類輸出[17],導致其共有的性能瓶頸問題是算法響應時間過長,而概念格在建格過程中已經完成了對定域數據的聚類處理,所形成的格上節點即可被看作所聚得出的類目,所以借助形式概念分析與概念格,能夠壓縮頻繁項目集的識別時間,實現應急知識的快速發現。
要實現對表1中的應急知識定域增值,只需挖掘其中應急知識單元之間的聯系規則,即可達到對應急管理中應對流程和處理思維上盲區覆蓋的目的,從而為下次同類型突發事件的應急活動提供借鑒。筆者設置支持度(Support)=15%,置信度(Confidence)=65%,基于應急知識概念格對表1中的應急知識定域進行挖掘,得出結果如表2所示。
表2包含了11條有意義的規則,基本勾勒出應急知識單元之間的關聯關系。一條規則以如下的方式解讀,以規則1為例:該規則中應急知識單元“ek2”被稱為先導(Antecedent),而應急知識“ek4”被稱為后繼(Consequence),表示在表1的所有突發事件之中,與應急知識單元“ek2”有關的事件也有33.33%與應急知識單元“ek4”有關,其可信度為66.66%。如此,則為突發事件案例之間的比對和參照提供了清晰的路徑,無論是應急過程中習得的知識,或者是問題處理過程中應用到的知識,筆者認為與該類型事件高度相關,只要滿足了預置的挖掘條件,就認為具有關聯的應急知識單元之間的關系是穩定的強關系,可以作為增值后的應急知識而被訴求方使用。就此意義而言,未得到挖掘的應急知識單元可被理解為簡單知識,而挖掘后增值的知識被解讀為復雜知識。這里的簡單和復雜不是以知識內容來化分,而是從知識的維度出發,而所謂維度就知識的關聯因素。獨立出現的應急知識片段是一維的,而以關聯關系的形式出現的應急知識是多維的,維度越高知識的復雜程度越高,應急知識所涉獵的特定因素越多,因此應急知識的價值也就越大。
3.2 面向增值的應急知識挖掘模型
在剖析基于概念格的應急知識挖掘原理并通過模擬數據對挖掘過程加以演示后,本文進一步提出基于概念格的應急知識挖掘模型,如圖2所示:endprint
4 實證研究
為了進一步對模型加以演示和驗證,本研究選擇近年我國煤礦業的突發性事件作為原始數據進行實證研究。2013-2016年間,全國較為重大的煤礦突發性事件共33起:①貴州金佳煤礦;②黑龍江永盛煤礦;③河北艾家溝煤礦;④黑龍江振興煤礦;⑤貴州馬場煤礦;⑥吉林八寶煤礦;⑦吉林八寶煤礦;⑧吉林慶興煤礦;⑨四川桃子溝煤礦;⑩貴州大山煤礦;湖南司馬沖煤礦;江西曲江煤礦;新疆白楊溝煤礦;云南下海子煤礦;云南紅土田煤礦;陜西大海則煤礦;重慶硯石臺煤礦;貴州新華煤礦;黑龍江安之順煤礦;貴州新田煤礦;新疆米泉沙溝煤礦;貴州松林煤礦;黑龍江興運煤礦;山西姜家灣煤礦;貴州政中煤礦;江西永吉煤礦;黑龍江杏花煤礦;陜西劉家峁煤礦;吉林松樹鎮煤礦;重慶金山溝煤礦;黑龍江景有煤礦;內蒙古寶馬煤礦;湖北辛家煤礦。
筆者進一步采集資料,選擇上述煤礦突發事件的事故原因和現場救援措施作為應急知識單元,以便于進一步研究需要,所得數據如表3所示。
基于我國煤炭業突發事故與其發生原因和采取措施的隸屬關系構建起形式背景如表4所示。
進一步按形式背景中蘊含的偏序關系誘導構建出應急知識概念格如圖3所示。
筆者分別設置支持度(Support)=20%、置信度(Confidence)=80%,支持度(Support)=130%、置信度(Confidence)=50%,進行挖掘,所得出的結果均過于稀疏,進一步調整為支持度(Support)=10%、置信度(Confidence)=50%后,挖掘出12條規則,如表5所示:
觀察表5能夠發現一些有意義的高維應急知識。例如氣體中毒和煤與瓦斯突出兩種誘因所引發的礦難事故,通常均采用入井救援的應急策略,其置信度達到了100%,筆者分析也許上述兩種類型的礦難事故,只要攜帶氧氣并且棄絕火種,那么即可保證外部人員進入礦井的安全,而爆炸等類型的事故進入礦井救援危險性過大,容易引發二次事故,所以上述類型事故對入井救援策略的使用較為慎重。此外,對于應急策略的慣常搭配也能夠在表5中得到體現,例如規則1:采用礦道掘進策略進行救援的案例事項中,有18.18%也同時選擇了入井救援策略,其可信度達到75%,筆者分析極可能是發生礦難事故后在高度混亂的情況下進入礦井的通道不夠通暢,只能采取掘進的方式來達到下井的目的。
通過概念格和格上作業,將零散的應急知識片段關聯到一起,或可對下次同質危機事件的應急管理和應急知識的使用產生新的啟發,應急決策主體所面對的應急知識之間也形成了體系,更符合人類的知識習得和復用機制。從此種意義而言,知識之間的關系也是一種新的知識,能對孤立出現的應急知識起到補充和增值的作用。
5 結 論
本文所提出的基于概念格的應急知識挖掘模型旨在實現應急知識的增值和增維,通過應急知識概念格的構建,可以將散亂無序的應急知識片段整合統驅在一個體系之下,又通過格上作業,實現對單維知識單元的增維和對隱含在應急知識論域中關聯關系的發掘,從而將非顯性的應急知識使用慣例加以揭示,進而實現應急知識增值。
未經歷過知識挖掘和知識增值處理的應急信息,不過是相關應急事件的一種雜亂無章的數據堆砌,這給應急人員的知識內化造成了嚴重阻礙,通過本文所設計的應急知識增值模型的處理,可以實現應急知識的網絡化表述,使得具有不同知識背景的應急人員可以根據所面對的問題情景在應急知識網絡上尋得所需的問題求解方案。通過應急知識模型的挖掘作業,可以使得原有的彼此之間孤立的應急知識得到一定程度的關聯;通過應急知識挖掘模型所發現的一些處置方案與事故類型之間的慣常匹配規則能夠較好的為危機應急活動提供量化參照,從而有效對應急決策進行輔助支撐。這并不是說應急人員必須依據所挖掘出的規則來行事,這里的規則是對已發同類危機事件的高度總結,有助于當次突發事件的應急人員對以往的應急知識、救災經驗和教訓有更加精確的把握,可對救災資源的配置活動提供有效的參考,是針對應急人員的救援方案所提供的有效情報服務。
另外,本文采用真實數據對模型進行實證也在一定程度上彌補了應急信息管理研究中的實踐稀缺問題。但由于時間和篇幅限制,本研究的實證部分只從兩個觀測點對突發事件數據中所蘊含的應急知識進行挖掘和增值展示,在接下來的研究中,筆者將進一步探索在多個觀測點中抽取應急知識并進行知識挖掘的可能,從而進一步驗證基于概念格的知識挖掘模型的效用。
參考文獻
[1]陳雪龍,董恩超,王延章.非常規突發事件應急管理的知識元模型[J].情報雜志,2011,30(12):22-26.
[2]SMITH E A.The role of tacit and explicit knowledge in theworkplace[J].Journal of Knowledge Management,2013,5(4):311-321.
[3]Wille R.Restructuring Lattice Theory:An Approach Based on Hierarchies of Concept[C].InProceedingsof the 7th InternationalConference on Formal Concept Analysis.Berlin,Heidelberg:Springer-Verlag,2009:314-339.
[4]Hernández J Z,Serrano J M.Knowledge-based models for emergency management systems[J].Expert Systems with Applications,2001,20(2):173-186.
[5]Maio C D,Fenza G,Gaeta M,et al.A knowledge-based framework for emergency DSS[J].Knowledge-Based Systems,2011,24(8):1372-1379.endprint
[6]Chen X,Wang Y.A Knowledge Element Based Model Integration Method for Emergency Management[C]// IEEE / Wic / ACM International Conference on Web Intelligence and Intelligent Agent Technology.IEEE,2015:152-155.
[7]蔣勛,蘇新寧,劉喜文.突發事件驅動的應急決策知識庫結構研究[J].情報資料工作,2015,36(1):25-29.
[8]宋紹成,高俊峰.基于知識管理的城市公共危機動態控制策略研究——以吉林市為例[J].情報科學,2013,(10):52-56.
[9]畢強,滕廣青.國外形式概念分析與概念格理論應用研究的前沿進展及熱點分析[J].現代圖書情報技術,2010,(11):17-23.
[10]滕廣青,畢強.基于概念格的數字圖書館用戶用法細分——數字圖書館用戶使用方法的關聯規則挖掘[J].現代圖書情報技術,2010,26(3):8-12.
[11]王萍,支鳳穩,王毅,等.運用概念格分析企業競爭情報需求[J].現代圖書情報技術,2013,(10):66-72.
[12]田依林,滕廣青,張凡,等.基于概念格的社區用戶知識服務模型研究[J].情報科學,2011,(8):1201-1204.
[13]王立亞,張春英,劉保相.基于區間概念格的三支決策動態策略調控模型[J].計算機工程與應用,2016,52(24):80-84.
[14]Kang X,Li D,Wang S.A multi-instance ensemble learning model based on concept lattice[J].Knowledge-Based Systems,2011,24(8):1203-1213.
[15]滕廣青,畢強.概念格構建工具ConExp與LatticeMiner的比較研究[J].現代圖書情報技術,2010,26(10):17-22.
[16]李喜先,著.知識系統論[M].北京:科學出版社,2011.
[17]毛國君,段立娟,王實,著.數據挖掘原理與算法[M].北京:清華大學出版社,2008.endprint