[摘要] 本文介紹了甲型H1Nl疫情防御決策支持系統(tǒng)的基本框架,重點描述了防御系統(tǒng)的數(shù)據(jù)分析系統(tǒng)算法。
[關(guān)鍵詞]甲型H1N1;數(shù)據(jù)挖掘;模糊集與信息推理;集對分析
一、前言
筆者參與設(shè)計的甲型H1N1防御系統(tǒng),運用了多種智能化方法,可以從大量數(shù)據(jù)中找出規(guī)律,同時建造智能型的決策支持系統(tǒng),是應(yīng)付甲型H1N1流感這樣的突發(fā)性傳染病的有效方法。
本文探討的重點為該系統(tǒng)中的數(shù)據(jù)分析系統(tǒng)算法。
二、相關(guān)技術(shù)介紹
1. 數(shù)據(jù)挖掘技術(shù)及其基本過程
數(shù)據(jù)挖掘是近年來隨著數(shù)據(jù)庫和人工智能技術(shù)的發(fā)展而出現(xiàn)的一種全新信息技術(shù),是指從數(shù)據(jù)中識別出有效的、新穎的、潛在有用的,且可以最終被理解的模式的非平凡過程。數(shù)據(jù)挖掘又是一種決策支持過程,它能高度自動化地分析數(shù)據(jù)倉庫中原有的數(shù)據(jù),做出歸納性推理,從中挖掘出潛在的模式,幫助決策者做出正確決策。
數(shù)據(jù)挖掘的一般過程可分為“數(shù)據(jù)準(zhǔn)備”、“數(shù)據(jù)挖掘”、“結(jié)果解釋和評價”三個階段。
2. 醫(yī)學(xué)數(shù)據(jù)的特點
醫(yī)學(xué)信息系統(tǒng)中的數(shù)據(jù)具有自身的一些特殊性,主要表現(xiàn)在以下幾方面:
(1) 隱私性:醫(yī)學(xué)數(shù)據(jù)不可避免地涉及到患者的一些隱私信息,醫(yī)學(xué)數(shù)據(jù)挖掘者有義務(wù)和職責(zé)在保護患者隱私的基礎(chǔ)上進行科學(xué)研究,并且確保這些醫(yī)學(xué)數(shù)據(jù)的安全性和機密性。
(2) 多態(tài)性:醫(yī)學(xué)信息包括純數(shù)據(jù)(如體征參數(shù)、化驗結(jié)果)、信號(如肌電信號、腦電信號等)、圖像(如B超、CT 等醫(yī)學(xué)成像設(shè)備的檢測結(jié)果)、文字(如病人的身份記錄、癥狀描述、檢測和診斷結(jié)果的文字表述),以及用于科普、咨詢的動畫、語音和視頻信息。醫(yī)學(xué)信息的多模式特性是它區(qū)分其他領(lǐng)域數(shù)據(jù)的最顯著特征,加大了醫(yī)學(xué)數(shù)據(jù)挖掘的難度。
(3)不完整性:病例和病案的有限性使醫(yī)學(xué)數(shù)據(jù)庫不可能對任何一種疾病信息都能全面地反映,表現(xiàn)為醫(yī)學(xué)信息的不完全性。
(4)時間性:醫(yī)學(xué)檢測的波形、圖像都是時間的函數(shù);還有一部分醫(yī)學(xué)信息,比如病人的身份記錄等靜態(tài)數(shù)據(jù),雖然不帶有時序性,但都是對病人在某一時刻醫(yī)療活動的記錄。
(5)冗余性:醫(yī)學(xué)數(shù)據(jù)庫是一個龐大的數(shù)據(jù)資源,每天都會有大量相同的或部分相同的信息存儲在其中。
三、甲型H1Nl疫情防御決策支持系統(tǒng)基本框架
甲型H1Nl疫情防御決策支持系統(tǒng)基本框架如圖1所示。
系統(tǒng)首先對歷史甲型H1Nl流感數(shù)據(jù)進行收集、處理,并在此基礎(chǔ)上構(gòu)造預(yù)測和模擬甲型H1Nl流感發(fā)展的模型。當(dāng)有甲型H1Nl流感疫情出現(xiàn)的時候,要及時對最新發(fā)展情況進行搜集和分析處理,以獲得有效的決策數(shù)據(jù)。隨后將有效的甲型H1Nl流感疫情數(shù)據(jù)輸入應(yīng)急子系統(tǒng),經(jīng)系統(tǒng)處理得到甲型H1Nl流感疫情的發(fā)展預(yù)測信息。在此基礎(chǔ)上通過診治子系統(tǒng)制定相應(yīng)的診治策略。因此,所討論的決策支持系統(tǒng)由3個子系統(tǒng)組成:數(shù)據(jù)采集分析子系統(tǒng)、應(yīng)急子系統(tǒng)、診治子系統(tǒng)。
四、基于甲型H1N1防御系統(tǒng)的數(shù)據(jù)分析系統(tǒng)算法描述
1. 模糊集與信息推理
隨著科學(xué)的深化,研究的對象越來越復(fù)雜,這些復(fù)雜的東西越來越難以精確化。在一個大型系統(tǒng)中,當(dāng)它的復(fù)雜性增加時,將它精確化的能力將會降低,在達到一定閾值以上時,復(fù)雜性和精確性將相互排斥,產(chǎn)生由復(fù)雜性引起的模糊性問題。在甲型H1N1發(fā)生的過程中人們所得到的信息常常是不精確、不完全或模糊的,為此需用Fuzzy集理論來處理這些問題。在甲型H1N1防治中,首先建立模糊規(guī)則庫,它是由若干模糊推理規(guī)則庫組成的。模糊規(guī)則庫可以通過向?qū)<易稍兊玫?,把專家的?jīng)驗抽象成模糊與可拓規(guī)則的規(guī)則庫,也可以通過自學(xué)習(xí)的方式得到。將甲型H1N1傳播過程中收集到的各項信息輸入規(guī)則庫中,進行模糊推理,提高信息的精確性。此外,還可以利用灰色關(guān)聯(lián)分析、可拓學(xué)3—4—4法對這些模糊信息進行處理。
2. 確定決策目標(biāo)及指標(biāo)體系
為確定決策目標(biāo)及指標(biāo)體系,首先聘請一些專家并為每一位專家分配權(quán)重。WAS權(quán)重分配系統(tǒng),通過對所聘專家的權(quán)威質(zhì)量、熟悉度、謹(jǐn)慎度g、知識廣度e、智力激發(fā)度w等方面進行評判分析,確定各專家的權(quán)重,然后將極值統(tǒng)計與專家的權(quán)重結(jié)合起來確定一個任務(wù)的各指標(biāo)權(quán)重。再讓專家對數(shù)據(jù)進行初步的分析后,根據(jù)問題的復(fù)雜程度,調(diào)用不同的系統(tǒng)來對局勢進行分析并給出評估結(jié)果。
如果問題不復(fù)雜,只需要調(diào)用WAS即可,如果問題比較復(fù)雜,則必須調(diào)用模糊灰色物元空間(FHW)或其最新進展的VGES,有效地組織專家、咨詢專家、進行群決策。它是建立在多級專家決策系統(tǒng)基礎(chǔ)上,可以全面吸收從中央到地方的各級領(lǐng)導(dǎo)、專家的意見,并對這些意見進行加權(quán)處理,發(fā)揮專家的正確意見,而舍棄那些不全面的意見。
通過分析專家們的分析結(jié)果,選擇一些能夠反映客觀狀況的實際指標(biāo)。這些指標(biāo)包括疫情狀況、地區(qū)地域經(jīng)濟狀況等特點,從而建立指標(biāo)體系。
3. 利用集對分析確定噪聲
集對分析(SPA,Set Pair Analysis)的基本思想是:在一定的問題背景下,把客觀系統(tǒng)之間的確定與不確定性作為一個系統(tǒng)來研究,用聯(lián)系度來描述其中同異反的聯(lián)系關(guān)系,并用來處理和分析事物之間的中介不確定性等。
其聯(lián)系度為u=a+ bi+ c 且滿足歸一化條件a+ b+ c=1。
設(shè)甲型H1N1傳播過程中標(biāo)準(zhǔn)信息式為u=a+ bi+ cj,式中a為甲型H1N1傳播過程中的非噪聲,即真信息,是進行決策的直接參考的信息,不需要進行轉(zhuǎn)換,是甲型H1N1信息中的“同”;b為甲型H1N1信息中的第一類噪聲信息,是甲型H1N1信息中的“異”;c為甲型H1N1信息中的第二類噪聲信息,是甲型H1N1信息中的“反”。
而經(jīng)過集對分析以后的目標(biāo)表達式為u'=a'+ bi'+ cj',
它應(yīng)當(dāng)滿足如下要求:
a' > a,
b'≤b,
c' = 0。
對所得的信息U',根據(jù)實際情況選取適當(dāng)?shù)拈撝?,來判斷該?shù)據(jù)是接受還是拒絕。如果不滿足要求,可利用消錯學(xué)中的l5—6—3法,從各種不同的路徑,進行一些基本變換和一些組合,找出所需要的消錯方案進行反饋與消錯。然后再重新收集信息。
五、研究結(jié)論
本文討論了基于甲型H1N1防御系統(tǒng)的數(shù)據(jù)采集分析系統(tǒng)的基本方法,這套方法不僅僅能夠應(yīng)用到甲型H1N1流感疫情的決策支持上,對于其他的傳染性疾病包括禽流感,或者突發(fā)性的社會范圍的災(zāi)難如地震等也是有效的。
通過智能決策支持系統(tǒng)的建立,人們可以更加客觀、科學(xué)地進行決策。而相關(guān)預(yù)決策軟件的設(shè)計、實現(xiàn)和部署也將是一個復(fù)雜的系統(tǒng)工程,考慮到各個子系統(tǒng)之間有交叉環(huán)節(jié),可采用面向?qū)ο蟮南到y(tǒng)設(shè)計思想,把VGES,F(xiàn)HW ,F(xiàn)GR,WAS系統(tǒng)和消錯系統(tǒng)作為各子系統(tǒng)的公用系統(tǒng)即為類,把在子系統(tǒng)中的具體應(yīng)用作為對象;并對WAS權(quán)重分配系統(tǒng)和集對分析算法的軟件等核心部分做了深入的探索和研究,取得了預(yù)期的效果。
參考文獻:
[1]陳堅志.基于數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)的決策支持系統(tǒng)[J].福建電腦,2009(7):113-115
[2]周星宇,張江,劉揚等.SARS分析、預(yù)測、防治決策系統(tǒng)探討[J].中國工程科學(xué),2005,7(1):69-75
[3]張江,林華,賀仲雄.統(tǒng)一集論與人工智能[J].中國工程科學(xué),2002,4(3):40-47
[4]黃崇福,王家鼎.模糊信息分析與應(yīng)用[M].北京:北京師范大學(xué)出版社,1992
[5]郝忠孝,趙齡高,高巖等.函數(shù)依賴集F有內(nèi)部沖突的判定問題研究[J].計算機研究與發(fā)展,2004,41(9):1540-1544
[6]李志敏.數(shù)據(jù)挖掘技術(shù)在個性化信息服務(wù)中的應(yīng)用[J].科技信息,2009(17):57
[7] 范建中,王福慶.基于Web的數(shù)據(jù)挖掘技術(shù)研究與應(yīng)用[J].電腦編程技巧與維護,2009(12):32-33