摘要:提出了對象及其特征數據的一些特性指標:對象的相似度、復雜度、隱蔽度(或能見度),特征數據的貢獻度、常見度、顯隱性。在綜合分析這些特性的基礎上,通過融合模糊神經網絡技術及可拓學思想,研究了一種信息非完全的復雜數據智能化處理拓展算法,通過嵌入競爭神經網絡的計算模型實現了該算法。在復雜的中醫診斷推理過程的應用結果表明,該算法可以較好地應用于處理復雜的中醫臨床數據。
關鍵詞:智能處理; 拓展算法; 模糊神經網絡; 中醫診斷
中圖分類號:TP18; TP301文獻標志碼:A
文章編號:1001-3695(2008)05-1328-02
對非線性復雜數據的處理和計算已經研究了一些有效的方法,如進化計算、神經網絡計算、模糊計算、粗糙集計算等。這些方法處理的數據一般是完全信息數據,也就是說已知條件是充分的。但還有一類問題需處理非完全信息數據,也就是說已知條件是非充分的。
診斷實際上是一種通過可直接得到的數據提供的信息和各種關聯關系獲得隱藏在事物背后的內部信息的數據處理過程。診斷往往會遇到已知數據只提供非完全信息的情況,在這種情況下不是只簡單地依據已知數據進行計算,還需搜尋和補充數據。
診斷推理作為人工智能的一個重要研究領域,許多學者[1~6] 在這方面做了大量研究,綜合運用神經網絡方法和粗糙集理論等提出了一些算法,主要研究數據處理的方法。醫學診斷的智能化方面也有許多學者[7~15]做了一些研究工作,對醫學信息的模糊性給予了足夠重視。但是還沒有人考慮已知數據的非完全性。
在中醫診斷中,中醫臨床上的每一癥狀(含體征)都具有辨“證”意義。每一癥狀對各癥候的診斷意義并不是一對一的簡單關系,而是一個癥狀對多種“證”具有不同的診斷價值,而且這種關系不能精確地描述。同時,每一癥候的診斷則往往需要根據多種臨床表現(即癥狀)才能確定。因此,癥狀與病癥之間是一種模糊的多對多的復雜關系。中醫的臨床診斷往往不是在獲得充分癥狀和體征信息的條件下才開始進行,而是依據非充分癥狀和體征信息開始診斷。
1拓展算法
從數據處理角度而言,中醫診斷要解決的關鍵問題是復雜數據的處理問題,而且初始信息往往是非完全的。為了找到處理這類數據的有效算法,先看看人腦是怎么處理這個問題的。醫生在進行診斷時,先依據主癥狀快速作出初步判斷;然后按可能性最大的病癥(或與其相似的病癥)進一步詢問病情或作臨床體檢以補充所需信息;最后依據較完全的癥狀和體征信息作出最終斷定。在醫生的診斷思維過程中,存在一個思維發散的子過程,在這個子過程中會充分考慮多種可能性和充分了解病人的病情。初步判斷是為了給尋求答案指明方向和縮小搜索范圍,這是非常必要和有效的一個關鍵步驟。
1.1數據的特性分析
不同的特征數據與其對象之間的關系是有差異的。對象之間的關系對數據的處理也有重要影響。為便于數據處理,在這里定義一些特性參數描述這些關系和影響程度。
定義9 兩個對象i、 j的相似度等于它們的相同特征數據加權和之比,用Rij表示。一般來說,相同特征越多,相似度越接近于1。對象之間相似度用來描述兩對象的加權相同特征的多少。
設相同特征個數為N,對象i與j的相似度為Rij,則
1.2補全數據的方法
補全數據要有的放矢,要充分利用已知數據提供的信息。譬如醫生診病,不能漫不著邊際地詢問病情,更不能做大量臨床體檢。一種有效的方法應該是先依據已知的信息推出可能性最大的對象;然后優先就可能性最大的對象補充相關數據,若不能就此補充相關數據,則按與可能性最大的對象相似的對象補充相關數據;最后在信息補充較完全的條件下進行最終數據處理。這里需解決好兩個問題:對已知數據怎樣處理;怎樣補全數據?
從信息角度而言,如果已知數據是完全的,則可以通過處理已知數據直接獲得結果;如果已知數據是非完全的,則可以通過處理已知數據找到解決問題的出發點。
如果對象j的存在可能性最大,在特征數據不完全的情況下,優先考慮對象j,就其補全特征數據。對于對象j的特征數據,優先考慮補充V值較大的未知特征數據。
若對對象j補全特征數據失敗,則考慮與對象j相似的對象。向相似對象拓展時,優先考慮相似度(R)大的對象。若有幾個相似度相近的對象,那么優先考慮復雜度小和隱蔽度小的對象。
綜上所述,優先考慮相似度大且診斷難度小的對象,補充其價值V大的特征數據。
定義10對象j的特征數據i關于對象k的綜合價值Aik等于對象j與k的相似度Rkj同特征數據i關于對象j的價值Vij之積,與對象k的診斷難度dk之比值,即
1.3數據處理精度控制
對象特征數據的完全程度是相對的,有時并不需要補全所有的特征數據。為了達到快速而準確的推理,需控制數據處理精度。
定義11已知特征數據的加權和與對象所有特征數據的加權和之比叫做對象判定的可信度,用θ表示。
對于待判定對象i,設其已知特征數個數為n,總特征數個數為m,顯然有 n≤m:
2算法實現結果與分析
算法的實現以對中醫臨床數據的處理為例。
在中醫診斷中,以癥候為對象,癥狀和體征參數就是特征數據,如體溫、咳嗽、流鼻涕、尿頻尿急、心慌、多夢……為顯性癥狀,即顯性特征數據,而需作CT、化驗等才能獲得的癥狀參數為隱性特征數據。
對于中醫診斷,為了在癥狀和體征信息不完全的情況下能得出初步診斷結果,同時考慮到癥狀信息的模糊性,將模糊競爭網絡嵌入在一個環路中,如圖1所示。模糊競爭網絡能按已知的非完全癥狀數據進行綜合計算,得出一個最可能的診斷結果。由于模糊競爭網絡嵌入在一個環路中,能以初步處理結果為中心進行拓展并補充癥狀和體征信息,在補充新的信息后再進行綜合計算,并得出新的計算結果。
競爭網絡的輸出是勝者全得。這樣一來總有一個計算結果輸出,但有可能計算結果過于勉強。為了避免在癥狀信息過分不充分的情況下得出錯誤的結論,需設置一個給勝者評分的機制。如果勝者得分過低,需通過醫生的望、聞、問、切或者通過查詢經驗庫進行有針對性或引導性(或提示性)詢問,或者有針對性地進行臨床體檢,以獲取隱性癥狀或類似病癥的癥狀,進一步補充癥狀數據,得出合理的結論。
補全癥狀數據按本文的拓展算法進行,不僅可以較快地進行診斷,而且可以降低診斷成本。尤其是作臨床體檢,針對性要非常強,否則診斷的費用會大大提高。
3結束語
本文研究了一種對非完全復雜數據信息智能化處理的新方法,這是一種具有較高智能和可以較好地模擬人腦思維過程的新算法。在綜合應用機器學習、數據挖掘、模式識別及中醫癥狀信息量化等方面的研究成果基礎上,模擬中醫專家診斷過程的效果令人滿意。本文研究算法也可以應用于故障診斷和智能搜索。
參考文獻:
[1]魏圓圓,王儒敬,方靜.多種診斷推理方法的設計與比較[J].計算機工程與應用,2005,41(2):57-58.
[2]李千目,戚勇,張宏,等.基于粗糙集神經網絡的網絡故障診斷新方法[J].計算機研究與發展,2004,41(10):1696-1702.
[3]馮志鵬,杜金蓮.粗糙集與神經網絡集成在故障診斷中應用研究[J].大連理工大學學報, 2003,43(1):70-76.
[4]何建敏,于躍海.基于粗集理論的醫學診斷規則提取方法[J]. 系統工程學報, 2002,17(6): 519-525.
[5]胡兆勇,屈梁生.機械故障診斷的推理規律研究[J].振動工程學報,2004,17(4):421-426.
[6]吳明強.故障診斷專家系統綜合智能推理技術研究[J].計算機測量與控制, 2004,12(10): 932-934,978.
[7]張全海,葉晨洲,施鵬飛.基于multi-agents分布式醫學診斷系統研究[J].信息與控制, 2003,32(1):23-27.
[8]趙衛東,盛昭瀚,杜雪寒.基于神經網絡的案例推理醫療診斷[J].東南大學學報:自然科學版,2000,30(3):46-50.
[9]徐定杰,周遠東,桑育黎,等.模糊神經網絡控制的醫療診斷系統研究[J].中醫藥學刊, 2005,23(5): 781-783.
[10]張惠康,錢宗才,屈景輝,等.專家系統及其在醫療診斷中的應用[J]. 第四軍醫大學學報, 2002,23(B12):73-76.
[11]李凡,蔡立晶,田應忠.基于Vague集的醫療診斷系統[J].華中科技大學學報:自然科學版, 2002,30(10):47-49.
[12]蔡航.基于神經網絡的醫療診斷專家系統[J]. 數理醫藥學雜志, 2002,15(4): 294-295.
[13]鄭鵬,劉海青,李石君.模糊聚合算子在醫療診斷中的應用[J].計算機工程與應用, 2001,37(24): 170-171,175.
[14]何先華,趙衛東,盛昭瀚.粗集在醫療診斷知識支持中的應用[J].計算機工程與應用, 2001,37(20): 166-168.
[15]趙衛東,盛昭瀚.基于形象思維的醫療診斷系統研究[J].系統工程理論與實踐, 2000,20(10): 108-113.
[16]韋玉科,汪仁煌,陳群,等.基于競爭神經網絡的中醫智能診斷推理新方法[J].計算機工程與應用,2006,42(7):224-226.
[17]李江平,韋玉科.亞健康中醫診斷系統[J].計算機工程,2005,31(15):222-223.
“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文”