胡傳志 黃華
摘 要:本文基于多主智的體群學習算法(GLBMA)提出了一個協作學習模型,通過各agent能夠針對某一領域問題交換意見,分別擴充或修改各自原有的知識,直到達成共識。把該模型用于惡性腫瘤早期輔助診斷可以解決專家知識分布存儲聯合求解的醫療問題。
關鍵詞:機器學習;協作;agent;醫學診斷
惡性腫瘤是一種常見病,嚴重威脅著人類的健康,越是早期發現,其治愈惡性越高,惡性腫瘤的臨床具有隱蔽性,較早較準的發現很重要。惡性腫瘤的診斷是一個綜合的處理過程[1],通常是根據病人的臨床體癥和相關影像學和病理組織學檢查而最終確診的,像咳嗽,發熱,X光,血液,細胞學檢查等等,這種檢查結果與醫生水平,臨床經驗等等人為因素有很大關系。而且由于思維慣性,不太可能對每一病人做出特異的檢查,容易造成誤診和漏診。在信息時代,通過計算機深入研究各種引起癌癥種種常見臨床表現數據,并在此基礎上得出診斷結果,必將成為的惡性腫瘤早期輔助診斷發展趨勢。
1 惡性腫瘤早期診斷流程
⑴特征數據提取。通常診斷結果是通過三個方面數據分析得出的。一是:往往癌癥與年齡、性別,家族史、既往史、吸煙史、術后病理、等有關的。二是:通過儀器X射線檢查、CT檢查、纖維支氣管鏡檢查、PAT痰等等檢查的結果,三是:通過惡性腫瘤有許多顯著的臨床特征如:1)大小便習慣改變,2)傷口長期不愈合,3)乳房或身體其他部位無痛性的、較硬的腫塊,4)消化不良或吞咽困難,5)明顯的變化的疣或痣,6)或刺激性的咳嗽或聲音嘶啞等等。對上述的進行量測特征提取,將結果數值化,作為agent知識庫的輸入值,數據主要是有關由此引起的惡性腫瘤的概率用P表示,它可以通過專家經驗獲得,或者是通過一個統計分析的結果。這樣就可以建立許多數據對。
⑵數據的預處理。首先對單個數據對采?。?或0,P)形式,1表示存在上述三個方面的某個特征,如有吸煙史,0則表示沒有,P為其對應的概率,同上初始值源于專家,我們把上述的三個方面的所有特征組成兩個序列,都是采用(年齡、性別,…,X射線檢查、CT檢查,…,大小便習慣改變,傷口長期不愈合,…)這種序列,其順序是固定的,因為決策過程采用的BP神經網絡,它的對應的輸入采取的是由P組成的有序序列(P1,P2,…, Pn),我們把這些由0,1組成的序列如(1,1,0,…,0,1)作為系統中監控agent的輸入控制信息。這個監控agent來激活下層agent。同時接受來自下層agent的反饋信息序列。
2 基于群體協作學習模型GLBMA
GLBMA(Group Learning Based Multi-Agent)其目標是多個agent協調各自的行為,通過群體學習合作完成共同的目標。文獻[2]把基于主智能體的GLBMA應用于機器人足球,其中引入了主智能體的概念。
把GLBMA應用于惡性腫瘤早期診斷,我們選用監控agent的概念。其作用與主agent有所不同,在這里監控agent不是執行學習任務的主角,而是起協調和任務分配作用。其它體癥agent,如:咳嗽agent為輔智能體,激活后這些agent將成為學習任務的主角。通過監控agent和輔助agent以及輔助agent之間的信息交互來實現整個團隊的學習,達到共同目標。
⑴agent模型。在惡性腫瘤早期診斷系統中,agent是有統一的機構,每個agent一般都有自主性,交互性,主動性,其一般包括,通信管理模塊,推理控制模塊,agent狀態欄,和agent知識庫,改造文獻[3]的模型,可以設計agent模塊如圖1。
通信管理模塊:(Communication Module,CM)完成的是agent與用戶或與其他agent之間的信息傳遞,它負責將從外界接收到的信息傳遞到內部控制,或者將內部控制塊的信息傳送給指定的agent或人。
學習系統模塊:可以完成特定的學習任務,目前主要有三種學習策略:類比學習系統,解釋性學習系統和歸納邏輯程序設計學習系統。
⑵訓練。對該系統每個agent,提供足夠的臨床案例加以訓練,使之更好的實現和盡可能的提高該系統的準確性非常必要,特別是對函數fi的調整很重要,盡可能多的輸入涉及到更多的agent病例,從而使更多的agent交互,另外使知識庫更完備,使函數更加準確。
3 結束語
本文把基于多主智的體群學習算法(GLBMA)應用于惡性腫瘤早期診斷系統中,通過主智能體和輔智能體的角色切換來實現整個團隊的學習,改進了傳統的學習算法。仿真試驗表明,GLBML可以解決學習狀態空間過大,連續狀態空間的行為選擇及多智能體合作求解等問題。
[參考文獻]
[1]惡性腫瘤有哪些診斷方法?2002-01-18,http://www.em800.com/m/ca7264.htm.
[2]程顯毅,李淑琴,夏德深.基于主智能體的群體學習算法GLBMA的研究. 江蘇大學學報(自然科學版),2005,26(5):437-440.
[3]劉貴全,陳小平,蔡慶生,劉潔.一個基于Agent協作式學習系統.中國科技大學學報,2000,30(1):34-37.