陳艷霞 劉揮
基于BP神經網絡的醫學數據分析
陳艷霞 劉揮
BP網絡是一種基于誤差反向傳播(Back Propagation)算法的多層前向神經網絡。采用動量梯度下降算法(TRAINGDM)訓練BP網絡,建立輸入到輸出的函數映射關系,使其對48例兩類五種醫學免疫學數據進行訓練與分類。訓練集數據正確檢出率為100%,測試集數據正確檢出率為87.5%,效果優良。結論BP網絡應用于免疫學數據分類取得很好效果,在臨床免疫學人工智能診斷方面將有更為廣泛的應用空間。
BP神經網絡;動量梯度下降算法;免疫學數據
人工神經網絡理論以非線性大規模并行分布處理為特點,突破了傳統的線性處理模式,以其高度的并行性,良好的容錯性和自適應能力成為人們研究其賴以生存的非線性世界、探索和研究某些復雜大系統的有力工具,已應用于很多領域的信息處理工作。
BP算法的多層前饋網絡的人工神經網絡模型采用典型的有教師學習方式來進行預測和分類問題的處理。采用的傳遞函數通常是sigmoid型可微函數,可以實現輸入和輸出間的任意非線性映射。這使其在函數逼近、模式識別、數據壓縮領域有著更加廣泛的應用。該模型的特點是信號由輸入層單向傳遞到輸出層,同一層神經元之間互不傳遞信息,每個神經元與鄰近層所有神經元相連,各神經元的作用函數為Sigmoid函數,用樣本集合反復訓練網絡,并不斷修改權值,直到使實際輸出向量達到要求,訓練過程結束。應用BP網絡處理正常狀態與處于焦慮狀態的學生的血液中免疫學指標數據,取得了很好的效果[1]。
數據選自在某大學就讀的大學生,共計48例。在自愿、正常學習生活的情況下抽取他們的血液標本,然后再在考試前抽取他們的血液標本,分別進行五項免疫學指標檢驗,共獲得兩類、五項、480組數據。隨機把其中的20例學生的兩類、五項數據做為訓練集輸入矢量輸入,目標矢量為處于考前狀態的五項數據輸出為1,平時正常生活狀態的五項數據輸出為0。網絡訓練時調整神經元之間的連接權值,使網絡的輸出和實際的兩類情況盡可能相符。如果對所有的訓練樣本集網絡的輸出95%或更高能保證與實際結果一致,則訓練過程結束。網絡訓練好后,剩余的28例學生的5項數據作為神經網絡的輸入項,神經網絡的輸出值就是該學生是處于考前狀態1還是平時正常生活狀態0。主要設計程序如下: %NEWFF-生成一個新的前向神經網絡;%TRAIN-對BP神經網絡進行訓練;%SIM-對BP神經網絡進行仿真;pause%敲任意鍵開始




表1 BP神經網絡處理免疫學數據結果
其中對于訓練集,正常狀態與考前狀態的正確檢出率為100%。對于測試集,正常狀態的正確檢出率為85.7%;考前狀態的正確檢出率為89.3%。平均為87.5%。
3.1 本研究所采用的人工神經網絡檢驗免疫數據的結果較好地符合了已知數據,具有較高的準確性。
3.2 要想進一步提高該方法的準確性,應該注意收集更多更全面的檢驗數據。如果我們所使用的數據越多越全面,則其中所蘊含的事物本身的規律性就越強,利用人工神經網絡從中所抽取的函數關系就越具有普遍性,因而就更準確。
3.3 可能對亞健康的診斷具有指導意義。亞健康問題各國醫學界已作了一些研究,并取得了某些實際的成果。但是,由于亞健康的多種類型以及多種相關因素,使得現有的診斷在準確性和實用性方面都存在著相當的局限性,如建模復雜困難。由于對影響罹病與否的各種因子的作用機制了解得不是很清楚,如何建立診斷模型,以及如何確定新建立的模型在何種程度上與實際情況相吻合還是一個問題;容錯能力不強,適用范圍不廣;依賴于某些病例庫新建立起來的醫學模型往往具有很強的局限性,用于新的病例庫時誤差有時較大。另外,由于醫學方面的原因,我們收集到的數據有時不完整,而現有的研究方法所建立起的醫學模型由于容錯性差,對這些不完整的數據通常都難以處理。人工神經網絡理論突破了傳統的線性處理模式,以其高度的并行性,良好的容錯性和自適應能力成為人們研究其賴以生存的非線性世界,探索和研究某些復雜大系統的有力工具。對亞健康的診斷關鍵在于準確找到亞健康的判定函數,可能利用BP網絡的函數逼近功能來實現。這需要有更多的醫學數據來實踐檢驗。
[1]許東,吳征.基于MATLAB6.X的系統分析與設計-神經網絡.西安電子科技大學出版社,2002:9.
[2]王俊杰,陳景武.BP神經網絡在疾病預測中的應用.數理醫藥學雜志,2008,21(3):260-262.
116044 大連醫科大學醫學影像學系(陳艷霞);大連醫科大學檢驗醫學院(劉揮)