程遙++萬遂人
【摘 要】 本文對72例高血壓臨床數據展開研究,通過BP神經網絡結合臨床數據中包含的中醫西醫的檢查結果,對高血壓病診斷結果的等級分層和用藥情況進行預測分析,通過對10例預測樣本分析,達到了88%的準確度,并對不同的BP神經網絡函數進行比較,找到效果更優的函數設置。
【關鍵詞】 BP人工神經網絡 高血壓 診斷 預測
【Abstract】 Hypertension is a very common disease, but reasons that cause the disease is complicated, this paper focus on classification and prediction of the hypertension. We also do the compare between different function sets to find a much better way.
【Key words】 BP Artificial neural network Hypertension Diagnose Predict
1 BP人工神經網絡原理
BP人工神經網絡也叫反向傳播算法(Back-Propagation)是一種監督式的學習方法,其主要思想為輸入向量,已知與其對應的輸出樣本為,學習的目的是用網絡的實際輸出和實際值之間的誤差來修改權值,使得它們之間的誤差平方和達到最小,盡可能的接近[1]。
2 實驗建模方法
2.1 數據預處理
數據處理是建模過程的重要的步驟,數據處理的主要目標是針對數據源中數據的不規范性、二義性、重復性和不完整性等問題進行修正[2]。本文所采用的高血壓臨床數據樣本主要存在數據缺失和錯誤的問題,對出現缺失和錯誤的樣本采取刪除處理,92例數據中共處理20例數據。
2.2 數據選擇和轉換
原始數據庫包含200多個數據項,但我們并不需要使用所有的數據項,并不是所有的數據都直接影響我們的輸出結果,我們需要能夠直接影響輸出結果的數據項。最終確定了年齡、性別、飲酒、食鹽量、既往病史、頭暈、胸痛、血糖、血壓、尿酸、高血壓分級、危險分層、用藥種類等37個項目作為建模分析所需的數據項。其中32個為BP人工神經網絡的輸入數據項,5個為輸出數據項,輸入數據項包含基本信息、中醫望聞問切檢查項、西醫實驗室指標和生活習慣等數據項,輸出項為高血壓分級和高血壓危險等級分層以及藥品種類。
數據轉換工作是對原始數據進行二次處理的過程,把原始分布的數據進行分層、編號、轉換處理。數據轉換的工作有兩個目的,首先轉換數據使得數據特性更加適合建模,其次在一定程度上可以優化模型,使結果更加準確和穩定。例如:對年齡進行分層并進行編號,對身高體重參數采用BMI體重指數代替并進行分層編號處理等。本文對37個數據項中的13個進行了轉換處理,包括年齡、身高體重、實驗室檢查指標以及用藥種類。
2.3 模型建立
本文的數據樣本經過處理之后一共有72組數據,其中62組作為訓練數據,10組作為預測數據。每一組數據都有32個BP人工神經網絡輸入數據項,5個輸出數據項。相對應的BP神經網絡的輸入層有32個節點,輸出層有5個節點。實驗中采用MATLAB平臺建立模型,MATLAB提供了神經網絡的基本函數,可直接利用函數進行建模。實驗通過newff函數可以對網絡進行創建,在newff中需要對四類參數進行設定,分別是:輸入數據的最大最小值,層節點數,轉移函數和BP人工神經網絡訓練函數。網絡創建之后,要通過TRAIN函數對網絡進行訓練,本文采用62訓練樣本,訓練次數設定為20000,訓練步長為0.05,全局最小誤差為0.0001。
3 實驗結果
我們通過對10組數據進行預測,每一組數據有5個輸出項,分別為高血壓診斷分類(3項),用藥種類(2項)。在給出結果之前,本文創新的針對newff函數的參數進行了比對分析,發現訓練函數為trainscg,轉移函數為(tansig,tansig,purelin)的設置效果更優。圖1和圖2為輸出誤差分析圖,分別對應5個輸出項,圖中0刻度代表0誤差,越接近0刻度說明預測結果越準確。
從圖1和圖2中我們可以發現,相比于其他函數組合的網絡模型誤差分析,此模型的誤差輸出總體上更優,統計得出預測結果達到88%的準確度,全局最小誤差為0.0001的情況下,網絡用時19秒。
4 結語
本文的研究對人工神經網絡在高血壓診療方面的成功應用提供了有力的支持。對于醫學數據來說,通過數據形式的轉換,把原始的指標值通過歸一化、分類編號等處理所建立的網絡模型性能更好。對于BP人工神經網絡中不同的訓練函數設定會對網絡模型的性能產生影響,通過實驗發現共軛梯度trainscg訓練函數在網絡預測表現更好。對于BP人工神經網絡中不同的轉移函數設定會對網絡模型的性能產生影響,通過實驗發現(tansig,tansig,purelin)的函數組合在網絡模型預測中表現更好。
參考文獻:
[1]醫學數據挖掘[M].高等教育出版社,2006.
[2]蘇新寧.數據倉庫和數據挖掘[M].清華大學出版社,2006.endprint