劉 磊 鐵 英 (吉林工商學信息工程分院,吉林 長春 130062)
人工神經網絡技術在肺癌診療中的應用
劉 磊 鐵 英 (吉林工商學信息工程分院,吉林 長春 130062)
神經網絡;網絡結構;肺癌;診斷;預后
人工神經網絡(ANN),也稱為神經網絡,是由大量處理單元(PE)即神經元(Neurons)廣泛互連而成的網絡,是對人腦的抽象、簡化和模擬,反映人腦的基本特性。神經網絡在兩個方面與人腦相似,一是神經網絡獲取的知識是從外界環境中學習得來的;二是互連神經元的連接強度,即突觸權值,用于儲存獲取的知識。用于完成學習過程的程序稱為學習算法,其功能是以有序的方式改變網絡的突觸權值以獲得想要的設計目標。ANN的研究最初是受生物神經系統啟發,研究人的智能行為;而現在則受到對特定的一些問題的適應能力和潛在的并行處理能力的驅動,是根植于神經科學、數學、統計學、物理學、計算機科學及工程等學科的一種技術。
神經網絡具有一些顯著的特點:非線性映射能力;不需要精確的數學模型;擅長從輸入輸出數據中學習有用知識;容易實現并行計算;由于神經網絡由大量簡單計算單元組成,因而易于用軟硬件實現等。因為神經網絡是一種模仿生物神經系統構成的新的信息處理模型,具有獨特的結構,所以人們期望它能解決一些用傳統方法難以解決的問題,如建模、時間序列分析、模式識別、鑒定、語音、翻譯和控制等,以實現各種復雜的功能。
ANN的研究最早可以追溯到研究人類大腦智能的時期。發展到現在,先后經歷了40年代的萌芽期(MP模型的建立到有了學習訓練算法)、50和60年代的第一次高潮期(從單級感知器的構造成功到否定它為止)、持續到80年代的反思期(證明了當時的單級感知器無法解決許多簡單的問題,后來一系列的基本網絡模型被建立起來,形成了ANN的理論基礎)、隨后迎來了第二次發展高潮期,期間反向傳播(BP)算法的提出,對ANN的研究與應用起到了重大的推動作用,是目前應用最廣泛的網絡模型之一;步入20世紀90年代后,開始步入了再認識與應用研究期。
目前大多數的研究主要集中在三個方面:(1)開發現有模型的應用,并根據實際運行情況對模型、算法加以改造,提高網絡的訓練速度和運行的準確度。(2)理論上的突破研究,試圖建立新的通用或專用的模型和算法。(3)進一步對生物神經系統研究,對人腦更深入的認識。
ANN一般由8個方面的要素組成:一組處理單元(PE或AN)、處理單元的激活狀態、每個處理單元的輸出函數、處理單元之間的連接模式、傳遞規則、把處理單元的輸入及當前狀態結合起來產生激活值的激活規則、通過經驗修改連接強度的學習規則、系統運行的環境(樣本集合)。1987年,Simpson對神經網絡給出了簡明扼要的定義:人工神經網絡是一個非線性的有向圖,圖中含有可以通過改變權大小來存放模式的加權邊,并且可以從不完整的或未知的輸入找到模式。
的神經元之間的連接有如下幾種形式:(1)前向網絡:前向網絡結構神經元分層排列,分別組成輸入層、中間層(也稱為隱含層,可以由若干層組成)和輸出層。每一層的神經元只接受來自前一層神經元的輸入,后面的層對前面層沒有信號反饋。輸入模式經過各層次的順序傳播,最后在輸出層L得到輸出。感知器網絡和BP網絡均屬于前向網絡。(2)有反饋的前向網絡:從輸出層對輸入層有信息反饋,這種網絡可用于存儲某種模式序列,如神經認知機和回歸BP網絡都屬于這種類型。(3)層內有相互結合的前向網絡:通過層內神經元的相互結合,可以實現同一層內神經元之間的橫向抑制或興奮機制。這樣可以限制每層內可以同時動作的神經元素,或者把每層內的神
根據連接方式的不同,神經網絡經元分為若干組,讓每一組作為一個整體進行運作。例如,可利用橫向抑制機理把某層內具有最大輸出的神經元挑選出來,從而抑制其他神經元,使之處于無輸出的狀態。(4)相互結合型網絡(全互連或部分互連):這種網絡在任意兩個神經元之間都可能有連接。Hopfield網絡和Boltzmann機均屬于這種類型。在無反饋的前向網絡中,信號一旦通過某神經元,該神經元的處理就結束了。而在相互結合網絡中,信號要在神經元之間的反復傳遞,網絡處于一種不斷改變狀態的動態之中。信號從某初始狀態開始,經過若干次變化,才會達到某種平衡狀態。根據網絡的結構和神經元的特性,網絡的運行還有可能進入周期振蕩或其他如混沌等平衡狀態。選擇哪種互聯方案(即網絡結構),是設計時的主要問題。通常將PE分成不同的層。每層中PE的數量也是要選擇的問題。
的學習為:學習是一個過程,通過這個過程神經網絡的自由參數在其嵌入的環境的激勵過程之下得到調節。學習的類型由參數改變的方式決定。目前,對應不同的人工神經網絡模型,有不同的學習/訓練算法,有時,同種結構的網絡擁有不同的算法,以適應不同的應用要求。對一個網絡模型來說,其學習/訓練算法是非常重要的。五個基本的學習算法:誤差一修正學習、基于記憶的學習Hebb學習、競爭學習和Boltzmann學習。誤差修正學習植根于最優濾波。基于記憶的學習通過明確地記住訓練數據來進行。Herb學習和競爭學習都是受了神經生物學上的考慮的啟發。Boltzmann學習有所不同,因為它是建立在從統計學力學借來的思想基礎上。BP網絡常被應用在函數逼近、模式識別、分類以及數據壓縮等領域。在實際應用中,80%~90%的神經網絡模型是采用BP人工神經網絡或它的變化形式,它也是前向網絡的核心部分,體現了人工神經網絡最精華的部分。
在神經網絡的背景下定義
肺癌起病隱匿,倍增時間短,轉移快,早期不易診斷,惡性程度高,早期診斷、早期治療是提高肺癌生存率和降低死亡率的關鍵。目前ANN在國內肺癌診斷上的研究不是很多,但在常用的腫瘤標志物檢測、影像學診斷和細胞學檢查三種診斷手段上均有應用。
吳擁軍等〔1,2〕通過對血清中12種腫瘤標志物進行聯合檢測,建立了基于BP網絡的肺癌智能化診斷模型系統,并通過對比結果顯示,這種方法優于常規統計學方法。BP網絡對肺癌診斷的識別率和預示率均為100%,同時判斷出正常、良性與肺癌組織,為臨床肺癌診斷提供有價值的參考資料,亦可以用于大規模的高危人群普查時初篩。韓小宏等〔3〕同樣建立的神經網絡模型對8個標記物單獨測試檢驗準確率,并篩選出最高準確率的腫瘤標志物最佳的組合,結果顯示預測肺癌樣本的特異性為92.9%,敏感度為86.0%,陽性預測值85.5%。
黃雪梅等〔4〕通過采集肺癌穿刺標本涂片或者切片,先后經過圖像預處理、圖像分割和特征提取而得到樣本,共14個特征值,然后進行歸一化處理。在確定BP網絡結構時,輸入層取14個節點,對應肺部細胞的14個特征值--6個形態特征值、6個色度特征值、整幅切片圖的紅色分量平均值和細胞區域的灰度平均值;隱含層根據實際情況取11個節點:輸出層取5個節點,對應5種不同的診斷結果——鱗癌、腺癌、小細胞癌、核異型和無癌。在訓練過程中,作者加入了權值和閥值調整的動量參數,取值在0.8上。結果表明,加入動量后項訓練時間減少,在通用的訓練次數下均方差更小,說明動量項加快了收斂速度。誤差變化更穩定,出現的局部極小次數明顯降低。最終的識別率都在80%以上,較好地符合了已知數據。南京大學計算機科學與技術系和中國人民解放軍八一醫院聯合研制完成了基于神經網絡的肺癌早期細胞病理診斷系統Lung Cancer Diagnosing System(LCDS)。此系統充分利用了數字圖像處理、模式識別和人工神經網絡等方面的先進技術,能根據細胞切片的彩色圖像進行肺癌的識別和診斷。在模式識別階段,提取出有關的形態和色度特征,并進行規范化處理,建立了一個三層前饋型BP神經網絡分類器進行肺癌細胞分類診斷〔5〕。
Matsuki等〔6〕利用7個臨床參數和16個高分辨CT掃描評價指標構建ANN,結果顯示網絡診斷的正確性優于資深醫師常規閱片的正確性。畢曉君等〔7〕、王曉華等〔8〕針對肺部CT圖像的孤立結節的腫瘤識別方法,把BP網絡應用其中,進行腫瘤的識別和分類。試驗結果證明,其惡性腫瘤識別率分別達到了89%和98%。
趙景波等〔9〕利用分析呼出氣體的成分對肺癌患者進行診斷和監護。對所得的傳感器數據采用徑向基函數RBF神經網絡模式識別方法建立傳感器陣列響應信號與測量氣體之間的映射關系。從測試樣本中隨機抽取80個樣本,其中60個作為訓練集,20個作為測試集,在不同的溫度和濕度條件下進行3次實驗。將訓練好的網絡對樣本進行測試,判別結果的正確率達到90%以上。
適應線性神經網絡Madaline模型對痰液中的癌細胞進行識別和分類,對于癌細胞的檢出率為89%。此模型的特點是網絡結構簡單、算法成熟、收斂性好,缺點是中間層的加工元的個數需要人為確定。龔平等〔11〕也有類似報道。
除了利用BP網絡外,還有利用其他網絡結構的相關報道。王阿明等〔12〕利用小波神經網絡模型綜合研究肺癌患者的各項指標對預后的影響。小波神經網絡綜合了小波變換良好的時頻局域化性質及神經網絡的自學習功能,具有很好的逼近能力和容錯能力。將隨訪所得存活期按是否超過3年為標準,分為兩類。對已學習過的60例訓練樣本進行測試,此模型預測成功率為100%;而對11例未經網絡學習訓練的樣本,有9例預測成功,準確率為81.8%。相比傳統的BP網絡,小波神經網絡模型學習收斂速率快,并且可以自適應地確定隱層單元數目;同時,更適用于患者群體的基于統計學的分類預測比較,這種基于小波神經網絡模型的預后具有個性化特征。張卓勇等〔13〕利用Kosko提出的雙向聯想記憶神經網絡對血清樣本標志物進行分析,分類判別癌癥患者與正常人,在工作所選定的條件下,達到了 100%的正確識別率。周怡伶等〔14〕基于 MAT-
陸建峰等〔10〕采用自LAB7.0軟件平臺,建立了基于時間序列的徑向神經網絡(RBF)預測模型。將4個時間段的時間序列數據作為輸入,分別預測未來2年、3年、4年和5年的肺癌發病率,同時通過比較來確定模型的有效預測期限。
毫無疑問,ANN在計算機輔助肺癌的診斷、患病風險預測、預后等方面具有很好的應用前景,診斷效率與準確率都有很大提高,誤診率大大降低。隨著ANN技術的前瞻性研究不斷進步和發展,將有更多改進的模型應用于臨床。
1 吳擁軍,吳逸明.人工神經網絡技術在肺癌診斷中的應用研究〔J〕.中華微生物學和免疫學雜志,2003;23(8):646-9.
2 馮斐斐,聶廣金,吳擁軍,等.基于6項腫瘤標志聯合檢測的3種分類模型判別肺癌的對比分析〔J〕.衛生研究,2009;38(4):389-91.
3 韓小宏,毛巧霞.血清腫瘤標記物的人工神經網絡模型在肺癌診斷中的應用〔J〕. 中國腫瘤臨床,2010;37(10):573-5.
4 黃雪梅,唐治德.BP網絡研究及其在肺癌診斷系統中的應用〔J〕.重慶大學學報,2005;28(1):72-3.
5 楊育彬,楊獻春.基于印神經網絡的肺癌早期細胞診斷系統〔J〕.南京大學學報(自然科學),2000;36(11):1081-2.
6 Matsuki Y,Nakamura K.Watanabe H,et al.Usefulness of an artificial neural network for differentiating benign from malignant pulmonary nodules on high-resolution CT:evaluation with receiver operating characteristic analysis〔J〕.AJR,2002;178(3):657-63.
7 畢曉君,李 嬌,石麗娜.基于BP神經網絡的肺部CT腫瘤圖像識別研究〔C〕.中國人工智能學會第12屆全國學術年會,2007.
8 王曉華,譚 石,馬大慶.人工神經網絡對孤立性肺結節的診斷價值〔J〕. 中國醫學影像技術,2008;24(7):1114-7.
9 趙景波,趙德安,蔣春彬.基于神經網絡的電子鼻肺癌早期診斷系統〔J〕.電子技術應用,2006;32(7):8-10.
10 陸建峰,李士進.基于人工神經網絡方法的肺癌細胞識別與分類研究〔C〕.中國智能自動化學術會議,1998:653-7.
11 龔 平,郭華雄,王文清,等.基于人工神經網絡的肺癌細胞形態學診斷模型的建立及應用〔J〕.中華生物醫學工程雜志,2012;18(1):73-6.
12 王阿明,劉 慧.小波神經網絡模型在肺癌中的應用研究〔J〕.徐州醫學院學報,2007;27(2):78-81.
13 張卓勇,周化嵐,劉思東.雙向聯想記憶神經網絡及其在肺癌患者分類判別中的應用〔J〕.光譜學與光譜分析,2002;22(2):341-4.
14 周怡伶,鄧 婕.RBF神經網絡時間序列模型在肺癌發病率預測的應用研究〔J〕. 科技創新導報,2011;17:8-10.
R734.2
A
1005-9202(2012)23-5364-03;
10.3969/j.issn.1005-9202.2012.23.144
吉林省科學技術廳項目(No.201215170)
鐵 英(1965-),女,教授,主要從事運動醫學與保健研究。
劉 磊(1975-),男,講師,主要從事自然計算方面的研究。
〔2012-01-10收稿 2012-02-12修回〕
(編輯 徐 杰)