999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

人工神經網絡在肺癌風險預測中的研究與應用

2018-01-04 11:35:20陳國旺蔣進李帆王大龍
計算機時代 2018年11期
關鍵詞:機器學習

陳國旺 蔣進 李帆 王大龍

摘 要: 在現代醫療衛生系統中,主要從預防、診斷、治療三個方面對疾病進行處理。尤其對于癌癥這類疾病,早期預防的效果遠大于治療。隨著算法研究的深入與技術領域的拓展,機器學習在預測領域卓有成效。文章旨在以一種科學的方法,實現對肺癌患病風險的預測。以肺癌為例,利用已有的醫療數據,設計合適的預測算法并用實驗加以驗證。最終的結果顯示了基于神經網絡算法預測患癌風險的可行性。

關鍵詞: 癌癥預測; 機器學習; 人工神經網絡; 標準化處理

中圖分類號:TP391 文獻標志碼:A 文章編號:1006-8228(2018)11-56-04

Abstract: In the modern medical and health system, the disease is treated mainly from three aspects of prevention, diagnosis and treatment. Early prevention is more effective than treatment especially for diseases such as cancer. With the deepening of algorithm research and the expansion of technology, machine learning has been effective in the field of prediction. This article is aimed at succeeding in predicting the risk of lung cancer by means of a scientific method. It takes lung cancer as an example, uses existing medical data, designs appropriate prediction algorithms and demonstrate it with experiments. The final result reflects the feasibility of predicting cancer risk based on neural network algorithms.

Key words: cancer prediction; machine learning; artificial neural networks; standardized processing

0 引言

肺癌是發病率最高,死亡率增速最快的惡性腫瘤之一,對人類身體健康構成了極大的威脅。醫學類研究表明:肺癌的發病與種族、家屬史、吸煙情況等因素有很大關聯。再者,肺癌患者痊愈的幾率很低,這表明人們對于肺癌這一惡性疾病,應該持有預防大于救治的態度。提及預防,人們亟需一種簡單方便、科學精準的工具來預測患癌風險,進一步自身調整,達到預防的效果。近年來APP的普及,加上機器學習在輔助預測中的顯著效果,使筆者聯想到將機器學習應用于肺癌的風險預測中,通過建模并制作成相應的軟件,投入民用。

經過研究,筆者采用人工神經網絡。人工神經網絡本質就是模擬人類的思維[1],具有自學習、自操作、自應用的表現形式[2]。信息的分布式存儲和并行處理是它最主要的特點[3]。其中,按照科學正確的原則進行學習是核心關鍵點,也是人工神經網絡的工作前提。

1 人工神經網絡算法數據模型簡介

人工神經網絡是一種模仿動物神經網絡行為特征,分布式信息處理的一種數學模型。這種算法憑借復雜的系統結構對內部節點之間的權重進行修正,從而達到處理信息的目的[4]。人工神經網絡可以通過預先提供的一批正確的數據,分析其潛在規律。此過程稱為“訓練”[5]。反向傳播(Back Propagation,簡稱BP)算法提出后,其非線性映射和泛化能力解決了許多非線性問題,比如在臨床輔助決策和波形分析等方向都取得了較好的成效[6]。

BP神經網絡共分為三層:輸入層、隱藏層、輸出層。下圖1展示具有兩層隱藏層的神經網絡。感知器是神經網絡的基本組成單位。它是由權值w,偏置b以及傳遞函數g(x)組成。其中b為偏置,bi為上一個感知器“釋放”的輸入信號,x為經過線性處理獲得值,f(x)為經過傳遞函數處理后的最終值。即:

其中傳遞函數是對所求出來的值進行一個非線性變換。例如、等。通俗來講,傳遞函數就是將上一層傳入的信號進行選擇性的通過。若不添加傳遞函數,對于多隱藏層的學習跟只有一層的隱藏函數效果是一樣的。例如:

因此每次處理都必須要經過傳遞函數。

一個感知器的值是由前一層所有感知器加權求和后,經過傳遞函數的處理而得出的[7]。通過層層處理后,從而獲得輸出值。緊接著進行反向傳播,修正權值。多次迭代后,當訓練集訓練完畢后,算法會更新學習次數,當學習次數在閾值內,訓練過程便全部完成[8]。此時從輸入層輸入信號,經過層層計算,便可得出最終的預測結果。

2 神經網絡在肺癌風險預測中的應用與研究

2.1 標準化處理

搜集到的數據由于量綱不同,所以需要將數據做標準化處理。

屬性類型可分為效益型、成本型、區間型等。其中,效益型為屬性值越大越好的屬性,區間型屬性為在某一區間內越好的屬性[13]。每種屬性標準化處理的方式不同。

將數據代入到公式中,即可完成。

2.2 算法推導

設輸入層為a1,隱藏層為b2、b3…bn-1,輸出層為cn。設輸入層每個感知器的值為a1n(n=1,2,3…),其余各層類似。設權重為第k層第a個感知單元與第k+1層第b個感知單元間的權重。偏置為b',由感知器原理可知,偏置可作為上一層的一個權重為1,信號為b'的感知器,故以下推導不額外考慮偏置b'。

BP神經網絡有前置輸出、反向傳播、更新權值以及其他參數[9],簡要步驟如下。

步驟1 設輸入層的各個單元接收的輸入信號為x1、x2、x3…xn,并對w進行隨機賦值。按上述過程計算,最后在輸出層可得出一組計算結果。

步驟2 求出預測值以及真實值之間的誤差并反向進行計算,求出最終誤差與初始權值之間的關系。

步驟3 使用隨機梯度下降算法(Stochastic gradient descent,SGD)求誤差E最小值。

步驟4 通過迭代并更新w,訓練完成[10],獲得預測結果。

針對步驟1,輸入值經過權值計算到達隱藏層b2的第一個神經單元b21的值為,經過傳遞函數g(x)可得b21的輸入信號值為。

針對步驟2,設標簽為,可以求單個輸出層誤差Ei為,總誤差為。將隱藏層的單元代入:,可得總誤差E為:

2.3 實驗過程以及結果

肺癌高危人群為長期吸煙的中老年人群、慢性肺部疾病患者以及家族遺傳者等[11]。筆者進一步研究得出導致肺癌的因素主要包括出生年月、BMI、呼吸系統狀況、是否患有其他癌癥、近親患癌、慢性肺部疾病、是否吸煙、日均吸煙量、吸煙年數、二手煙狀況、油煙狀況等[12]。由于篇幅所限,我們僅列出部分數據。

設出生年份為Y1,BMI為Y2,慢性肺部疾病為Y3,日均吸煙數量為Y4,吸煙年數為Y5,患癌真實值為P1,預測值為P2。其中BMI是用于衡量人體胖瘦程度以及健康狀況的國際標準。設身高為h,體重為w,則BMI指數a為:

由于量綱不同,需對所有搜索數據進行標準化處理。根據查詢相關資料可得,BMI在[18.5,23.9]處于正常狀態。年齡越小,即出生年份數值越大,患有癌癥的可能性越小,因此出生年份屬于效益型,其余屬性同理分析。將各屬性做如上標準化處理,現展示部分數據。

將數據代入算法中,得出最終預測結果。將數據源部分用于訓練,部分用于預測。通過部分數據集的訓練之后,可得預測結果。

由表中數據可得,大多數預測值與真實值相差較小,說明該算法具有較大潛力。但少數預測數據與真實值相差較大,說明在該算法中,如何選擇傳遞函數,選擇有效的訓練數據及次數等還有待研究。

2.4 實驗在APP中的應用

將神經網絡算法與APP進行結合,便成為可以為用戶服務的一個工具。用戶安裝后,回復有大量科學研究作為基礎的問題,通過輸入個人數據,便可得出預測結果。APP接受用戶提交的數據后,通過計算,可得最終的預測結果。

圖4、圖5為制作完成的APP界面。

3 結束語

本文將機器學習領域中的經典算法應用于肺癌發病風險的預測。在提取各種特征的基礎上,搜集了大量數據并將數據進行標準化處理,選取部分數據作為訓練集,其余數據用于預測。通過對預測結果的分析,可以得出兩個重要結論:一推導出高幾率患病人群,比如長期吸煙的中老年人群、慢性肺部疾病患者等,確定的影響因素包括吸煙情況、身高體重指數、慢性疾病與肺病史、油煙暴露狀況等。二是該算法的預測準確率大致符合真實情況,可以作為神經網絡在肺癌預測中的成功應用。但是該算法預測中,也存在部分記錄預測值與真實值有一定誤差的問題,可見該算法在數據集、傳遞函數選取等細節方面還有待進一步研究,準確性仍有提升的空間。

現實使用中,用戶只需下載APP應用,輸入個人數據,即可得知自身患肺癌風險,發病誘因等,非常方便,實用性強,免去實體醫院的檢查流程,省時省力,還節省可觀的財產支出。正因為其簡便易用,平民大眾,迎合“互聯網+”浪潮,可以預見其會在市場、社會中的廣泛應用,可以說前景十分廣闊。

雖然當前的算法仍存在一些問題,應用系統還不夠完善,但是筆者相信經過算法的再研究、再改進,以及日后神經網絡算法的必然優化與發展,利用神經網絡精準預測肺癌風險將會有很大的概率實現和普及,并且在其他領域,神經網絡也將“大放光彩”。

參考文獻(References):

[1] Mitchell T. Machine learning[M]. Beijing: China MachinePress,2003.

[2] Ganesan K, Acharya U R,Chua C K,et al.Computer-aided breast cancer detection using mammograms:A review[J].IEEE Reviews in Biomdical Engineering,2013.6(77):98

[3] Orozco H M,Villegas O V,Maynez L O,et al. Lung noduleclassification in frequency domain using support vector machines[C]//Proc of 2012 llth International Conference on Information Science,Signal Processing and their Applications (ISSPA),2012:870-875

[4] Pinheiro F M R,kuo M H.Poster:Applying data miningalgorithms to early detection of liver cancer[C]//Proc of 2012 IEEE 2nd International Conference on Computational Advances in Bio and Medical Sciences (ICCABS),2012:1

[5] Cruz JA, Wishart DS. Applications of Machine Learning in Cancer Prediction and Prognosis[J]. Cancer Informatics,2007.2(1):59-77

[6] Fakoor R, Ladhak F, Nazi A, et al. Using Deep Learning to Enhance Cancer Diagnosis and Classification[C].Atlanta:The International Conference on Machine Learning,2013.

[7] Mitchell T M. Machine learning [M]. Burr Ridge, IL:MC Graw Hill,1977.

[8] Graves A, Mohamed A, Hinton CE. Speech recognition with deep recurrent neural networks [C]. IEEE International Conference on Acoustics, Speech and Signal Processing,2013:6645-6649

[9] Krizhevsky A, Sutskever I, Hinton GE. ImageNet classification with deep convolutional neural networks[C]. Advances in Neural Information Processing Systems,2012:1097-1105

[10] 倪然.人工神經網絡聯合腫瘤標志對肺癌和大腸癌的預警 [D].鄭州大學,2009.

[11]馬莉,高曉虹,王猛,李曉楓.肺癌影響因素病例對照研究[J].中國公共衛生,2012.28(1):90-91

[12] Crippa A, Salvatore C, Perego P, et al.Use of machine learning to identity children with autism and their motor abnormalities [J]. J Autism Dev Disord,2015.45:2146-2156

猜你喜歡
機器學習
基于詞典與機器學習的中文微博情感分析
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
下一代廣播電視網中“人工智能”的應用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機的金融數據分析研究
基于Spark的大數據計算模型
基于樸素貝葉斯算法的垃圾短信智能識別系統
基于圖的半監督學習方法綜述
機器學習理論在高中自主學習中的應用
極限學習機在圖像分割中的應用
主站蜘蛛池模板: 99久久国产精品无码| 久久精品女人天堂aaa| 青草免费在线观看| 免费精品一区二区h| 丰满人妻一区二区三区视频| 国产尤物视频网址导航| 超级碰免费视频91| 91综合色区亚洲熟妇p| 91精品啪在线观看国产60岁 | 亚洲国产无码有码| 免费看av在线网站网址| 91国语视频| 亚洲人成亚洲精品| 久久久久人妻一区精品色奶水| 手机在线看片不卡中文字幕| 欧美一级特黄aaaaaa在线看片| 国模粉嫩小泬视频在线观看| 国产麻豆精品久久一二三| 午夜福利亚洲精品| 国产丝袜一区二区三区视频免下载| 手机精品福利在线观看| 欧美成人影院亚洲综合图| 无码AV日韩一二三区| 成人字幕网视频在线观看| 午夜综合网| 亚洲午夜天堂| 91成人在线免费视频| 国产小视频a在线观看| 久久国产精品夜色| 国内毛片视频| 亚洲精品国产首次亮相| 免费精品一区二区h| 精品亚洲欧美中文字幕在线看| 国产91九色在线播放| 国产欧美一区二区三区视频在线观看| 制服丝袜国产精品| 国产精品污视频| 亚洲av无码久久无遮挡| 国产午夜无码片在线观看网站 | 国产成人精品一区二区| 欧美成人午夜在线全部免费| 免费不卡在线观看av| 97se亚洲综合| 国产欧美日韩另类精彩视频| 久久久噜噜噜| 欧美精品v欧洲精品| 亚洲色图欧美| 成人在线天堂| 亚洲狼网站狼狼鲁亚洲下载| 国产香蕉在线视频| 国产小视频免费| 色天天综合| 免费在线观看av| 91视频首页| 91色爱欧美精品www| a在线观看免费| 色AV色 综合网站| 中文字幕资源站| 激情午夜婷婷| 亚洲成人77777| 无码人妻免费| 国产成人免费视频精品一区二区| 91原创视频在线| 99无码中文字幕视频| 这里只有精品国产| 日韩第一页在线| 亚洲欧美另类色图| 激情综合图区| 亚洲妓女综合网995久久 | 播五月综合| 69综合网| 囯产av无码片毛片一级| 乱人伦99久久| 性做久久久久久久免费看| 亚洲第一av网站| 国产女人18毛片水真多1| 69综合网| 国产69囗曝护士吞精在线视频| 精品国产aⅴ一区二区三区| 日韩欧美在线观看| 538国产在线| 伊在人亚洲香蕉精品播放|