吳冠朋 王帥 黃偉 劉同海 尹勇 劉毅慧
摘 要 研究針對原發性肝癌(primary liver carcinoma, PLC)患者精確放療后乙型肝炎病毒(Hepatitis B virus, HBV)再激活分類預測模型,采用logistic提取關鍵特征子集,發現外放邊界、腫瘤分期TNM和HBV DNA水平是HBV再激活的危險因素(P<0.05)。建立BP神經網絡分類預測模型,對原發性肝癌初始數據集和關鍵特征子集進行HBV再激活分類預測。實驗結果表明,BP網絡對HBV再激活有著良好的分類預測性能,分類預測準確性從73.33%提高到78.89%,關鍵特征子集分類預測準確性高于初始數據集分類預測準確性,表明了特征提取后的關鍵特征子集具有優秀的類別區分性。
關鍵詞 PLC ;HBV再激活;特征提取;BP神經網絡
中圖分類號 TP391 文獻標識碼 A
Classification prognosis model of hepatitis B virus reactivation after radiotherapy in patients with primary liver carcinoma based on BP neural network
Wu Guanpeng1, Wang shuai1, Liu Tonghai2, Yin Yong2, Huang Wei2, Liu Yi hui1
(1 School of Information, Qilu University of Technology, Jinan 250353,China;2 Department of Radiation Oncology, Shandong Cancer Hospital, Jinan 250117, China)
Abstract This study aims at the classification prognosis model of hepatitis B virus (HBV) reactivation after precise radiotherapy(RT) in patients with primary liver carcinoma. Using logistic regression methods to extract the key feature subset. Finding the outer margin of RT, TNM of tumor stage and HBV DNA level were the risk factors(P<0.05) of HBV reactivation. Build classification prognosis model of BP neural network, classification prognosis of HBV reactivation for original data subset and the key feature subset in patients with primary liver carcinoma. Experimental results show that BP neural network has a good classification prognosis performance of HBV reactivation, the classification prognosis accuracy increased from 73.33% to 78.89%.The classification prognosis accuracy of the key feature subset is superior to original data subset, and the key feature subset has excellent classification of distinction after feature extraction.
Keywords Primary liver carcinoma; HBV reactivation; feature extraction; BP neural network
0 引 言
原發性肝癌(primary liver carcinoma, PLC)患者精確放療后可以致使感染乙型肝炎病毒(Hepatitis B virus, HBV)發生再激活,HBV[1]再激活可達20-25%左右,這類患者常伴有預后不良現象,死亡率達25%。找出HBV再激活的危險因素和建立HBV再激活分類預測模型對感染HBV的原發性肝癌患者的抗腫瘤治療具有重要臨床意義。韓國學者Kim等[2]在2007年對32例經三維適形放療(three-dimensional conformal radiotherapy, 3D-CRT)的原發性肝癌患者進行研究,推斷HBV DNA水平可
能是引起HBV再激活的危險因素。無獨有偶,吳曉安等[3-4]也相繼推斷HBV再激活患者死亡原因與HBV DNA復制活動密切相關。黃偉等[5]則于2013年通過對69例精確放療的原發性肝癌患者采用logistic法回歸分析各項指標對HBV再激活的影響,發現基線血清HBV DNA水平是HBV再激活的獨立危險因素。該研究組隨后將精確放療劑量學參數引入研究,又相應發現一些劑量學參數也是引起HBV再激活的高危因素[6]。綜上所述可知,原發性肝癌患者精確放療后致HBV再激活的危險因素有待進一步研究,相關預測模型也隨之步入建立預期階段。
迄至目前,特征提取已廣泛應用于生物醫學領域的復雜數據分析,諸如即已應用在質譜數據分析方面[7-8]。與此同時,BP神經網絡也已在各大領域范圍獲得了全面推廣應用,例如現已普遍應用在膠囊異物缺陷識別[9],紙幣面向識別 [10],車牌字符識別[11],肝臟31P磁共振波譜分析[12,13]和紅細胞濃度無創檢測[14]等多個熱點研究方向中。基于此,本文將使用logistic回歸分析檢測分析得出外放邊界、腫瘤分期TNM、HBV DNA 水平是HBV再激活的危險因素(P<0.05),同時建立BP神經網絡分類預測模型,進而分別對初始數據集和經特征提取后的關鍵特征子集進行HBV再激活分類準確性預測。
結束語
本文針對原發性肝癌精確放療后致HBV再激活的問題,對于不同數據類型的臨床特征采用不同的特征提取方法,將得到顯著性因素再納入logistic回歸分析中,發現HBV DNA 水平、外放邊界和腫瘤分期TNM是HBV再激活的危險因素,即具有類別區分性的特征子集。然后對原發性肝癌患者初始數據集以及特征子集建立BP神經網絡分類預測模型,分類預測結果表明:
(1)影響原發性肝癌患者發生HBV再激活的危險因素很多,
臨床數據量大,傳統方法難以構建準確的預測模型,不能找出HBV再激活相關的關鍵信息。而BP神經網絡有著較強的模式識別能力,特別是特征提取后的關鍵特征子集在BP神經網絡分類預測模型中的分類性能更優,有效降低了數據維度,并且提高了HBV再激活的分類預測準確性。
(2)BP神經網絡在HBV再激活分類預測中具有較高的應用價值,可對已感染HBV的原發性肝癌患者采取抗病毒以及肝保護等治療方法,以提高原發性肝癌患者的生活質量,延長生存周期。今后將繼續研究其他智能算法模型在HBV再激活研究的應用,并致力于提高HBV再激活分類預測性能。
參 考 文 獻
[1] YEO W, LAM KC, ZEE B, et al. Hepatitis B reactivation in patients with hepatocellular carcinoma undergoing systemic chemotherapy[J]. Annals of Oncology, 2004, 15(7): 1661-1666.
[2] KIM JH, PARK J W, KIM TH, et al. Hepatitis B virus reactivation after three-dimensional conformal radiotherapy in patients with hepatitis B virus-related hepatocellular carcinoma[J]. International Journal of Radiation Oncology Biology Physics, 2007, 69(3): 813–819.
[3] 吳曉安,章志勇,嚴志彪,等. 原發性肝癌三維適形放療的臨床研究[J]. 臨床腫瘤學雜志, 2008, 13 (6): 538-540.
[4] 吳曉安,章志勇,洪節約,等. 三維適形放療治療86例肝癌的臨床療效分析[J]. 實用癌癥雜志, 2007, 22(4): 373-375.
[5] 黃偉,盧彥達,張煒,等. 原發性肝癌精確放療致乙型肝炎病毒再激活分析[J]. 中華放射腫瘤學雜志, 2013, 22(3): 193-197.
[6] HUANG W, ZHANG W, FAN M, et al. Risk factors for hepatitis B virus reactivation after conformal radiotherapy in patients with hepatocellular carcinoma. Cancer science, 2014, 105(6): 697-703.
[7] Liu Y H. Feature extraction and dimensionality reduction for mass spectrometry data [J]. Computers in Biology and Medicine, 2009, 39(9): 818-823.
[8] 李義峰,劉毅慧. 基于遺傳算法的蛋白質質譜數據特征選擇[J]. 計算機工程, 2009, 35(19): 192-197.
[9] 陳毅, 劉曉玉, 劉斌,等. 基于BP神經網絡的膠囊異物缺陷識別[J]. 計算機應用與軟件, 2015(3): 196-199.
[10] 劉艷萍, 杜秋晨, 張進東. 基于BP神經網絡的紙幣面向識別方法[J]. 計算機應用與軟件, 2015, 32(11): 176-179.
[11] 莫林,凌文彪,張福元,孫學彬. 基于評分模型的車牌字符識別方法[J]. 計算機應用與軟件, 2015, 05: 203-206.
[12] 王韶卿,劉毅慧,王麗娟,等.基于反向傳輸神經網絡的肝臟31P磁共振波譜分析[J]. 中國醫學影像技術, 2009, 25(10): 1875-1878.
[13] 王韶卿,劉毅慧,付婷婷,等. 肝癌31磷磁共振波譜數據的分類[J]. 山東大學(醫學報), 2009, 47(6): 42-47.
[14] 張寶菊,雷晴,李剛,等. 基于BP神經網絡的人體血液中紅細胞濃度無創檢測[J].光譜學與光譜分析,2012,32(9):2508-2511.
[15] 申希平,丁建生,李娟生,等. 在SPSS中利用均數和標準差做兩獨立樣本 檢驗[J]. 現代預防醫學, 2007, 34(21): 4066-4067,4069.
[16] 胡文敏,何婷婷,張勇. 基于卡方檢驗的漢語術語抽取[J]. 計算機應用, 2007, 27(12): 3019-3020+3025.
[17] 謝娟英,高紅超. 基于統計相關性與K-means的區分基因子集選擇算法[J]. 軟件學報, 2014(9): 2050-2075.
[18] 米根鎖,王彥快,馬學霞. BP神經網絡在軌道電路分路不良預警中的應用[J]. 計算機工程與科學, 2013, 35(2): 159-163.
[19] 陳飛彥,田宇馳,胡亮. 物聯網中基于KNN和BP神經網絡預測模型的研究[J]. 計算機應用與軟件, 2015, 06: 127-129+202.
[20] 邱龍金,賀昌政. 神經網絡穩定性的交叉驗證模型[J]. 計算機工程與應用, 2010, 46(34): 43-45.