尹咪咪,張建華,張萍萍
鄭州大學電氣工程學院 鄭州 450001
?
基于BP算法的血液指標聯合檢測在肝癌及肝炎診斷中的應用
尹咪咪,張建華#,張萍萍
鄭州大學電氣工程學院 鄭州 450001
關鍵詞BP算法;血液指標;特異性;肝癌;肝炎
摘要目的:分析8種血清及血常規指標在原發性肝癌和肝炎患者鑒別診斷中的特異性,建立BP診斷模型。方法:采用回顧性研究的方法,收集經病理確診的96例原發性肝癌患者為肝癌組,對應收集同期109例肝炎患者作為肝炎組。分別收集兩組患者的高爾基體蛋白73(GP73)、甲胎蛋白(AFP)、α-L-巖藻糖苷酶(AFU)、谷草轉氨酶(AST)、谷丙轉氨酶(ALT)、白細胞計數(WBC)、紅細胞計數(RBC)和血小板計數(PLT)等8種血清及血常規指標數據。利用ROC曲線分析各指標的敏感度,根據尤登指數計算兩組界限值,然后建立納入不同指標的BP神經網路模型,并計算模型的準確率。結果:GP73、AFP、AFU、AST、ALT、WBC、RBC、PLT 等8個指標的ROC曲線下面積分別為0.996、1.000、0.990、0.806、0.680、0.800、0.419和0.460。分別納入8種指標和去掉RBC、PLT后的6種指標成功建立BP神經網絡診斷模型,其準確率分別為86.0%(39/45)和95.5%(43/45)。結論:GP73、AFP、AFU、AST、ALT、WBC指標在肝癌和肝炎患者的鑒別診斷中具有重要意義,對于肝炎患者的病情進展具有一定的提示意義。
Application of blood indexes combined detection in diagnosis of liver cancer and hepatitis based on BP algorithm
YINMimi,ZHANGJianhua,ZHANGPingping
DepartmentofElectricalEngineering,ZhengzhouUniversity,Zhengzhou450001
Key wordsBP algorithm;blood index;specificity;liver cancer;hepatitis
AbstractAim: To analyze the specificity of eight serum and blood indexes in differential diagnosis of liver cancer and hepatitis,and establish a BP diagnostic model.Methods: A total of 96 primary liver cancer patients confirmed by pathology were enrolled as case group, 109 hepatitis patients were treated as control group. The data of Golgi protein 73(GP73),alpha fetal protein(AFP), alpha-L-fucosidase(AFU), aspartate transaminase(AST), glutamic pyruvic transaminase(ALT), white blood cell count(WBC), red blood cell count(RBC) and blood platelet count(PLT) in two group were collected respectively,and their specificity and sensibility according to the ROC curves were obtained.The BP network models were established with different indexes and the efficiency was evaluated.Results: TheAUCof GP73,AFP,AFU,AST,ALT,WBC,RBC,and PLT were 0.996,1.000,0.990,0.806,0.680,0.800,0.419 and 0.460, respectively, and RBC and PLT were filtrated.The accuracy of the BP network models with all the indexes and the 6 indexes were 86.0%(39/45) and 95.5%(43/45).Conclusion: The indexes GP73,AFP,AFU,AST,ALT and WBC have a relatively higher specificity in differential diagnosis of liver cancer and hepatitis, which may have certain implications in the progression of hepatitis patients.
原發性肝癌(primary liver cancer,PLC)是目前世界范圍內比較常見的消化系統惡性腫瘤,其中約90%的原發性肝癌為肝細胞性肝癌(hepatocellular carcinoma,HCC)[1]。全球每年有大約60萬人死于肝癌,使得肝癌成為第3位與癌癥相關的死亡原因[2]。大量研究資料表明,慢性乙型肝炎病毒(hepatitis B virus,HBV)和丙型肝炎病毒(hepatitis C virus,HCV)感染是導致肝癌的兩個主要原因,超過50%的肝癌由肝炎引起。我國約有1億人為HBV攜帶者,約2 000萬人為慢性乙型肝炎患者,而HCV感染主要流行于歐美國家,一直呈上升趨勢的肝癌發病率與此有很大的關系[3-4]。HBV感染者在后期進展為肝纖維化和肝炎時,有一定的概率惡化為肝癌,從而使治療變棘手。因此,對于肝炎患者的病情進展一定要提前預測和及時控制。已有研究[5]發現,肝炎患者在惡化為肝癌的過程中,其部分血清標記物和血液指標會發生變化。因此,臨床上密切監視肝炎患者的血液狀態對于后期病情的進展具有一定提示意義。作者回顧性分析肝癌患者和肝炎患者常見的8種血清及血常規指標,分別為高爾基體膜蛋白73(Golgi protein,GP73)、甲胎蛋白(alpha fetal protein,AFP)、α-L-巖藻糖苷酶(a-l-fucosidase,AFU)、谷草轉氨酶(aspartate transaminase,AST)、谷丙轉氨酶(alanine aminotransferase,ALT)、白細胞計數(white blood cell count,WBC)、紅細胞計數(red blood cell count,RBC)和血小板計數(blood platelet count,PLT),試圖篩選出對肝炎和肝癌鑒別特異性較高的指標,并建立基于BP神經網絡的診斷模型,以期為臨床工作者提供理論參考和實驗依據。
1對象與方法
1.1研究對象選擇鄭州大學一附院消化內科2013年9月至2015年6月的住院患者。其中肝癌組96例,均為原發性肝癌;男54例,女42例,年齡31~73(42.6±10.3)歲。肝炎組109例,其中83例為乙型肝炎,12例為丙型肝炎,9例為自身免疫性肝炎,5例為膽囊炎;男67例,女32例,年齡26~69(39.4歲±9.8)歲。樣本量的確定是根據已知百分比的隨機抽樣樣本量計算公式[6]計算得出。
1.2血清及血常規指標檢測采集兩組患者的空腹靜脈血樣標本,通過酶聯免疫吸附法(ELISA)測定各組GP73、AFP的表達量;AFU指標采用日立7600全自動生化分析儀和北京利德曼生化試劑公司生產的試劑進行測定。其余指標均是通過貝克曼庫爾特LH 755全自動血液分析儀進行的血常規分析測定。樣本采集時均排除其他炎癥或相關疾病干擾。
1.3統計學處理采用SPSS 19.0軟件對所收集數據進行受試者工作曲線分析(receiver operating characteristic,ROC),并計算曲線下面積(area under curve,AUC)。根據AUC的大小篩選出區分肝癌和肝炎特異性及靈敏度都較高的指標。根據ROC曲線坐標和尤登指數計算特異性較高的指標在兩組之間的界限值。
1.4基于BP算法的數據仿真模型的建立與應用對全部納入研究的8種指標GP73、AFP、AFU、AST、ALT、WBC、RBC、PLT 進行神經網絡訓練,建立基于BP算法的數據仿真模型,計算其準確率;納入篩選后的指標,重新建立神經網絡模型,計算其準確率并與前者比較。具體過程如下:納入指標為模型的輸入變量,添加GROUP變量為輸出變量,其中肝癌組定義為1,肝炎組定義為0。所收集肝癌組96個樣本中,隨機抽取76個樣本用于模型訓練,其余20個樣本用于模型仿真的驗證;肝炎組109個樣本中,84個樣本用于模型訓練,其余25個樣本用于模型驗證。
所建立BP網絡模型為包含一個單隱層的BP網絡模型,已有研究表明單隱層神經網絡可以很好地映射分類問題[7]。所設置輸入層到隱層的轉換函數為“tansig”;隱層到輸出層的轉換函數為“purelin”,所選訓練方法為彈性梯度下降算法“trainrp”、L-M梯度遞減算法trainlm和一步正割算法“trainoss”;輸入層節點為所納入指標變量的個數,輸出節點為輸出向量的個數1。隱層神經元節點數應符合一定的規律,一般可通過試湊進行確定[8]。設置最大訓練次數為1 000;訓練誤差閾值為0.005。程序編寫及仿真基于MATLAB 2012a平臺實現。在進行實際的網絡訓練時,使用不同的參數設置組合會有不同的訓練效果,最終會采用效果最好的設置方式。
2結果
2.1兩組患者血清學指標比較肝癌組和肝炎組的血清和血常規指標的比較見表1。

表1 兩組患者血清學指標比較
2.2ROC曲線分析結果見圖1。GP73、AFP、AFU、AST、ALT、WBC、RBC、PLT的AUC分別為0.996、1.000、0.990、0.806、0.680、0.800、0.419、0.460,95%CI(P)分別為0.991~1.000(<0.001)、1.000~1.000(<0.001)、0.971~1.000(<0.001)、0.747~0.865(0.001)、0.604~0.756(0.001)、0.738~0.862(0.001)、0.335~0.504(0.047)、0.380~0.539(0.318)。GP73、AFP、AFU、AST、ALT、WBC指標的特異性較好,曲線下面積均在0.8以上。RBC和PLT的AUC較小,均小于0.5。

圖1 8種指標的ROC曲線
取約登指數最大時所對應的坐標為兩組之間的界限值。P73、AFP、AFU、AST、ALT、WBC計算結果分別為163.11 μg/L、167.54 μg/L、130.93 U/L、56.40 U/L、48.18 U/L、7.24×109L-1。
2.3BP網絡模型首先納入全部8個指標進行BP神經網絡模型的建立。輸入訓練數據集對模型進行訓練,訓練結束后,輸入驗證數據集對所建立的模型進行仿真,并將模型預測輸出與實際輸出進行比較。結果如圖2所示,空心圓圈表示實際結果,紅色三角符號表示所建立模型的仿真輸出,其準確率為86.0%(39/45)。

圖2 納入全部8個參數時建立模型的準確率
納入篩掉RBC和PLT指標的剩余6個指標GP73、AFP、AFU、AST、ALT、WBC,再次建立BP神經網絡模型。模型仿真驗證結果如圖3所示,結果可見其模型準確率為95.5%(43/45)。

圖3 納入全部6個參數時建立模型的準確率
3討論
肝癌是我國高發的危害極大的惡性腫瘤,其發病原因主要有HBV和HCV感染、肝硬化、黃曲霉素、乙醇和其他環境原因等。肝炎患者病情得不到控制后,有可能轉為肝癌。血液指標的檢測為肝癌及肝炎的檢測提供了一種較好的診斷方式,在臨床上應用較多。該文通過對比研究肝癌組和肝炎組的臨床數據資料,篩選出了對于鑒別肝癌和肝炎患者特異性較高的指標,并建立了基于BP算法的診斷仿真模型,然后根據ROC曲線,計算出區別肝癌和肝炎患者的界限值,為今后臨床上對于肝炎患者的觀察和化驗指標提供理論依據。
已有大量研究[9-11]表明,AFP和GP73是對肝癌診斷較為敏感的血清標記物。GP73作為一種新的臨床肝癌診斷標記物,在肝癌患者中呈高表達狀態,在正常肝組織中幾乎不表達,但HBV、HCV的感染和肝炎等疾病的發生會導致GP73表達的顯著上升[12]。AFP也是診斷肝癌的首選血清標準之一,在肝癌患者中的表達高于正常肝炎患者數倍[13]。Liu等[14]發現AFP在慢性肝炎和肝硬化患者中的表達水平也會隨著病情的進展而升高。AFU是一種廣泛存在于肝、胰腺、腎纖維細胞等溶酶體內的酸性水解酶,以肝、腎等組織中活性最高。當肝細胞癌變時,酶合成增加并釋放入血液,使血清中AFU升高。另外,ALT和AST是公認的反映肝細胞受損的指標,可用于肝硬化、肝纖維化、肝癌的檢測[15]。WBC是一項血常規指標,一般在人體出現炎癥、感染、惡性腫瘤或中毒等免疫反應時會升高。因此可以看出,肝癌和肝炎患者的上述指標都處于非正常范圍,且肝癌患者組理論上會高于肝炎患者。這可能說明,肝癌患者體內的免疫反應要較肝炎患者強烈,其肝細胞的損害程度也要更嚴重一些,肝癌的發生是由于肝炎一步步的惡化而來的。現今尚無大量文獻報道二者之間在血液指標上明確的診斷界限值。該研究結果顯示,肝癌組和肝炎組之間的 GP73、ATP、ATU、ALT、AST和WBC差異具有統計學意義。且根據ROC曲線分析可得6個指標的兩組之間界限值。臨床上GP73的肝癌診斷界限值為150 μg/L,而AFP的正常范圍一般視為0~20 μg/L,AFU 0~40 U/L,AST 13~35 U/L,ALT 0~40 U/L。當這些指標處于正常范圍之外和界限值之間時,可提示為肝炎患者;高于該界限值,提示為肝癌患者。因此,當肝炎患者的指標持續升高且超過界限值時,要警惕是惡化為肝癌的信號,需及早采取控制措施。
目前,BP神經網絡是研究較為成熟的人工神經網絡模型之一,它被廣泛應用于信號處理和模式識別等學科的理論研究和實踐應用中[16-17]。該研究采用BP算法進行了神經網絡診斷模型的建立和仿真,成功建立了肝癌及肝炎疾病和血液指標之間的數學關系模型,可用于肝癌及肝炎疾病的輔助鑒別診斷。并發現納入GP73、ATP、ATU、ALT、AST和WBC這6種特異性較好的指標時,建立模型的診斷準確率要高于納入全部指標。BP神經網絡是為數據分析工作者中常用的數據建模方法,但其過程由于所設置參數的不同、所收集樣本數據的質量等原因存在一定主觀性,因此,所建立的模型只是為疾病診斷結果提供參考,不能替代醫務工作者的主觀作用。在后期的研究中,隨著樣本量的增多和研究方法的優化,結果的精確度會得到進一步提高。
參考文獻
[1]中華人民共和國衛生部.原發性肝癌診療規范(2011年版)[J].臨床肝膽病雜志,2011,27(11):1141
[2]YANG JD,ROBERTS LR.Hepatocellular carcinoma:a global view[J].Nat Rev Gastroenterol Hepatol,2010,7(8):448
[3]EL-SERAG HB,DAVILA JA,PETERSEN NJ,et al.The continuing increase in the incidence of hepatocellular carcinoma in the United States: an update[J].Ann Intern Med,2003,139(10):817
[4]CHEN CF,LEE WC,YANG HI,et al.Changes in serum levels of HBV DNA and alanine aminotransferase determine risk for hepatocellular carcinoma[J].Gastroenterology,2011,141(4):1240
[5]薛如意.乙型肝炎病毒感染的肝細胞肝癌患者血液標志物篩選[D].上海:復旦大學,2009.
[6]張國友.關于抽樣調查中樣本容量的確定[J].安徽理工大學學報(社會科學版),2003,5(1):30
[7]曹飛龍,張永全,張衛國.單隱層神經網絡與最佳多項式逼近[J].數學學報,2007,50(2):385
[8]鄭緒枝,雷靖,夏薇.基于快速確定隱層神經元數的BP神經網絡算法[J].計算機科學,2012,39(S1):432
[9]楊曉莉.高爾基體糖蛋白GP73在肝臟疾病中的意義及其生物學功能的研究[D].北京:中國人民解放軍軍事醫學科學院,2014.
[10]CHEN JG,LU WZ,ZHU YR,et al.Retrospective observation of dynamic levels of serum Golgi protein 73 in patients prior to the onset of liver cancer[J].Zhonghua Yu Fang Yi Xue Za Zhi,2013,47(8):731
[11]XU WJ,GUO BL,HAN YG,et al.Diagnostic value of alpha-fetoprotein-L3 and Golgi protein 73 in hepatocellular carcinomas with low AFP levels[J].Tumour Biol,2014,35(12):12069
[12]HU JS,WU DW,LIANG S,et al.GP73, a resident Golgi glycoprotein, is sensibility and specificity for hepatocellular carcinoma of diagnosis in a hepatitis B-endemic Asian population[J].Med Oncol,2010,27(2):339
[13]GIANNINI EG,SAMMITO G,FARINATI F,et al.Determinants of alpha-fetoprotein levels in patients with hepatocellular carcinoma: implications for its clinical use[J].Cancer,2014,120(14):2150
[14]LIU YR,LIN BB,ZENG DW,et al.Alpha-fetoprotein level as a biomarker of liver fibrosis status: a cross-sectional study of 619 consecutive patients with chronic hepatitis B[J].BMC Gastroenterol,2014,14:145
[15]BAK-NAFALSKA K,PIOTROWSKA A,WJCICKI M,et al.Prognostic indices in liver cirrhosis and transplant assessment[J].Pol Merkur Lekarski,2010,28(167):410
[16]LIN WM,HONG CM.A new elman neural network-based control algorithm for adjustable-pitch variable-speed wind-energy conversion systems[J].IEEE Trans Power Electron,2011,26(2):473
[17]GEORGIEVA A,JORDANOV I.Intelligent visual recognition and classification of Cork tiles with neural networks[J].IEEE Trans Neural Netw,2009,20(4):675
中圖分類號R735.7
#通信作者,男,1971年9月生,博士,副教授,研究方向:電氣工程,E-mail:petermailsm@163.com
doi:10.13705/j.issn.1671-6825.2016.02.013
*國家自然科學基金青年基金資助項目813D3150;中國中醫藥行業科研專項基金資助項目201007001