劉怡文,楊 洪,張 灝,周福有,楊海軍,孔金玉,孫 蔚,原 翔,高社干
食管癌的發病率及死亡率極高,全世界每年新發的食管癌患者數量約50萬例[1],一半以上發生在我國。鱗狀細胞癌(esophageal squamous cell carcinoma,ESCC)是食管癌中最常見的組織學類型,約占食管癌總數的95%以上。ESCC預后較差,雖然傳統的手術、放化療以及靶向治療、免疫治療等手段在ESCC綜合治療中不斷更新應用,但中晚期患者5 a生存率仍低于20%[2]。半個世紀以來,眾多從事ESCC防治的工作者銳意創新,在ESCC的流行病學、早期診斷、綜合治療及預防等方面取得了舉世矚目的成績[3-5],但是ESCC的防治工作異常艱難,總體還未達到令人滿意的程度。本研究針對ESCC患者的臨床信息,采用BP(Back-Propagation)神經網絡建立了患者的預后預測模型,為ESCC的臨床治療提供一種輔助手段。現報道如下。
1.1 一般資料
選擇2011年1月至2014年12月安陽市腫瘤醫院1 091例ESCC患者的臨床病理資料及預后隨訪信息為研究對象。納入標準:①術后病理診斷明確為ESCC;②患者術前均未接受放射治療、化學治療和免疫治療;③治療性ESCC切除術后;④病例資料信息全面;⑤術后隨訪時間為60個月(5 a),生存時間為入院時間至最后一次隨訪日期或死亡,刪失數據為隨訪至60個月仍存活的患者,未刪失數據為由ESCC導致的死亡患者。排除標準:①術后病理診斷非ESCC;②患者術前接受過放射治療、化學治療或免疫治療;③病例資料不完整。本研究經安陽市腫瘤醫院倫理委員會審核批準,并獲得患者書面知情同意入組參與研究。
1.2 BP神經網絡
BP神經網絡也叫反向傳播神經網絡,是神經網絡的一種典型形式,在實際應用中非常廣泛,并且能夠達到較好的應用效果。BP神經網絡的結構特點是從輸入信息到輸出信息具有前向多層網絡,其中輸入信息聯接的是輸入層,輸出信息聯接的是輸出層,中間的網絡層叫隱含層。BP神經網絡的學習過程中包含輸入信息的前向傳播以及輸出與輸入信息之間誤差的反向傳播兩個過程。前向傳播時,輸入信息通過輸入層進入網絡,經過隱含層的處理后到達輸出層,輸出層傳遞了輸出信息。當輸出信息與輸入信息進行比較時,會發現存在一定的誤差,為了消除該誤差,使輸出信息與輸入信息保持一致,則需要轉向誤差反向傳播階段。誤差反向傳播時是將誤差信息通過隱含層從輸出一側逐層傳遞到輸入一側,在這一過程中不斷修改隱含層各個單元的權值屬性,從而減小誤差。這一學習過程不斷在網絡中發生,最終達到誤差信息在允許閾值之內,輸出信息與輸入信息接近,或者學習過程的次數達到設定的上限。
1.2.1 神經元模型
從生物學角度出發,神經元細胞的結構包括樹突、突觸、細胞體和軸突。樹突是一個神經元細胞的輸入通道,通過各個樹突的分支與其他神經元細胞的相連,能夠接收其他神經元細胞傳遞的電信號,在接收到電信號之后傳導給細胞體。細胞體是處理電信號的關鍵,能夠通過其他神經元傳遞的信號量大小以及突觸的抑制或者加強來判斷是否激活。當神經細胞判定為激活時則會產生電信號,沿著軸突通道到達突觸,從而傳遞給其他神經元。神經元模型就是為了模擬上述過程,典型的神經元模型見圖1。

圖1 神經元拓撲結構
對于第i個神經元,x1,x2,…,xj是神經元的輸入信息,輸入信息一般是系統的狀態量,能夠描述系統的具體情況,w1,w2,…,wj是各輸入信息到神經元控制器通道的權重,權重能夠隨著系統狀態的改變而進行調節。各輸入信號到神經元控制器的組合方式有多種,一般神經網絡算法中選取線性疊加的方式,即取各輸入信號的加權求和,可得Netin神經元凈輸入:
(1)
θi是神經元控制器能否產生輸出信號的閾值,表示只有當神經元的凈輸入Netin大于θi時,神經元的輸出信號才會激活。除了比較Netin與θi,還需要通過激活函數最終產生輸出信號。
1.2.2 激活函數
常用的激活函數有:
(1)線性函數
f(x)=k·x+c
(2)
(2)斜坡函數

(3)
(3)閾值函數

(4)
(4)S型函數,即Sigmoid函數
(5)
(6)
(5)雙極S型函數
(7)
(8)
S型函數和雙極S型函數示意圖見圖2。

圖2 S型函數和雙極S型函數示意圖
神經網絡算法中一般采用S型函數,從圖2中可以發現,S型函數的自變量范圍是正負無窮大,函數值的范圍是0到1。對于S型函數,可以得到輸出信號的表達式為:
yi=f(Netin-θi)
(9)
1.2.3 BP神經網絡結構
本文采用簡單的三層神經網絡,如圖3所示。其中,最下面的是輸入層,中間包含一層的隱藏層,最上面是輸出層。輸入層的輸入信息用x1,x2,...,xd表示,代表輸入層有d個神經元,隱含層的信息用b1,b2,...,bq表示,代表隱藏層包含q個神經元,輸出層信息用y1,y2,...,yl,代表輸出層有l個神經元。從輸入層到輸出層之間的連接用vih表示,從隱藏層到輸出層之間的連接用whj表示。隱藏層神經元閾值用γh表示,輸出層神經元閾值用θj表示。

圖3 BP神經網絡模型
其中,βj中的bh=f(αh-θh)。隱藏層和輸出層的激活函數都采用S型函數。

那么這次預測結果的誤差可以用最小二乘法表示為:
(10)
(11)
權值修正步驟如下:
首先輸出層到隱藏層:
(12)
經過隱藏層的激活函數:
bh=f(αh-θh)
(13)
隱藏層到輸出層:
(14)
經過輸出層的激活函數:
(15)
誤差:
(16)

形體訓練課以壓腿、踢腿、開肩等基本的身體訓練為基礎,培養良好的站姿、走姿、坐姿及蹲姿,以提高學生形體外在表現力,長期堅持,有利于學生養成正確的身體姿勢,塑造健美的形態,使學生獲得服務旅游業的身體素質。人際交往禮儀知識可以讓學生了解與客人相處之道,同時,形體訓練課創造自由的主客情景,讓學生角色扮演,學會與客人交流溝通,培養其主動積極、善解人意的待客意識。理論與實踐的結合,能有效地提高學生的服務心理素質。
(17)

(18)
由于Sigmod函數的性質如下:
(19)
f′(x)=f(x)(1-f(x))
(20)
所以可以得到:
f′(βj-θj)=f(βj-θj)(1-f(βj-θj))

(21)
綜上所述:
(22)
同理,可得:
(23)
對于Δvih:
Δvih=-ηehxi
(24)
Δγh=ηeh
(25)
其中:
(26)
之后設定一個迭代終止條件,可以是誤差小于一定值或者達到設定的迭代次數。通過上述設計流程,可以得到性能較好的BP神經網絡模型。
2.1 食管鱗癌患者臨床病理資料一般特征
共納入ESCC患者1 091例,詳細信息見表1。

表1 ESCC患者臨床病理資料一般特征 例(%)
2.2 ESCC患者預后預測模型
將BP神經網絡的理論應用到數據分析上,將ESCC患者生存期樣本信息進行分析,將ESCC患者的各類指標當作輸入變量,生存期作為輸出變量。采用神經網絡的方法獲取生存期的預測模型,為臨床治療提供一定的參考依據。
由于ESCC患者的生存樣本信息中各類指標的單位不一樣,例如年齡信息,吸煙、飲酒的時間信息,浸潤范圍信息,臨床分期以及各類檢查信息等。這樣的指標信息范圍變化太大,給BP神經網絡的訓練帶來嚴重的挑戰,降低了BP神經網絡的訓練效率。大范圍的指標信息相比于小范圍的指標信息會對BP神經網絡產生更大的影響,但是指標信息范圍的大小不代表對ESCC患者生存期影響的大小,直接采用原始指標信息會導致BP神經網絡與實際生存期不符。由于S型激活函數自身的特點,函數值限制在(0,1),即輸出層的信息也在(0,1)。因此,在進行BP神經網絡訓練之前需要對指標信息進行歸一化處理。
歸一化的算法:
(27)
一般在BP神經網絡算法中,將學習的數據集劃分為訓練集、驗證集和測試集。通過訓練集來獲取性能較好的BP神經網絡,然后用驗證集對BP神經網絡進行結構和復雜程度的檢驗,最后通過測試集來驗證BP神經網絡的性能是否滿足要求。此次訓練過程選取ESCC患者信息完善的樣本數1 000例,隨機選取出訓練集、驗證集和測試集。通過訓練,獲得了預測結果較好的BP神經網絡,結果見圖4。

圖4 生存期預測結果對比(R2=0.96632)
ESCC發病率和死亡率高,早期診斷困難,預后極差。因此,建立合理的預后預測模型,尋找有效的預防措施,尤為重要。
人工智能概念誕生于上世紀50年代,由美國學者在達特茅斯會議上形成[6]。之后,人工智能擴展到了更加廣泛的學術領域中[7-8],包括規劃和決策、專家系統、多智能體系統、模糊邏輯和粗糙集、機器學習、知識表達、推薦系統、機器人和感知等方面[9-13]。在過去的10 a中,隨著數據集的不斷豐富、計算機能力的飛速提升,以及云計算、軟件功能的拓展,人工智能取得了重大的突破,基于人工智能的應用也越來越廣泛,作為人工智能其中一個方向的神經網絡也有著重大的進展[14-16]。神經網絡是機器學習的一種形式,能夠將大量的數據信息作為訓練樣本,由神經網絡使用數據信息自動地推斷出其中的規則,以此來形成人工智能模型。
隨著基礎技術的發展,基于神經網絡的人工智能系統的性能和實用價值不斷提高,在醫學領域的應用不斷地豐富[17-21]。從30 a前最初在心臟疾病治療中應用[22-23],到過去10 a里基于神經網絡的醫學圖像識別技術的飛速發展[24-25],神經網絡正在更加精確地輔助醫生的治療。神經網絡可以應用于流行疾病的預測,通過收集和分析流行疾病中的大數據,形成人群之間流行疾病的發展趨勢模型,有助于衛生系統盡早地預測出流行疾病的感染峰值時間和流行趨勢,為衛生系統政策的制訂提供更好的幫助[26]。神經網絡可以應用于疾病的診斷,中山大學與西安電子科技大學的研究小組合作,開發了一種能診斷先天性白內障的人工智能程序CC-Cruiser,利用深度學習神經網絡算法,預測疾病的嚴重程度,并提出治療決策建議[27]。
基于ESCC患者結構化病歷的數據,采用BP神經網絡建立了患者預后的預測模型。通過測試集驗證了該BP神經網絡具有較高的準確度。未來通過進一步完善,可以輔助ESCC的臨床治療。通過BP神經網絡預測模型可以對患者的預后進行評估,可以在臨床治療時進行提前干預,進一步提高患者的生存期。
在研究過程中,遇到的實際問題有3個:①BP神經網絡的學習需要較為明確的數據輸入,但是ESCC患者的病理信息存在著模糊的情況,例如患者的臨床分期或者浸潤深度,不同的醫生按照自身的經驗會有不同的判斷,尤其是在病理信息兩個相鄰階段之間的判斷會存在較大的差異,這樣會對模型的結果帶來很大的影響。②用于學習的樣本數據較少,且病理信息的統計存在結構上的差異,需要花費大量的時間對病理信息進行整理和標準化處理,以滿足BP神經網絡批量學習的要求。③建立的BP神經網絡僅僅是從數據的角度對ESCC患者的預后進行了預測,但是其中的因果性難以很好地解釋,這就限制了BP神經網絡的在醫學領域的應用。
之后的研究可以從上述3個問題出發:①在現有電子病歷的基礎上,建立一個標準化的數據庫,按照標準化的結構錄入患者的臨床信息;②與臨床醫生進行深入的溝通交流,在臨床醫生使用該預測模型后,通過搜集反饋信息來不斷修正預測模型;③通過采集與ESCC發生、發展密切相關的腫瘤標志物的信息,加入到預測模型的輸入信息中,以此來提高預測模型的臨床應用價值。