邵華飛,劉劍芳,姚麗波,劉戩,屈東,王鑄
食管癌是我國高發的惡性腫瘤之一,其主要癥狀為吞咽不順、疼痛等,但早期階段癥狀往往不明顯,患者就診時常已處于中晚期,因此預后較差,5年生存率僅15%~25%[1]。淋巴轉移是食管癌最常見的轉移方式,也是關系到食管癌患者預后的主要影響因素,因此正確判斷淋巴結轉移是腫瘤分期的重要組成部分,也是選擇最優治療方案的重要前提。
判別分析是一種分類診斷統計方法,是根據已掌握的一批明確分類的樣本建立判別函數,再將待判樣本的數據代入判別函數中,判別其類型,從而做出診斷。貝葉斯(Bayes)判別準則是根據先驗概率并綜合樣本所具備的信息,尋求一種判別規則使得屬于第K類的樣品,在第K類中取得最大的后驗概率,從而判斷樣品的分類。這種方法在自然科學及國民經濟等許多領域應用甚廣,近年來也被一些學者應用于疾病診斷,尤其是中醫辨證分析中,但這種分類診斷方法在影像診斷中應用很少。
將本院2011年7月-2013年6月期間收治的208例有完整臨床資料、并經根治性切除手術病理證實的胸段食管癌患者納入研究。所有患者術前1周均行螺旋CT增強掃描,患者取仰臥位,掃描范圍自下頸部或鎖骨上水平至上腹部。掃描參數:120kV,80~150mAs,64i×0.625mm,螺距1.375,層厚5mm,重建層厚1.0mm,層間距0.8mm;經肘靜脈快速注射非離子型對比劑60~100mL,注射流率2.0~3.0mL,注藥后延遲30~35s開始掃描。
將掃描的原始數據進行圖像后處理,采用多平面重組(multi-planar reformation,MPR),隨后由兩位影像科醫師通過Carestream PACS Diagnostic Profile 5.3觀察分析圖像,測量并記錄淋巴結的長徑、短徑、強化程度(淋巴結與同層肌肉CT值之比),觀察淋巴結有無中央低密度、邊緣模糊、是否成簇出現等CT征象,由一位高年資醫師進行質控。
在208例患者資料中隨機抽選166例(80%)作為實驗組即訓練樣本,用以建立方程,其余42例(20%)作為檢驗組即驗證樣本,用以檢驗方程。
使用SPSS 17.0統計分析軟件進行Bayes逐步判別分析,建議診斷模型,并用自身檢驗法、交叉驗證法以及42例患者資料對其進行考核。
本組208例食管癌患者中共有1524枚淋巴結,其中轉移淋巴結270枚。實驗組中共1217枚淋巴結,轉移淋巴結214枚;檢驗組中307枚,轉移淋巴結56枚,患者的其它觀察指標見表1。

表1 患者資料描述
將以上各項數據進行逐步判別分析(分類變量賦值化:0為特征陰性,1為特征陽性),篩選出淋巴結最大短徑、最大長徑、橫縱比、最大截面積、有無中央低密度、有無邊緣模糊、是否成簇分布這7項變量納入方程,先驗概率因未獲得相關歷史資料而取等概率[2-3]。計算后獲得診斷方程的函數系數,并以此建立Bayes判別函數:非轉移組為Y0=-7.499X1+7.957X2+167.761X3-0.087X4+0.459X5-5.528X6-0.711X7-66.080;轉移組為Y1=-6.697X1+8.231X2+181.686X3-0.106X4+2.219X5-3.331X6-0.124X7-83.183。其中,X1為淋巴結最大短徑,X2為淋巴結最大長徑,X3為橫縱比,X4為最大截面積,X5為是否邊緣模糊,X6為是否中央低密度,X7為是否成簇分布。
采用自身檢驗法及交叉驗證法來檢驗判別函數模型的診斷能力,結果見表2。

表2 Bayes診斷模型檢驗結果 (枚)
再將檢驗組42例(20%)患者共307枚淋巴結的數據代入診斷模型以驗證模型的診斷能力,結果見表3。

表3 檢驗組數據對診斷模型的驗證結果 (枚)
傳統的影像診斷主要憑借個人知識經驗加以綜合分析推理,因此準確性很大程度上依賴于診斷醫師的知識結構和醫學經驗,即使面對相同的信息,不同的醫生也很有可能得到不同的診斷。而Bayes判別分析的優勢恰恰彌補了傳統影像診斷的不足,將醫師的經驗半定量化,將檢查報告中給出的"可能性大"量化為發生的概率,從而降低醫生在診斷過程中的主觀性,使診斷結果更加客觀準確,文獻報道利用Bayes判別分析建立的診斷模型有助于提高不同醫師乃至不同醫療機構間的診斷一致性[4],陳偉等[5]的研究結果亦證實,利用這一方法建立的診斷模型與高年資醫師的診斷符合率相當,并明顯高于經驗欠缺的低年資醫師。
本研究通過對以往影像學資料的歸納處理,并綜合多位學者提出的診斷食管癌淋巴結轉移的CT征象,即淋巴結最大短徑、最大長徑、橫縱比、最大截面積、強化程度、有無中央低密度、有無邊緣模糊、是否成簇分布,利用Bayes逐步判別分析篩選變量:除強化程度外,上述7項變量均可選入用以建立診斷方程。利用Bayes判別分析法建立診斷模型,非轉移組為Y0=-7.499X1+7.957X2+167.761X3-0.087X4+0.459X5-5.528X6-0.711X7-66.080;轉 移 組 為Y1=-6.697X1+8.231X2+181.686X3-0.106X4+2.219X5-3.331X6-0.124X7-83.183。其中,X1為淋巴結最大短徑,X2為淋巴結最大長徑,X3為橫縱比,X4為最大截面積,X5為是否邊緣模糊,X6為是否中央低密度,X7為是否成簇分布。對上述檢驗模型進行驗證,結果顯示全部1217枚淋巴結,對1003枚非轉移淋巴結共判對898枚,正確率為89.5%(即特異度);214枚轉移淋巴結中,判對169枚,正確率為79.0%(即敏感度),診斷模型的診斷符合率為87.7%,共誤判150枚,誤判率為12.3%。交叉檢驗法與自身檢驗法所得結果相近。
由于自身檢驗法及交叉驗證法常常低估誤判率,從而夸大判別效果,因此我們采用驗證樣本對診斷模型作前瞻性誤判概率的估計,這種方法所得的誤判概率比較客觀。非轉移淋巴結組共251枚淋巴結,判對223枚,正確率為88.8%(即特異度);轉移淋巴結組共56枚,判對37枚,正確率為66.1%(即敏感度);模型診斷符合率為84.7%,共誤判47枚,誤判率為15.3%,與上述兩種檢驗法所得結果相近,且未超過20%,說明該診斷模型具有臨床應用價值[4]。
本研究的不足之處是采用驗證樣本所得出的診斷模型的診斷敏感度偏低,分析可能的原因:①驗證樣本中的轉移淋巴結數量較少造成誤差較大;②本組病例均為可進行食管癌根治手術的患者,腫瘤處于早中期,可能造成一定的數據偏倚;③診斷模型中分類變量所占比例較大,而分類變量不同于連續變量,且一定程度上受到判斷者的主觀因素影響,可能也是造成數據偏倚的原因之一;④分類變量所對應的CT征象盡管對食管癌淋巴結轉移的診斷有一定價值,并證明具有統計學意義,但在樣本中出現概率較小;⑤部分征象,如在癌灶旁的淋巴結常因與病灶重疊分界不清而出現“邊緣模糊”征象,再如隆突下淋巴結常常呈現為“成簇分布”,而食管癌患者在這一區域的淋巴結卻很少被證實為轉移,這些都可能導致誤判。
通過Bayes判別分析法所建立的不同CT征象對食管癌淋巴結轉移的聯合診斷模型具有一定的診斷價值(可以量化診斷,減少人為及經驗誤差)。但本文僅僅是對此的初步探索,由于本組病例包含的轉移與非轉移淋巴結分類欠均衡,因此所得的診斷模型可能尚不具備廣泛的代表性,若將其用于其他樣本,診斷準確性可能存在一些偏差。目前理論上認為病例數越多,分析指標越細,判別函數的準確性越好,所以隨著病例數的增加以及對各種影像學征象的進一步觀測、分析,判別診斷模型將會得以進一步的完善。
[1]Pennathur A,Gibson MK,Jobe BA,et al.Oesophageal carcinoma[J].Lancet,2013,381(9864):400-412.
[2]孫振球,徐勇勇.醫學統計學[M].北京:人民衛生出版社,2008:384-398.
[3]黃澤豐,谷凌雁.基于Bayes公式的醫生輔助診斷系統研究[J].中國數字醫學,2009,4(5):43-45.
[4]吳明祥,馬捷,凌人男,等.基于判別分析模型的乳腺BI-RADS計算機輔助分類[J].放射學實踐,2013,28(3):346-351.
[5]陳偉,劉進康,李文政,等.Bayes分析在孤立性肺結節CT診斷中的應用[J].實用放射學雜志,2009,25(5):646-743.