陳曉艷,趙秋紅
(天津科技大學電子信息與自動化學院,天津 300222)
肺癌發病率及病死率居全球癌癥首位,已成為威脅人類健康和癌癥死亡的主要病因之一.據統計,肺癌 5年生存率為 13%~15%,早期診斷率僅 15%,因此對肺癌患者早發現、早診斷、早治療,以減少肺癌晚期轉移與惡化的可能性是非常重要的[1].目前,肺癌早期診斷方法主要有:影像學檢查、腫瘤標志物檢查、痰液涂片脫落細胞檢查、支氣管鏡檢查、胸腔鏡和縱隔鏡等[2],痰液涂片脫落細胞檢查是確診肺癌的最簡便手段,但受多種因素的影響,其陽性率較低,不作為早期肺癌的檢查手段;支氣管鏡能直接觀察病變形態特征以及支氣管狹窄情況,但是會對氣管造成物理傷害;影像學檢查是診斷腫瘤最重要的方法之一,包括 X 射線、CT、MRI、PET、EIT 等.通過這些影像學檢查可以獲取癌變的準確位置和大小,但在肺癌早期尚未形成結節之前,現有影像技術并不能預警病變,并且頻繁使用會對人體造成更大的傷害.因此,臨床需要無創監測肺癌早期病變的新方法和新技術.
電阻抗對病變較敏感,組織或器官在尚未形成結構性結節之前,其阻抗就已經發生了變化,通過測量組織或器官的電阻抗,可以對肺癌早期進行篩查,起到預警作用;而且電阻抗測量具有無毒素、無射線、無損傷等突出優勢,是一種理想的、具有誘人應用前景的無損醫學檢測手段[3–4].目前,國內外關于電阻抗進行癌癥組織的辨識方法研究尚少,國內開展人體活性組織介電特性與表征方法研究的有第四軍醫大學,其研究側重乳腺與腦出血病變[5–6],寧波大學馬青教授研究了動物及人血液細胞的阻抗譜分析方法[7–8];天津大學王化祥教授研究小組進行肺部活性組織介電特性與表征方法研究,已發表 1篇阻抗測量結果[9],但均未采用模式識別方法對病變組織進行辨識.
本文根據阻抗頻譜理論及模式識別理論,對手術中切除的惡性腫瘤組織及非腫瘤組織進行阻抗測量和辨識,研究內容屬于初期探索.
根據 Cole-Cole理論,生物阻抗可等效為內、外電阻和膜電容生物阻抗模型[10]

式中:特征參數0R為低頻電阻的極限值;R∞為高頻電阻的極限值;α為松弛因子;τ為時間常數;ω為
角頻率.用于計算生物阻抗特征參數的 Cole-Cole阻抗圓模型見圖1.其中:(x0,y0)為圓弧的圓心坐標;r
為圓弧的半徑.

圖1 Cole-Cole阻抗圓Fig.1 Cole-Cole plots
阻抗特征參數的計算公式如下:


這里采用最小二乘法擬合曲線,使目標函數 F最小.

模式識別誕生于20世紀20年代,至今已有很多種模式識別分類方法[11–12].由于統計模式識別方法比較成熟,能夠考慮干擾噪聲等影響,識別模式基元能力強,所以對統計模式識別法中的線性分類方法,即LMSE算法和Fisher算法進行了研究.
1.2.1 LMSE算法
LMSE算法是對準則函數引進最小均方誤差這一條件而建立起來的,適用于線性可分的情況,其把對滿足XW>0的求解改為對滿足 =XW B的求解.LMSE算法的出發點就是選擇一個準則函數使其達到極小值時,可以得到 =XW B的最小二乘近似解[13–14].算法的實現步驟如下:

(5)循環執行步驟(2),直到屬于iω類的所有樣本都滿足
1.2.2 Fisher算法
Fisher準則[15]的基本原理是:找到一個最合適的投影軸,使兩類樣本在該軸上投影之間的距離盡可能遠,而每一類樣本的投影盡可能緊湊,從而使分類效果為最佳.算法的實現步驟如下:
(1)計算各類樣本的均值向量

其中,in表示iω類的樣本個數.
(2)計算樣本類內離散度矩陣iS和總類內離散度矩陣wS.

(3)計算類間離散度矩陣bS.

(4)若希望投影后,在一維空間里各類樣本盡可能地分開,也就是兩類樣本均值之差越大越好,同時希望各類樣本內部盡量密集,即希望類內離散度越小越好.因此,定義Fisher準則函數為

使得 ()JW 取得最大值的*W為

式中,W*是樣本投影到投影線上的投影向量.
(5)將訓練集內所有樣本進行投影.

(6)計算在投影空間上的分割閾值0Y.

投影后,各類樣本均值

(7)根據決策規則分類

實驗數據均來自天津醫科大學總醫院肺外科手術室,樣本離體時間均不超過 30,min.采集儀器是Aglient4294A 阻抗分析儀,夾具是 16092A,測試艙內的溫度為 37,℃,相對濕度為 90%以上.獲取的待測樣本經過修剪后放入標本測試盒,采用二電極法,在100,Hz~100,MHz范圍內,取成對數遞增的31個頻率點測量樣本的阻抗譜.
臨床獲取的所有樣本均做了病理切片,臨床醫生根據切片進行病理分析,確診是否為惡性腫瘤組織,并判斷惡性腫瘤類型.根據醫生診斷結果,選取 123個訓練樣本,其余162個作為測試樣本.在4個參數R0、R∞、τ、α中任選 2個作為模式識別的特征參數,共有 6種組合方式,分別是(0R ,R∞)、(R∞,τ)、(τ,α)、(0R ,α)、(0R ,τ)、(R∞,α).由于 LMSE算法以及Fisher算法屬于線性分類算法,對于線性不可分的情況不適用.(R∞,α)、(τ,α)、(R∞,τ)這3種組合的樣本均屬于線性不可分的情況,因此2種算法對此都不適用.實驗表明,對于(0R,α),2種算法雖能適用,卻得不到辨識結果.
采用 LMSE 算法對(0R,R∞)和(0R,τ)進行辨識,結果如下:
(1)當輸入量是(0R,R∞)時,分界線為

判別函數為

123個訓練樣本及從待測試樣本中隨機選取 23個樣本的分布及模式識別結果如圖2所示.

圖2 (0R ,R∞)的LMSE識別結果Fig.2 Results of(0R ,R∞ )identified by LMSE
(2)當輸入量為(0R,τ)時,分界線為判別函數為


123個訓練樣本及23個測試樣本的分布及模式識別結果如圖3所示.

圖3 (0R ,τ)的LMSE識別結果Fig.3 Results of(0R ,τ)identified by LMSE
采用 Fisher算法對(0R,R∞)進行辨識,結果
如下:

則投影線為

式中:w為投影向量;1w為正常樣本;2w為腫瘤樣本.采用式(13)計算在投影空間上的分割閾值,計算過程中的各參數值見表1.

表1 閾值0y的各參數意義及其數值Tab.1 The parameters and their values of threshold0y
123個訓練樣本分布及對23個測試樣本進行模式識別的結果如圖4所示.

圖4 (R0,R∞)的Fisher識別結果Fig.4 Results of(R0 ,R∞ )identified by Fisher
采用同樣的方法對(0R,τ)進行投影計算,得不到正確的投影線和分界線,所以無法辨識.
在 LMSE和 Fisher此 2種模式識別中,訓練樣本量相同,即61個惡性腫瘤組織,62個非腫瘤組織,共計 123個.為了突出辨識效果,從測試樣本中隨機選用 16個惡性腫瘤組織,7個非腫瘤組織,共計 23個.圖2—圖4的識別結果表明:測試集23個數據中有 7個數據屬于非腫瘤組織,16個數據屬于惡性腫瘤組織,與病理分析結果完全一致.
在實際測試中,對更多的(98個惡性腫瘤組織和64個非腫瘤組織)樣本進行識別,除經過初步篩選剔除掉的3種情況(第1種為術前進行過化療;第2種為測試樣本在測試盒中未充分填充;第3種為測試樣本的血液含量過多)外,辨識結果與病理分析結果仍是高度一致.
由于臨床無法獲得已發生癌變但尚未形成器質性結節的組織,所以本研究中的惡性腫瘤樣本僅局限于已經形成器質性結節的組織.研究結果表明,利用LMSE以及 Fisher算法對術旁切除惡性腫瘤組織及非腫瘤組織能夠獲得良好的分類結果,為下一步更加細化研究癌變過程中組織的阻抗變化奠定了基礎.在今后的研究中,可以通過動物實驗實現在體培養腫瘤,分階段測量組織阻抗,以獲得早期病變阻抗信息,探尋阻抗變化與病理變化之間的對應關系,以期對腫瘤的早預防、早診斷、早治療提供一種新的檢測方法.
[1] 寧康,王超. 肺癌早期診斷方法研究進展[J]. 山東醫藥,2010,50(21):108–110.
[2] 王玉新. 11例肺炎型肺癌的誤診及其影像學特點分析[J]. 臨床肺科雜志,2013,18(1):166–167.
[3] 董秀珍. 生物電阻抗成像研究的現狀與挑戰[J]. 中國生物醫學工程學報,2008,27(5):641–643,649.
[4] Kao T J,Boverman G,Kim B S,et al. Regional admittivity spectra with tomosynthesis images for breast cancer detection:Preliminary patient study[J]. IEEE Transactions on Medical Imaging,2008,27(12):1762–1768.
[5] 付峰,臧益民,董秀珍,等. 部分離體動物組織復阻抗頻率特性(100,Hz~10,MHz)測量系統及初步測量結果[J]. 第四軍醫大學學報,1999,20(3):220–222.
[6] 季振宇,史學濤,尤富生,等. 電阻抗掃描成像乳腺癌早期檢測設備研制及初步評估[C]//中國科協第十四屆年會第十七分會場環境危害與健康防護研討會論文集. 北京:中國生物醫學工程學會,2012:169–172.
[7] 陳曉敏,豐明俊,王力,等. 10,kHz~100,MHz 人血液細胞介電性能[J]. 醫學研究雜志,2009,38(3):42–45.
[8] 陳林,馬青,王力,等. 大鼠紅細胞懸浮液阻抗譜 Cole-Cole數學模型分析[J]. 航天醫學與醫學工程,2010,23(3):182–187.
[9] 王潔然,王化祥,徐曉. 人體肺部組織介電特性實驗研究[J]. 中國生物醫學工程學報,2013,32(2):178–183.
[10] Foster K R,Schwan H P. Dielectric properties of tissues and biological materials:A critical review[J]. Critical Reviews in Biomedical Engineering,1989,17(1):25–104.
[11] Satosi Watanabe. Pattern Recognition,Human and Mechanical[M]. New York:John Wiley & Sons,1985.
[12] 趙喜林,趙喜玲,江祥奎. 模式識別方法及其比較分析[J]. 信陽農業高等專科學校學報,2004,14(3):37–40.
[13] Yang Shuying,Zhang Cheng,Zhang Weiyu,et al. Unknown moving target detecting and tracking based on computer vision[C]//Proceedings of the 4,th International Conference on Image and Graphics. Piscataway:IEEE,2007:490–495.
[14] 胡國勝. 入侵檢測的 Fisher、Bayes和 MSE 識別算法及等價性證明[J]. 計算機應用與軟件,2012,29(4):293–296.
[15] 張新明,李振云,鄭穎. 融合 Fisher準則和勢函數的多閾值圖像分割[J]. 計算機應用,2012,32(10):2843–2847.