張 弛,王 萍,蘇佳山,程冬梅
干眼是指由淚液的量或質或流體動力學異常引起的淚膜不穩定和(或)眼表損害,從而導致眼部不適癥狀及視功能障礙的一類疾病。其發病率非常高,根據流行病學調查結果顯示,世界范圍內干眼的發病率約為 5.5%~33.7%[1-2],其中我國發病率約為21%~30%,干眼患者有眼部干澀、異物感、燒灼感、視疲勞、視力波動等不適,嚴重者可導致眼表,尤其是角膜組織干燥、角化或融解、穿孔,造成角膜盲。因此干眼的正確有效診斷尤為重要[3]。干眼癥狀無特異性,臨床上診斷干眼,除了臨床癥狀外,還需要結合各種眼表檢查的客觀參數綜合判斷,如淚液分泌試驗(Schirmer Ⅰ test,SⅠt)、熒光素染色淚膜破裂時間(FBUT)、非接觸式淚膜破裂時間(NI-BUT)、淚河高度(TMH)、角膜熒光素鈉染色(FL)評分、瞼板腺功能評分(MG-SCORE)等[4]。但這些單個指標的臨床意義有限,哪些指標對干眼的診斷更有參考價值,它們之間的聯系又是什么,目前未見相關報道。
數據挖掘是生物信息學的重要內容之一,可以將獲得的零散數據轉換成便于讀寫輸出的信息,再進一步用多種數學工具進行分析建模,從而找出這些數據的聯系和規律,為臨床診斷、治療提供幫助和參考[5]。本研究擬運用數據挖掘技術,分析正常人和干眼患者各眼部檢查參數,尋找診斷干眼的相關性指標,建立干眼預測模型。
1.1對象選取2020-03/2021-01于我院確診的干眼患者218例436眼納入干眼組,其中男101例202眼,女117例234眼,年齡20~70(平均41.32±5.13)歲。納入標準:(1)符合干眼診斷標準,根據《中國干眼臨床診療專家共識》(2020)中干眼的診斷標準[6]:1)有下列主觀癥狀之一:干燥感、異物感、燒灼感、視疲勞、畏光、疼痛、流淚、視力波動、眼紅;2)眼表疾病指數(OSDI)問卷評分≥13分;3)NI-BUT≤10s 或SⅠt≤10mm/5min;(2)年齡18~72歲。排除標準:(1)繼發于系統性紅斑狼瘡(SLE)、類風濕性關節炎(RA)和系統性硬化癥(SSc)等干眼患者;(2)既往有眼部過敏、手術、配戴角膜接觸鏡、角結膜感染性疾病等病史。選取同期在我院進行健康體檢的健康人群212例424眼納入正常對照組,其中男113例226眼,女99例198眼,年齡18~72(平均43.19±6.22)歲。納入標準:(1)無干眼癥狀和體征;(2)年齡18~72歲。排除既往有眼部過敏、手術、配戴角膜接觸鏡、角結膜感染性疾病等病史者。本研究經醫院倫理委員會審批通過,所有研究對象均知情同意。
1.2方法
1.2.1檢測指標
1.2.1.1OSDI問卷評分采用OSDI問卷進行干眼主觀癥狀評分,問卷內容包含眼部癥狀(眼干、灼熱感、異物感、眼痛、畏光和視力波動等)、視覺相關功能、環境因素。由12個問題組成,每個問題評分0~4分,0分為無癥狀,1分為有時侯有癥狀,2分為一半時間有癥狀,3分為絕大多數時間有癥狀,4分為總有明顯癥狀。OSDI評分=(25×總得分數)/回答問題數,總分0~100分。
1.2.1.2SⅠt 無麻醉條件下使用Schirmer試紙(5mm×30mm),頭端內折置入受檢者下眼瞼外中1/3交界處的結膜囊,囑受檢者輕閉眼5min后,測量5min內淚液浸濕試紙的長度。
1.2.1.3FBUT 用熒光素鈉試紙觸及下瞼結膜囊,囑受檢者瞬目3~4次使熒光素涂布于眼表,雙眼平視前方,從末次瞬目至角膜出現首個黑斑的時間為淚膜破裂時間。測量3次,取平均值。
1.2.1.4NI-BUT 暗室環境下,受檢者雙眼自然睜開,使用Keratograph 5M中Placido盤投影至受檢者角膜的表面并對焦,注視中心紅點,再囑其充分瞬目3次后盡可能保持睜眼,自動記錄淚膜破裂時間。測量3次,取平均值。
1.2.1.5TMH 暗室環境下,受檢者在測試前充分瞬目3次,采用Keratograph 5M拍照記錄淚河高度圖像。測量3次,取平均值。
1.2.1.6FL評分用熒光素鈉試紙觸及受檢者下瞼結膜囊,將角膜劃分為4個象限,在裂隙燈鈷藍光下觀察角膜染色情況。角膜染色在每個象限的評分為0~3分:0分為無染色;1分為小于30個染色點;2分為大于30個點但未融合成片;3分為出現融合或出現絲狀物及潰瘍。4個象限的得分相加為每眼的總評分,共0~12分。
1.2.1.7MG-SCORE 通過Keratograph 5M瞼板腺成像技術對瞼板腺結構進行評估,每只眼的上下瞼分別進行評分記錄,評分標準:0分:瞼板腺無缺失;1分:瞼板腺缺失比例<1/3;2分:瞼板腺缺失比例為1/3~2/3;3分:瞼板腺缺失比例>2/3。
1.2.2預測模型的構建和驗證方法不同的機器學習算法適合于不同的數據集,本研究分別使用Random Tree、KNN、Decision Stump、Random Forest、SVM、Na?ve Bayes、C4.5決策樹等機器學習算法構建干眼預測模型,通過5組交叉驗證結果評估該模型的預測能力,并采用受試者工作特征曲線(receiver operating characteristic curve,ROC)及曲線下面積(area under curve,AUC)評估各算法的預測能力。在5組交叉驗證中,將數據集分成5個子集,其中4個子集作為訓練集用于建模,1個子集作為測試集檢驗模型,共進行5次計算,得到5個值,取平均值即5組交叉驗證的結果。具體流程如下:(1)收集數據,構建用于建模的數據集;(2)對訓練集進行特征篩選,去除冗余的變量,建立特征子集;(3)使用機器學習算法對訓練集進行模型構建;(4)對建立的模型進行評估;(5)使用獨立測試集對模型的預測能力進行驗證。本研究所有的機器學習計算均在Linux系統下采用開源軟件WEKA進行。
1.2.2.1數據庫構建分別從干眼組和正常對照組各隨機選取100例200眼受檢者的數據組成測試集,其余干眼組118例236眼、對照組112例224眼受檢者的數據作為訓練集。

1.2.2.3機器學習算法
1.2.2.3.1C4.5決策樹決策樹是一種用來表示判定規則的樹結構。通過對訓練樣本集訓練,可以構造出一棵可表達一定規則的決策樹,該樹對樣本空間進行了劃分。當使用決策樹對未知樣本預測時,該算法利用已生成的樹,從根結點開始對樣本的屬性測試其值,并順著分枝向下移動,直至達到某個葉結點為止。此葉結點代表的類即為該樣本的分類結果[7]。
1.2.2.3.2KNN KNN即K-最近鄰(K nearest neighbors),適用于分類和回歸的非參數方法。特征空間中的K個最接近的訓練樣例(即樣本點)作為輸入,輸出值有2種情況,當N=1時,輸出對象是簡單的最近鄰樣本點;而當它存在K個值(N≠1時),輸出值是K個最近鄰的平均值[8]。
1.2.2.3.3RandomTree 基本思路:設屬性集{X=F1,…,Fk,D}為建造樹型提供大體結構,其中包括非決策屬性Fi(i=1,2,…,k)和決策屬性D(d1,d2,…,dm)。Fi(x)表示x的屬性Fi值[9]。
1.2.2.3.4Na?veBayes Na?ve Bayes即樸素貝葉斯算法,是無監督學習的一種常用算法,通過聯合概率[P(x,y)=P(x|y)P(y)]建模,運用貝葉斯定理求解后驗概率[P(y|x)],將后驗概率最大者對應的類別作為預測類別[10]。
1.2.2.3.5Bagging Bagging是最常用和最實用的集成學習算法之一,旨在結合許多弱分類器獲得強分類器,通過建立許多獨立的訓練數據集生成一些獨立的分類器,然后將它們組合起來,以多數投票構建最終的分類器[11]。
1.2.2.3.6SVM SVM即支持向量機(support vector machine),是一類按監督學習方式對數據進行二元分類的廣義線性分類器,其決策邊界是對學習樣本求解的最大邊距超平面[12]。
1.2.2.3.7DecisionStump Decision Stump也稱單層決策樹。該算法可對每一列屬性進行一次判斷,由一個內部節點(根節點)與末端節點(葉節點)直接相連,葉子節點即最終的分類結果[13]。
1.2.2.3.8RandomForest Random Forest即隨機森林(RF),該方法結合Bagging和隨機選擇的特征被獨立引入,以構建具有可控變化的決策樹集合[14]。
2.1特征篩選采用CFS方法從全體數據中篩選出特征子集,該子集包含4個變量,即SⅠt、NI-BUT、TMH、FL評分。
2.2預測模型的構建和驗證采用Random Forest算法進行建模時,模型的預測準確率高于其他算法,干眼組和正常對照組的預測準確率分別為91.8%和85.2%,總預測準確率為88.5%,見表1。模型的驗證結果顯示,Random Forest算法的ROC曲線和AUC面積均優于其它算法,見圖1、2。盡管Random Tree和Random Forest算法的干眼預測準確率最高,但與其他算法相比較,各個算法之間的總預測準確率相差并不是十分大,說明選取的這些算法具有可行性。由于部分機器學習方法的參數可能對模型的預測準確率有一定的影響,因此本研究對Random Forest算法的參數進行了優化,結果顯示,當模型參數numTrees為9時,正常對照組、干眼組和總預測準確率均大于90%,優于其它參數,見圖3,故選擇該參數條件建立最終的干眼預測模型。采用測試集對該模型的預測準確率進行評估,結果顯示,測試集中正常對照組、干眼組和總預測準確率分別為91.7%、97.6%和94.6%。

圖1 不同算法預測能力的ROC曲線。

圖2 不同算法的AUC面積。

圖3 Random Forest算法參數優化后的預測準確率。

表1 特征子集采用不同算法的預測準確率%
2.3特征變量的干眼預測準確率采用Random Forest算法進行單因子變量預測能力進行評估,結果顯示,FL評分和NI-BUT是篩選出的特征變量中干眼預測準確率較高的兩個變量,均超過74%,見表2,表明這兩個變量對干眼的診斷是最重要的。

表2 單因子變量的預測準確率%
目前對干眼的診斷指標較多,本研究采用診斷干眼常用的檢測參數,針對20~70歲受試對象進行檢測,對得出的數據進行數據挖掘和分析。本研究中通過變量篩選,選擇NI-BUT、SⅠt、TMH和FL評分4個特征變量構建預測模型,得出FL評分和NI-BUT與干眼有較強相關性。
FL評分是通過染色實驗準確判斷角膜上皮損傷情況。熒光素衍生物染色若為陽性,提示存在干燥失活的上皮細胞。眼表細胞完整性受損時,可被特定染料著色,染色程度與眼表損傷的嚴重程度具有相關性。因此,眼表細胞染色可評價上皮細胞的屏障功能和完整性,本研究顯示FL評分對干眼的預測準確性達82.8%,說明此指標可作為干眼嚴重程度的評價指標之一。NI-BUT是基于Placido環投射原理,結合自動分析軟件,檢測淚膜隨時間破裂的位點和時間[15]。FBUT雖然檢查方法便捷,適合臨床使用,但屬于侵入性檢查[11],一定程度影響了淚膜的真實狀態,因此對于處于臨界范圍的干眼,診斷會存在偏差。NI-BUT的重復性及其與傳統FBUT測量值的一致性一直存在爭議,但因其操作對眼表擾動小,近年來逐漸在臨床推廣,本研究發現NI-BUT的預測率在70%以上,是干眼的強相關影響因素。SⅠt是評估干眼的主要指標之一。本研究通過數據分析發現,SⅠt在干眼預測模型中總預測準確率在60%以上,這已經是干眼預測模型中相關影響因素里較強的指標了,計算的結果可以佐證臨床調研的試驗結果,說明干眼患者其淚液分泌量相比正常人顯著降低。TMH是角結膜表面光帶與下瞼瞼緣光帶交界處的淚液的液平高度,可以通過該高度在一定程度范圍內反映淚液的分泌量,但它在干眼預測模型中總預測準確率只有53.1%,比起其他3個特征變量,準確性偏低。
機器學習的重要目標之一是通過分析有限的樣本進而對未知樣本進行測試,得到最精準的估計結果。本研究收集了218例干眼樣本,嘗試用多種機器學習方法構建干眼預測模型。結果顯示,Random Forest可以較好地對干眼患者進行識別。但是,相對于國內干眼患者這個群體,樣本量偏少。一般當樣本量較小或模型過于復雜時會出現過擬合[16],如具有相對于觀測次數太多的參數存在等。通常過擬合將具有預測性能不佳的情況,因為其可以夸大小幅波動的數據[17]。本研究中,為了避免出現過擬合,我們采用獨立測試集進行外部驗證,從而降低過擬合的風險。
本研究通過數據挖掘的計算及臨床數據的處理對干眼的影響因素進行預測,結果顯示,Random Forest算法普遍要比其他算法學習器具有更加準確、穩定的預測效果。對于部分算法,如支持向量機等,在實際操作的時候,需要選擇相對應的操作參數[18]。但是這些操作參數的選取在國際上現在沒有確切的執行標準,對于操作者來說,一般是憑借經驗進行選擇,對于初步接觸算法的操作人員來說具有一定難度。此外,由于參數的選取數值不同,會對結果產生很大偏差。建立參數優化模型可以解決參數選擇的困難,并且在預測準確率時,可以得到最優的預測方案[19]。本研究中,我們通過變量篩選找出強相關變量,尋找干眼相關的新指標,進而用于臨床診斷。基于以上變量,本研究采用不同算法分別構建干眼的預測模型,結果顯示,所建模型的干眼預測準確率均高于75%。說明本研究所選用的特征變量泛化能力很強,適用于多種算法。但是考慮到實際臨床中的假陰性或假陽性,因此有必要追求高預測準確率。通過所建立的預測模型,我們可以對一些干眼初期的疑似病例進行判別或預警,從而達到早診斷、早干預的目的。本研究不足之處在于納入樣本量偏少,在今后的研究中,將和其他眼科機構進行多中心合作,進一步擴大樣本量,提高模型的預測準確率。