周蕾, 彭俊紅, 胡浩, 阮學廣, 周利華
近年來,前列腺癌(prostate cancer,PCa) 的患病率在世界范圍內(nèi)已居男性惡性腫瘤第2位,在男性癌癥中的病死率居第6位,而在我國人群中其發(fā)病率和病死率也呈上升趨勢[1]。MRI是診斷前列腺癌的最佳影像學手段,但目前常規(guī)MRI序列對早期PCa的診斷仍有局限性,單指數(shù)模型DWI能夠無創(chuàng)反映活體內(nèi)水分子的擴散特征,有效提高PCa的診斷準確性,但活體內(nèi)組織信號并不隨b值呈單指數(shù)衰減,因此DWI并不能真實反映體素內(nèi)水分子的真實擴散特征,在鑒別前列腺良惡性病變時仍存在部分重疊。體素內(nèi)不相干運動(intravoxel Incoherent Motion,IVIM)擴散加權(quán)成像可在不注射對比劑的情況下定量評估并區(qū)分組織分子真性擴散和微循環(huán)灌注的假性擴散信息,能更準確地反映病變組織的病理生理學變化,近年來IVIM成像已成為鑒別病變良惡性的研究熱點,國內(nèi)外已有研究報道IVIM成像中的真性分子擴散系數(shù)(molecular diffusion coefficient,D)值在鑒別診斷前列腺癌中有重要價值[2],但對其準確性的報道尚不多。筆者通過Meta分析系統(tǒng)性分析目前關于IVIM中D值診斷PCa的研究,從而對D值的診斷效能做出綜合、客觀的評價。
檢索的數(shù)據(jù)庫有PubMed、Embase、中國知網(wǎng)、萬方和維普數(shù)據(jù)庫。英文檢索詞為(“intravoxel incoherent motion”or “biexponential” or “IVIM”)and(“prostate”);中文檢索詞為 (“體素內(nèi)不相干運動” 或“IVIM”或“雙指數(shù)模型”)和(“前列腺”)。檢索時間均從建庫截止至2018 年11月。為盡量查全文獻,采用網(wǎng)上檢索和手動檢索相結(jié)合的方式,并對納入文獻的參考文獻進行二次檢索。
文獻納入標準:①研究類型。公開發(fā)表的IVIM-DWI診斷前列腺癌的應用研究,限中英文。②研究對象。擬診前列腺病變,應用IVIM-DWI檢查診斷前列腺癌的研究,病例總數(shù)≥ 30例。③金標準。穿刺活檢或手術切除病理確診。④可以直接或間接提取四格表數(shù)據(jù)包括真陽性值(true positive,TP)、假陽性值(false positive,F(xiàn)P)、假陰性值(false negative,F(xiàn)N) 、真陰性值(true negative,TN)或敏感度(sensitivity,Se)、特異度(specificity,Sp)及D值等指標。
文獻排除標準:①重復發(fā)表的文獻(保留數(shù)據(jù)最全最新的文獻);② 綜述、評述、病例報告及文摘類研究;③ 動物試驗。
由2位高年資醫(yī)師/技師獨立進行文獻篩選和資料提取,并交叉核對,如遇分歧通過討論協(xié)商達成一致。提取的資料主要包括第一作者、發(fā)表時間、研究類型、設備類型、b值個數(shù)及數(shù)值、掃描層厚、樣本量、D值、診斷閾值及各項研究入選病例的惡性率(癌灶數(shù)/總病灶數(shù))等信息,提取的四格表數(shù)據(jù)信息包括TP、FP、FN、TN等指標。
按照Cochrane協(xié)作網(wǎng)推薦的診斷準確性研究質(zhì)量評價(Quality Assessment of Diagnostic Accuracy Study,QUADAS)工具[3]由3位評價員獨立評價納入文獻的質(zhì)量,對14個評價條目做出“是”(低度偏倚或適用性好) 、“否”(高度偏倚或適用性差) 或“不清楚”(缺乏相關信息或偏倚情況不確定)的判斷,滿足“是”的條目≥10條的納入文獻被視為質(zhì)量較高的文獻。
采用Meta-Disc1.4和Stata14.0軟件進行統(tǒng)計學分析。通過Stata14.0軟件以標準化均數(shù)差(standardized mean differences,SMD)比較PCa與良性病變的D值差異;采用Cochran-Q檢驗及I2值進行異質(zhì)性檢驗,若I2<50% 可認為研究結(jié)果間有較低異質(zhì)性,采用固定效應模型合并SMD、Se、Sp、陽性似然比(positive likelihood ratio ,LR+)、陰性似然比(negative likelihood ratio,LR-)、診斷比值比(diagnostic odds ratio,DOR)等效應量,匯總受試者工作特征曲線(summary receiver operating characteristic curve,SROC)的曲線下面積(area under the curve ,AUC);若I2≥50% 則提示存在高度異質(zhì)性,采用隨機效應模型合并效應量。通過Spearman相關系數(shù)檢驗有無閾值效應(Spearman相關系數(shù)呈高度正相關且P<0.05即提示存在閾值效應)引起的異質(zhì)性。若存在高度異質(zhì)性則進一步進行亞組及回歸分析探討異質(zhì)性來源。采用Egger'檢驗分析D值的發(fā)表偏倚,采用Deeks'漏斗圖檢驗分析D值診斷效能的發(fā)表偏倚,若P<0.05則提示存在明顯發(fā)表偏倚。

表1 納入研究的基本特征

表2 納入文獻的D值的基本診斷參數(shù)及診斷閾值

表3 診斷性試驗質(zhì)量評價標準QUADAS工具評價匯總(篇)
通過初步檢索獲得可能相關的文獻78篇,經(jīng)過閱讀標題、摘要及全文逐層嚴格篩選排除,最終納入13篇文獻[4-16],其中英文2篇,中文11篇。共納入研究的患者835例,病灶945個;前列腺癌組患者402例,病灶438個;良性病變組患者433例,病灶507個。納入研究的基本特征及診斷參數(shù)見表1、2。
按照診斷試驗的設計特征,主要評價標準共計14項(表3)。共計3篇文獻滿足14條評價標準,6篇滿足13條標準,4篇滿足12條標準,提示納入的13篇文獻均具有較高質(zhì)量。
對納入的13篇文獻采用Egger'檢驗分析D值的發(fā)表偏倚(圖1),采用Deeks'漏斗圖檢驗D值診斷效能的發(fā)表偏倚(圖2),結(jié)果顯示P值分別為0.12和0.40(均>0.05),提示本研究納入的文獻結(jié)果不存在明顯的發(fā)表偏倚。

圖4 敏感度森林圖。 圖5 特異度森林圖。 圖6 D值診斷效能的SROC曲線圖。

表4 亞組分析及回歸分析
以SMD為效應量進行異質(zhì)性檢驗I2=65.7%,提示存在明顯異質(zhì)性,選用隨機效應模型合并SMD,森林圖(圖3)結(jié)果顯示合并后的SMD為-2.09(95%CI:-2.37~-1.80)(P<0.01)。以DOR為效應量進行異質(zhì)性檢驗I2=52.7%(P=0.01),表明異質(zhì)性較大,采用隨機效應模型合并各效應量,合并后的Se、Sp、LR+、LR-、DOR分別為0.91(95%CI:0.88~ 0.94)、0.84(95%CI:0.80~0.87)、5.35 (95%CI:3.56~8.05)、0.12(95%CI:0.08~0.20)、63.83(95%CI:30.67~132.85),匯總SROC曲線下面積為0.95(圖4~6)。
閾值效應分析結(jié)果顯示D值診斷前列腺癌的Spearman 相關系數(shù)為0.48,P=0.09>0.05,表明各項研究不存在明顯閾值效應,提示D值診斷閾值不是異質(zhì)性的主要來源。為探討異質(zhì)性來源,根據(jù)研究特點,分別對最大b值(≤1000 s/mm2、>1000 s/mm2)、b值個數(shù)(<10個、≥10個)、設備類型(3.0T、1.5T)、惡性率(<50%、≥50%)、層厚(≤4 mm、>4 mm)、研究類型(前瞻性、回顧性)進行Meta亞組及回歸分析,結(jié)果顯示敏感度在惡性率和研究類型方面差異有統(tǒng)計學意義(P<0.05),特異度在最大b值、b值個數(shù)和研究類型方面差異有統(tǒng)計學意義(P<0.05,表4)。
前列腺癌是男性常見的惡性腫瘤之一,許多患者確診時就已發(fā)生周圍組織侵犯或遠處轉(zhuǎn)移,預后較差,早發(fā)現(xiàn)、早診斷及早治療是提高PCa患者生活質(zhì)量及改善預后的關鍵。IVIM擴散加權(quán)成像是在DWI基礎上發(fā)展起來的,由Le Bihan等[17]于1986 年首次提出,采用4個及以上b值通過雙指數(shù)模型擬合可獲得IVIM擴散加權(quán)成像相關參數(shù),包括真實擴散系數(shù)D值、灌注相關擴散系數(shù)(perfusion-related diffusion coefficient,D*)及灌注分數(shù)(perfusion fraction,f)。D值反映活體內(nèi)單純的水分子擴散運動;D*值反映毛細血管血流灌注效應造成的假性擴散信息,與微循環(huán)血流速度、平均毛細血管長度相關;f值反映的是組織微循環(huán)灌注占整體擴散效應的容積百分比,與組織微循環(huán)的血容量相關。
前列腺癌細胞增殖快且排列緊密,細胞外間隙窄,水分子擴散明顯受限。國內(nèi)外研究表明前列腺癌D值較前列腺良性病變明顯減低,差異有統(tǒng)計學意義,但D*值、f值在前列腺癌與良性病變之間的差異有無統(tǒng)計學意義尚無定論[2],目前國內(nèi)外關于D值診斷PCa準確性方面的研究報道尚不足,且大部分研究的樣本量較小,結(jié)果間存在一定程度的差異性。筆者通過Meta分析有效增大樣本量,減少隨機誤差,并通過對同類研究的多個獨立研究結(jié)果進行系統(tǒng)性分析,更客觀系統(tǒng)地評價以D值為診斷標準時IVIM對國人PCa的診斷價值。
本研究結(jié)果顯示合并后的PCa組與良性病變組D值的SMD為-2.09(95%CI:-2.37~-1.80)(P<0.01),表明PCa組D值低于良性病變組,差異有統(tǒng)計學意義,與國內(nèi)相關研究結(jié)果一致[4-16]。合并后的Se、Sp分別為0.91和0.84,均較高,表明D值能很好地篩查并鑒別出PCa患者。陽性似然比表明診斷試驗出現(xiàn)真陽性結(jié)果與假陽性結(jié)果的比值,值越大,說明診斷價值越高;陰性似然比表明診斷試驗出現(xiàn)假陰性結(jié)果與真陰性結(jié)果的比值,值越小,說明診斷價值越高。本研究合并后的LR+、LR-分別為5.35和0.12,均提示D值對PCa的診斷價值較高。DOR表明檢查患者出現(xiàn)陽性結(jié)果與陰性結(jié)果的比值,合并后的DOR值為63.83,證實了D值擁有較高的病變檢出率。AUC是綜合評價診斷試驗診斷準確性的最佳指標,通常AUC值在0.7~0.9及0.9以上提示具有較高診斷價值和極高診斷價值,本研究合并后的AUC為0.95,進一步提示D值在診斷PCa上有極高的診斷價值。劉佳琦等[18]的大數(shù)據(jù)Meta分析結(jié)果顯示傳統(tǒng)的功能成像DWI、MRS診斷中國人群PCa的AUC分別為0.90、0.93,可見D值的綜合診斷效能高于DWI及MRS,表明D值具有重要的臨床推廣應用價值。
本研究納入的13篇文獻均滿足最少12條以上評價標準,表明納入該研究的文獻質(zhì)量較高,提示研究結(jié)果的可靠度高。診斷準確性的異質(zhì)性分析顯示I2值為52.7%,提示各項研究異質(zhì)性較大,而Spearman相關檢驗結(jié)果顯示不存在明顯閾值效應造成的異質(zhì)性。通過對最大b值、b值個數(shù)、設備類型、惡性率、層厚、研究類型等因素進行Meta亞組分析,結(jié)果顯示敏感度在惡性率和研究類型方面差異有統(tǒng)計學意義(P<0.05),提示最大b值、b值個數(shù)、掃描層厚等掃描參數(shù)及設備類型對診斷敏感度均無明顯影響,而惡性率不同的主要原因在于納入的研究來自不同地區(qū)及不同級別的醫(yī)院,入選患者在構(gòu)成比上存在不可避免的差異。特異度在最大b值、b值個數(shù)和研究類型方面差異有統(tǒng)計學意義(P<0.05),提示最大b值、b值個數(shù)均是D值診斷PCa特異度的重要影響因素,從亞組分析結(jié)果可以看出掃描條件中最大b值>1000 s/mm2和b值個數(shù)≥10個的亞組特異度高達0.89,且亞組間差異有統(tǒng)計學意義(P<0.01),多項研究結(jié)果表明采用≥10個b值和最大b值>1000 s/mm2掃描時特異度可達0.95以上[6,8,16]。b值是IVIM 的重要掃描參數(shù),目前b 值的選擇還沒有統(tǒng)一標準,仍在探索中,這也是IVIM技術今后研究的熱點方向之一。研究類型對敏感度和特異度均有影響,筆者認為主要原因在于回顧性研究在病例的選擇上存在一定程度的偏倚。Egger'檢驗和Deeks'漏斗圖檢驗結(jié)果顯示納入的各項研究的D值和診斷準確性均不存在明顯發(fā)表偏倚,表明納入的13篇文獻研究結(jié)果的可信度較高。
本研究納入的13篇文獻以回顧性研究(11篇)為主,僅2篇為前瞻性研究,且研究的樣本人群均為國人,存在一定的偏倚;本次納入的研究不包含未公開發(fā)表的文獻和正在研究的資料,存在一定的偏倚。本次納入的研究采用的D值診斷閾值雖然無明顯閾值效應,但仍存在一定程度的差異,而非統(tǒng)一診斷標準,有待進一步研究。
綜上所述,IVIM-DWI檢查PCa組D值低于良性病變組,差異有統(tǒng)計學意義;以D值為診斷閾值鑒別診斷PCa的敏感度和特異度均較高,D值具有極高的診斷效能,可以作為無創(chuàng)性篩查PCa患者的有效指標用于臨床推廣。而最大b值和b值個數(shù)是影響診斷準確性的重要因素,目前尚無統(tǒng)一標準,這也是今后研究的方向之一。