曾園園 劉仍允 張洪濤
肺癌是全世界范圍內發病率最高的癌癥類型,且是導致癌癥患者死亡的首要因素[1]。盡管80%-90%的肺癌發生與吸煙相關,但肺癌的發生是一個多步驟、多因素參與的復雜的生物學過程,涉及多種遺傳學和表觀遺傳學的改變[2]。作為一種重要的表觀遺傳修飾方式,DNA甲基化可以通過促進抑癌基因失活、原癌基因激活以及增加染色體不穩定性等多種方式,在肺癌等多種腫瘤發生過程中發揮關鍵作用[3]。抑癌基因啟動子區CpG島或啟動子附近區域的異常甲基化引起轉錄抑制從而導致此類基因的活性降低甚至蛋白表達丟失是肺癌發生過程中的常見事件[4]。
E-cadherin基因(Cadherin-1, CDH1)位于染色體16q22.1,該基因編碼的上皮細胞鈣粘蛋白E-cadherin是一個分子量為120 kDa的跨膜糖蛋白,屬于鈣依賴性上皮細胞黏附分子,在維持上皮的極性和結構完整性等方面起著重要作用[5]。在肺癌等多種癌癥患者體內E-cadherin表達降低,而抑制E-cadherin的表達下調可以阻止腫瘤細胞的轉移,說明該基因與腫瘤的發生、發展和轉移等密切相關,且在腫瘤發展過程中發揮著抑癌基因的作用[6]。研究[7-9]表明,在乳腺癌、膀胱癌和胃癌等多種腫瘤中,E-cadherin啟動子區甲基化與E-cadherin表達下調或缺失有關,提示該基因甲基化參與了這些癌癥的發生過程。然而,在肺癌中雖有多項研究曾涉及E-cadherin啟動子區甲基化與肺癌發生的關系,但這些研究所得的結果并不完全一致。因此,為了更好地探討E-cadherin啟動子區甲基化與肺癌易感性之間的關系,我們收集、整理先前學者的所有研究數據,并進行meta分析。
1.1 數據收集 為了全面檢索涉及E-cadherin基因啟動子區甲基化與肺癌易感性關系的研究,我們使用“E-cadherin”、“CDH1”、“methylation”和“lung cancer”等作為關鍵詞,利用PubMed/MedLine和EMBASE數據庫檢索發表于2013年3月以前的所有文獻,并將綜述類文獻仔細閱讀,以期從中得到相關的原始研究性文章的信息。
1.2 納入標準及數據整理 如果某研究運用了病例-對照實驗設計且E-cadherin基因啟動子區甲基化頻率可以從該文獻中獲取,那么該文章將被納入當前的meta分析。如果兩項或多項研究擁有重疊或重復的實驗數據,那么我們只納入包含更大樣本量的研究。兩位研究者(曾園園和劉仍允)獨立檢索數據庫并閱讀文獻。在排除明顯不符合納入標準的文獻后,閱讀可能符合的文獻全文,以確定其是否真正符合納入標準。隨后,兩位研究者交叉核對納入文獻的結果,兩人的納入結果完全一致。對于符合納入標準的文獻, 每一篇文獻均按照作者、發表年份、實驗人群所在的國家、實驗人群的種族,以及患者和對照組人群的數量、甲基化檢測方法以及實驗材料的來源進行整理(表1)。
1.3 統計分析 E-cadherin基因啟動子區甲基化與肺癌易感性關系的強弱程度用優勢比(odds ratio, OR)及95%置信區間(confidence interval, CI)表示,而OR值是否有統計學意義采用Z檢驗進行分析。根據實驗人群的種族、甲基化檢測方法和實驗材料來源的不同執行亞組分析。使用以卡方檢驗為基礎的Q檢驗衡量樣本的同質性[10],并以I2值的大小反應多組研究之間同質性的程度(I2值越小,同質性越強)[11]。當各研究間具有較好同質性時,采用基于Mantel-Haenszel方法的固定效應模型來分析meta分析的結果;反之,采用基于DerSimonian and Laird方法的隨機效應模型進行分析[12,13]。使用基于Begg檢驗為基礎的漏斗圖(Funnel plot)檢測數據之間是否存在發表偏倚,采用Egger檢驗進行計算[14]。上述所有統計分析均采用STATA軟件(Stata/SE version 10.1 for Windows; Stata Corp, College Station, Texas),P<0.05認為差異具有統計學意義。
2.1 被納入的研究的基本信息 根據我們的檢索條件及納入標準,共有13項研究被納入當前的meta分析[15-27](表1)。這13項研究共涉及1,288例實驗樣本,包含692例肺癌樣本和596例對照樣本。其中7項研究(涉及378例肺癌樣本和342例對照樣本)源自亞洲人群,3項研究(163例肺癌樣本和142例對照樣本)源自高加索人群,另外3項研究(151例肺癌樣本和112例對照樣本)涉及兩種以上的人群。此外,其中12項研究的研究對象為組織樣本,另外1項為血液樣本。在分析樣本甲基化狀態時,其中有9項研究采用了甲基化特異性PCR(MSP)的方法,另外4項使用了MethyLight分析、三維微列陣分析(3-D microarray)等其它實驗方法。
2.2 E-cadherin基因啟動子區甲基化與肺癌易感性 將收集到的13項研究的數據全部納入meta分析,我們發現這些研究之間存在很強的異質性(P<0.001,I2=74.9%,表2),因此我們采用隨機效應模型來分析E-cadherin基因啟動子區甲基化與肺癌易感性的關系,結果發現E-cadherin基因甲基化可以明顯增加肺癌的發病風險(OR=4.04,95%CI:2.00-8.13,P<0.001,圖1)。按照實驗人群的種族進行亞組分析后,在亞洲人群和高加索人群中仍然可見E-cadherin基因甲基化與肺癌易感性呈明顯正相關的現象(P=0.020,P<0.001,表2)。按照樣本來源和甲基化檢測方法進行亞組分析的結果表明:在組織來源的研究以及使用MSP為檢測方法的研究中E-cadherin基因甲基化可以明顯增加肺癌的發病風險。
2.3 發表偏倚分析 使用OR值的自然對數及其標準誤創建基于Begg檢驗為基礎的漏斗圖來衡量發表偏倚(圖2),該漏斗圖呈現出良好的對稱性,說明我們的meta分析并不存在發表偏倚。此外,Egger檢驗的結果證實了漏斗圖的結果(t=0.39, P=0.707)。

表1 納入meta分析的13項研究的基本特征Tab 1 Characteristics of 13 studies included in the meta-analysis

表2 E-cadherin基因甲基化與肺癌易感性Tab 2 Summary of E-cadherin methylation and lung cancer risk
抑癌基因啟動子區異常甲基化導致抑癌基因轉錄失活的生物學過程參與了肺癌等多種癌癥的發生。E-cadherin基因啟動子區異常甲基化是導致E-cadherin表達下調或缺失的一個重要原因,并參與了乳腺癌、膀胱癌、子宮癌和胃癌等多種癌癥的發生發展過程[7-9,28]。有研究表明,在肺癌患者體內E-cadherin表達降低[29]。因此,E-cadherin基因甲基化可能是導致其蛋白表達降低的一個重要原因,進而改變了患肺癌的易感性,參與了肺癌發生。基于此,多位研究者探索了E-cadherin基因甲基化與肺癌發生的關系,然而這些研究得出的結論存在一定的分歧。

圖1 E-cadherin基因啟動子區甲基化與肺癌易感性關系的meta分析Fig 1 Meta-analysis of the association between E-cadherin promoter methylation and lung cancer risk

圖2 關于E-cadherin基因啟動子區甲基化與肺癌發病風險研究的漏斗分析圖Fig 2 Funnel plot analysis on the association of E-cadherin promoter methylation with risk of lung cancer
本研究采用meta分析的方法,首次系統性地分析了E-cadherin基因啟動子區甲基化與肺癌易感性的關系。我們對先前發表的13項研究的數據(共包含692例肺癌樣本和596例對照樣本)進行分析,結果表明E-cadherin基因啟動子區甲基化可以明顯增加肺癌易感性,且我們的亞組分析數據表明這種相關性同時存在于亞洲人群和高加索人群。因此,我們推測E-cadherin與其它某些重要抑癌基因甲基化的作用模式相類似,即它們的啟動子區甲基化參與肺癌發生過程在各類人種中具有普遍性。
除了根據人種進行亞組分析以外,我們還根據納入研究的甲基化研究方法和研究材料進行了亞組分析。我們發現在使用MSP為檢測方法的研究中E-cadherin基因啟動子區甲基化增加了肺癌的發病風險,而使用其它檢測方法的研究并不能表明E-cadherin基因甲基化與肺癌易感性相關,這可能是由于使用這些方法的研究所涉及的樣本量較小而導致的。納入當前meta分析的研究大多都采用組織樣本為研究對象,只有1項研究(包含20例患者和10例對照者)選用了血液樣本[21],盡管這項研究不能夠直接表明E-cadherin基因甲基化與肺癌易感性相關,我們不能排除使用大樣本量血液樣本的研究得到相關的可能性,因為在該研究中E-cadherin基因甲基化頻率在肺癌患者和對照組中存在較大差異:分別為20%和0%。
檢測所納入的研究間的異質性是meta分析的重要組成部分,我們使用Q檢驗和I2值的大小對所涉及的研究是否具有異質性做了詳細分析,在執行總體分析和亞組分析時根據異質性存在與否選擇性使用隨機效應或固定效應模型對E-cadherin基因甲基化與肺癌易感性的關系進行系統評價。除異質性分析以外,發表偏倚的檢測也尤為重要。本研究中,我們運用基于Begg檢驗的漏斗圖衡量發表偏倚情況,并使用Egger檢驗對漏斗圖的結果進行驗證,結果漏斗圖和Egger檢驗顯示出良好的一致性,這些均提示當前的meta分析不存在發表偏倚。
綜上所述,當前的meta分析表明E-cadherin基因啟動子區甲基化增加了肺癌發生風險。盡管我們的結論需要更大的樣本量以及亞洲和高加索人群以外的樣本中進行驗證,但由于E-cadherin基因啟動子區甲基化在肺癌發生過程中是一個頻發事件,因此E-cadherin基因啟動子區甲基化有望成為檢測肺癌發生的一個潛在分子指標。