宋聲雷,許開武,胡鴻運,李成龍,李光義,陳超武
(湖南省人民醫院,湖南師范大學附屬第一醫院胃腸外科,湖南 長沙 410000)
結直腸癌(Colorectal cancer,CRC)是臨床常見的惡性腫瘤之一,2020 年全球新發CRC 1 880 725例,死亡915 880 例,發病率及死亡率在所有腫瘤中分別排第3 位和第2 位,發病率高,預后差[1]。有研究指出,接近50% 的CRC 是可以預防的[2],探究CRC 危險因素以及預防、治療方案具有重要的意義。平均紅細胞體積(Mean corpuscular volume, MCV)是血常規指標之一,由紅細胞比容和紅細胞計數計算得出,它是判斷紅細胞平均大小的直接指標。最近有研究發現,高MCV 與多種惡性腫瘤的發生密切相關[3-4],此外,還有研究發現高MCV 與CRC 和肝癌的預后之間存在關聯[5-6]。然而,這些關聯是否確實存在,以及存在正相關還是負相關,仍然存在爭議。傳統的流行病學觀察研究在發現疾病病因和推斷因果關系方面存在許多局限,如反向因果關系、混雜因素和微觀有效暴露因素的存在,導致了推斷表型和疾病之間聯系的局限性。孟德爾隨機化(Mendelian randomization,MR)作為一種新的流行病學統計方法,基于“親代等位基因隨機分配給子代”的孟德爾遺傳規律,使用與暴露因素有關的單核苷酸多態性(single nucleotide polymorphisms, SNPs)位點作為工具變量(instrumental variables,IVs)來驗證風險因素與結果之間的因果關系[7-8]。在本研究中,我們應用兩樣本MR 方法來評估MCV 與CRC 之間的關系,為MCV 與CRC 發病風險之間的關聯提供遺傳學方面的支持。
確認MCV 為暴露變量,CRC 為結局變量,搜索IEU Open GWAS 數據庫(https://gwas.mrcieu.ac.uk),得到來自日本生物銀行(BioBank Japan , BBJ)[9-10]的暴露(bbj-a-40)及結局(bbj-a-76)變量的全基因組關聯研究(genome-wide association study,GWAS)數據。MCV 樣本量及SNP 數分別為108 256、6 108 953,CRC 樣本量及SNP 數分別為33 870(病例組6692,對照組27 178)、7 492 477。上述GWAS 數據來自亞洲人群。
以P<5×10-8為篩選條件,挑選與暴露因素強相關的SNPs 作為工具變量。以r2<0.001,距離10 000 kb 為篩選條件,消除連鎖不平衡所帶來的偏倚[11],以保證各個SNP 之間相互獨立,排除基因多效性對結果的影響。通過設置SNP 的F值>10,去除弱工具變量。利用PhenoScanner 數據庫去除與混雜因素有關的工具變量。
利用5 種常用方法進行MR 分析,即逆方差加權法(inverse variance weighted,IVW)[12]、MR-Egger回歸法[13]、加權中位數法(weighted median)[14]、基于眾數的加權估計(weighted mode)以及基于眾數的簡單估計法(simple mode)。使用Cochran’s Q 檢驗進行異質性檢驗,如異質性檢驗P值小于0.05,證明分析結果具有異質性,則重點關注隨機效應IVW 法的結果,因為IVW 方法為隨機效應模型,存在異質性并不影響結果解讀;使用Egger-intercept 檢驗進行水平多效性檢驗;MR-PRESSO 方法可以檢測并校正離群的SNP ;以留一法檢驗作為敏感性分析方法。以上MR 分析通過使用R 4.3.1 軟件中的TwoSampleMR包實現,檢驗水準α=0.05。
達到顯著差異的工具變量共10 609 個,排除連鎖不平衡影響后,篩選出SNP 共109 個作為有效工具變量,所有工具變量的F值均大于10。根據PhenoScanner 數據庫去除與混雜因素相關的工具變量(吸煙:rs12027999 ;炎性腸病:rs2524100、rs12412214 ;體重指數:rs1047891、rs11525583、rs2278557)。最終,被納入為MCV 工具變量的SNP共103 個。
我們從MR 分析的森林圖可以看出(圖1A),下面紅色的部分,是所有SNP 的綜合結果,其在0 的右側,說明在使用MR Egger 和IVW 法下,MCV 的升高會增加CRC 的發病風險。IVW 作為MR 的主要分析方法,結果表明,MCV 水平與CRC 存在相關性(OR=1.171,95% CI:1.048 ~1.308,P=0.005)。MR Egger(OR=1.380,95% CI:1.101 ~ 1.731,P=0.006)、Weighted median(OR=1.332,95%CI:1.133 ~ 1.567,P<0.001)、Weighted mode(OR=1.379,95% CI:1.113 ~1.708,P=0.004) 方法與IVW 方法分析的結果一致,進一步證明了MCV 水平與CRC 的相關性。Simple mode 分析結果(OR=1.335,95% CI:0.937 ~1.902,P=0.113)與上述分析結果存在差異。5 種方法得到的因果效應方向及結果基本一致(圖1B,圖1C)。
由MR 的漏斗圖(圖2A)可見,所有納入的SNP 基本對稱,故以這些SNP 作為工具變量分析的結果比較穩定,提示受到潛在偏倚影響的可能性較小。異質性分析Cochran’s Q 檢驗結果Q=155.690,P<0.001,提示SNP 之間存在異質性,故我們重點關注IVW 方法的檢驗結果。多效性檢驗結果顯示,MR-Egger 回歸的截距分別為-0.0098,接近于0(P>0.05),提示MR 分析結果不受水平多效性影響。MR-PRESSO 模型未發現離群SNP(P值均大于0.05)。采用留一法分析(圖2B),剔除單個SNP 后,MR 的分析結果均未出現明顯波動,說明本研究中MR 結果是穩定的。
近年來,CRC 的發病率逐年升高,造成了較重的社會負擔。既往研究發現,多種危險因素與CRC的發病及預后有關,包括體重指數[15]、吸煙[16-17]等,針對上述風險因素的一級和二級預防策略可能在預防和控制CRC 方面發揮重要作用。然而,除了上述危險因素外,我們還需要進一步探究一些新型的、檢測方便的CRC 危險因素,如血細胞相關的一些分析數據。
MCV 是血常規檢測中的常用指標,是指單個紅細胞的平均體積,以飛升(fL) 為單位。近年來,越來越多的研究發現,MCV 參與了多種腫瘤的發生和進展[18-19]。一項回顧性研究發現,570 例接受了食管癌根治術的患者中,高MCV(>99 fL)組患者的總生存期(Overall survival,OS)較MCV 正常組(83 ~99 fL)短,高MCV 是食管癌患者預后較差的獨立危險因素[20]。Nagai 等[6]對1174 例進行了R0 切除的Ⅰ~Ⅲ期CRC患者進行研究后發現,無論是否行術后輔助化療,術前MCV 較低(<80 fL)患者的無病生存期(diseasefree survival,DFS)均優于MCV 較高(80 ~100 fL)的患者。
本研究中通過使用GWAS 數據和MR 分析,為上述推論提供了更確切的依據,確定了MCV 和CRC之間的因果關系。與隨機對照試驗相比,MR 的樣本量大,試驗設計也更接近隨機分配。與回顧性研究相比,MR 受反向因果關系的干擾更少。本研究證明了MCV 與CRC 之間存在正向因果關系(OR=1.171,95% CI:1.048 ~1.308,P=0.005),這與觀察性研究的結論一致,豐富了人們對CRC 危險因素的認識。
當然,本研究仍存在一定的局限性:首先,本研究中的數據主要來自亞洲人群,因此研究結果可能無法推廣到其他人群,未來需要更多的研究來驗證我們的研究成果在其他人群和種族中的適應性。其次,MCV 的測量值一定程度上受到了不同檢測設備的影響,這可能導致結果存在一定的偏倚。
綜上所述,本研究應用MR 方法得到了MCV 和CRC 的因果關系,初步證明了MCV 水平的升高增加了患CRC 的風險。然而MCV 是如何影響CRC 的,未來仍需更多的生物學實驗進行進一步的研究。