龍新陽,黃勝珠,白玉蘭,陳澤鳳,莫曾南
(廣西醫科大學 1.基因組與個體化醫學研究中心;2.廣西基因組與個體化醫學重點實驗室;3.廣西基因組與個性化藥物協同創新中心;4.廣西高等學校重點實驗室;5.公共衛生學院,南寧 530021;6.廣西醫科大學第一附屬醫院泌尿腎臟病研究所,南寧 530021)
骨質疏松癥是由許多因素(遺傳、代謝和環境)相互作用引起的復雜性骨疾病,目前已成為影響公共衛生的重大負擔。老年人是受該疾病影響的主要人群,主要是因為骨礦物質密度在達到峰值后隨年齡下降。隨著世界人口老齡化社會的進展[1],骨骼健康問題需要得到密切的關注。在研究中,骨密度通常被用作是骨質疏松癥的替代表型[2],是指單位面積的骨量大小(g/cm2)。然而,骨密度的改變機制和危險因素仍不清楚。
脂聯素是一種來自脂肪細胞的激素,可以調節胰島素敏感性并且具有抗炎特性[3-4]。在骨骼代謝中,炎癥則會誘導M-CSF和RANKL的表達,刺激破骨細胞并抑制成骨細胞,從而導致骨量減少。同時,脂聯素[5]及其受體也在成骨細胞和破骨細胞中表達,表明脂聯素可能在骨骼重建中發揮作用。除此之外,許多流行病學的研究也探討了血清中脂聯素和骨密度之間的關聯,但結果并不一致[6-9]。觀察流行病學研究提供了暴露與結果之間關聯的大量信息。但是,由于混雜因素和反向因果關系的影響,并不能將它們解釋成因果關系[10-11]。盡管隨機對照試驗仍然是推斷因果關系的金標準,但它們極其昂貴,耗時且失敗率很高[12-13]。最近,通過引入工具變量(IV)的概念,孟德爾隨機化(MR)方法可用于評估風險因素與結果之間的關聯是否與因果關系一致[14]。MR 分析是使用全基因組關聯研究(GWAS)匯總數據進行的[15],這種數據通常由各隊列進行提供[16-17]。為了確定正常范圍內的高脂聯素水平是否與骨骼健康有因果關系,本組通過匯總數據執行了兩樣本雙向MR。
1.1 數據來源 對于脂聯素,在ADIPOGen隊列中發現了162個單核苷酸多態性(SNP)位點與血清中脂聯素水平具有相關關系(P<5×10-8)[18-19]。這是一項針對歐洲血統(n=39 883)的meta 分析,在分析中針對年齡、性別、體重指數等因素進行了校正。
對于骨密度,本組選擇GEFOS 隊列在2015 年提供的相關GWAS匯總數據,該數據包含一個歐洲血統隊列中的股骨頸骨密度(n=32 735)、腰椎骨密度(n=28 498)和前臂骨密度(n=8 143)3份數據。在該GWAS 分析中,性別、年齡和體重均已得到了校正。此外,本組的分析還包括來自UKbiobank 的足跟骨密度(n=426 824)數據[20]。受試者同樣為歐洲血統,校正了年齡、性別等因素。本研究不需要進行道德批準,因為所有數據都是可公開訪問的公共數據。數據來源和MR分析過程,見圖1。

圖1 MR分析流程圖
1.2 IV的要求和方法 根據MR的工作原理,IV必須要滿足3個條件(圖2),因此本研究對具有顯著性的SNP 進行了一系列的檢查和處理,選擇合適的IV。首先,計算F統計量來避免弱IV 的存在[21],要求F統計量大于10。其次,因為連鎖不平衡(LD)代表等位基因在不同位點的非隨機關聯,將導致MR分析中的偏差,因此本研究對SNP 進行了聚類,生成獨立的IV。第三,在GWAS Catalog和Phenoscanner 兩個網站檢查潛在的混雜,排除與混雜相關的SNP后,進行第2次分析。
如果結果數據集中沒有所需的SNP,則使用LD“代理”的SNP,代理SNP與原始SNP具有高度相關性。網站(https://ldlink.nci.nih.gov/)提供了有效實現此功能的工具,選擇決定系數(R2)最大的SNP 作為代理SNP。

圖2 MR分析示意圖
1.3 MR 分析 使用3 種方法進行MR 分析,分別為隨機效應的逆方差加權法(IVW)、加權中位數法(WME)和MR-Egger 回歸法。計算暴露遺傳風險評分(GRS),并分析其與結局的關聯。
1.4 異質性與多效性 IV之間可能存在異質性,這也違反了上述假設[22]。使用Cochran’s Q 統計量去檢測異質性(P<0.05)。同時,用I2統計量[23]來量化異質性的程度。MR Egger 截距[24]可以檢查定向多效性:當截距接近于零時,可以認為不存在定向多效性或定向多效性達到了平衡。
1.5 統計效力的計算 脂聯素的遺傳力約為3%,從https://shiny.cnsgenomics.com/mRnd/[25]上計算MR分析的統計效力(power)。根據之前的流行病學研究[26],本研究的計算結果表明,在分析股骨頸、腰椎和足跟骨密度時,MR 分析有充足的功效發現因果關系(power 分別為0.98、0.97 和1.00)。但是,在前臂骨密度分析中,power僅為0.56。
1.6 探索潛在的反向因果關系 在反向MR 分析中,暴露來自最大樣本量的UKBiobank 數據,結局采用ADIPOGen 數據。由于沒有證據表明肥胖能夠改變骨密度對脂聯素水平的影響,因此在反向MR分析中不排除相應的混雜因素。與正向MR分析一致,本組進行了MR分析以及GRS分析。
1.7 統計學方法 主要采用R 軟件(3.6.1 版本)的“TwoSampleMR”和“gtx”包進行分析。以P<0.05為差異有統計學意義。
2.1 SNP 的選擇 從暴露數據中提取出126 個與脂聯素水平強相關的SNP。通過聚類后獲得21 個獨立的SNP作為IV,其F為25~316(表1)。通過文獻綜述,認為肥胖相關的SNP可能是分析的混雜因素。在排除混雜因素后進行二次MR 分析,以比較結果的異同,從而評估混雜因素的影響。在結局數據中查找IV 與結局的關系。本研究查找了4 個缺失SNPs (rs731839、rs1108842、rs187868、rs6444175)的代理,以便進行后續分析(表2)。

表1 與脂聯素水平相關的21個SNP的特征

表2 代理SNP情況
2.2 MR 分析結果 首次分析納入21 個SNP 作為IV,IVW 分析結果表明,脂聯素和所有位置(前臂、股骨頸、腰椎、足跟)的骨密度均無因果關系(均P>0.05)。WME 和MR-Egger 回歸法獲得了類似的結果。二次分析納入11 個獨立的SNP(rs266743、rs822354、rs187868、rs16861209、rs7649121、rs17366568、rs6444175、rs7615090、rs2980879、rs7955516、rs12051272),其IVW分析的結果依舊不支持存在關聯(均P>0.05),見表3。
2.3 異質性和多效性分析 首次分析時,在足跟骨密度的研究中存在高度異質性(IVW:I2=92.4%;MR-Egger:I2=91.5%),在腰椎骨密度的研究中具有中等異質性(IVW:I2=41.0%;MR-Egger:I2=23.1%),在前臂和股骨頸骨密度的研究中為輕度異質性或不存在異質性。在二次分析中,除了針對足跟骨密度分析中仍存在較大異質性,其他部位分析的異質性消失。類似的現象也體現在多效性分析中,見表4。

表3 MR分析結果

表4 MR分析的異質性檢測和多效性分析
2.4 GRS 分析 GRS 分析納入21 個SNP 時,脂聯素能夠影響腰椎和足跟骨密度(P=0.046、P=0.003),見表5。但此時存在較大的異質性。如果剔除肥胖相關的SNP,脂聯素和腰椎骨密度無顯著關聯(P>0.05)。

表5 GRS分析對結局的影響
2.5 反向MR 的結果 在反向MR 分析中獲得了1 103 個強相關的SNP。由于候選IV 眾多,本組選擇了更嚴格的LD標準(R2=0.01)。在進行聚類與匹配后,最終納入309 個SNP。MR 分析與GRS 分析結果,見表6。

表6 反向MR分析結果
骨髓脂肪組織被認為是內分泌器官,并且在調節骨穩態和骨量中起著至關重要的作用[27]。脂聯素是一種分泌自脂肪細胞的激素,可以通過多種方式影響骨骼代謝。在人體中,脂聯素及其受體(AdipoR1 和AdipoR2)都在成骨細胞和破骨細胞中表達。然而,脂聯素對骨的作用仍存在爭議[28]。研究發現,升高的脂聯素會積極影響骨骼的形成。JNK和AMPK 的兩個途徑是脂聯素刺激骨骼生長并通過中樞神經和周圍神經調節骨量的主要途徑[28]。此外,為了影響成骨細胞的增殖和分化以增加骨量,脂聯素還影響破骨細胞的機制[29-31]。然而,一些研究也表明脂聯素可能對成骨細胞產生負效應[28]。在小鼠相關的實驗中,由于這些不同的機制,使得脂聯素相關的基因過表達和基因敲除小鼠的骨含量結果存在爭議[29,32]。除此之外,在流行病學研究中脂聯素水平與骨密度成強負相關關系[6,33-36],雖然這種關聯具有性別的差異。在一個出生隊列中發現:脂聯素是男性3個不同部位骨密度及女性腰椎骨密度的生物標記物[6]。而在InCHIANTI 隊列中,只在女性中發現了這種關聯性[33]。更有臨床研究直接指出:脂聯素是骨折的獨立危險因素[37]。總而言之,目前的研究說明脂聯素在骨穩態中起著至關重要的作用,但其具體機制尚不清楚。
本研究中,MR 模型研究脂聯素與多部位骨密度之間的關系,結果表明,無論是否排除與肥胖相關的SNP,脂聯素水平總體上都不會影響骨密度的大小。本研究還發現,影響肥胖的SNP會顯著增加分析時的異質性。這種現象主要發生在腰椎骨密度上,這可能是由于不同骨骼部位的遺傳機制不完全一致所導致的[38]。除此之外,也不太可能存在反向因果關系,這也有助于理解這兩者之間的關系。
使用MR模型探索因果關系有著十分明顯的優勢。第一,MR分析基于分離定律,可以有效消除潛在的混雜因素和反向因果關系的干擾。第二,與小樣本的流行病學研究相比,GWAS 匯總數據包含的樣本更大,能獲得更高的檢驗功效。第三,本研究中的所有數據均來自歐洲人口,避免了種族偏倚的影響。第四,本研究中的所有GWAS數據均來自不同的隊列,這很大程度上避免了由樣本重疊引起的估計偏倚。但是,本研究也有一些局限性。首先,MR 模型為線性關系,無法探討非線性關系;其次,骨密度與性別和年齡密切相關,但本研究未能對性別或年齡進行分層分析;最后,仍然無法排除未知的混雜因素帶來的影響。
綜上,遺傳上血清中高水平的脂聯素與骨密度降低或骨折風險增加無關,流行病學上觀察到的關聯可能是由混雜因素引起的。