劉宏軍, 顧建軍, 高君吟, 王玉秀, 閔凌峰
(揚州大學臨床醫學院,蘇北人民醫院呼吸與危重癥科,江蘇揚州,225001)
慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)是一種常見的慢性疾病,持續的呼吸道癥狀和氣流受限是它的主要特征,被認為是來自于各種終生的、動態的和累積的基因-環境相互作用的結果,吸煙是其中最主要的危險因素[1]。它是目前全世界排名前三的死亡原因之一,90%的死亡發生在低收入和中等收入國家[2]。在2015 年,中國20 歲及20 歲以上的COPD 患者總數估計為9 990萬,其中相當一部分患者未能得到及時診斷[3]。此外,在許多未達到COPD 肺功能診斷標準的人群中,已經發現了肺部損害,和某些功能的下降[4]。尋找參與COPD 發病機制的生物標志物,將有利于COPD的早期發現、干預和治療。近年來,高通量測序已廣泛用于研究肺部疾病的發病機制[5],多個COPD 相關的差異基因被發現,由于檢測和分析方法的局限性,目前仍不能完全解釋COPD 發病原因[6-7]。有人嘗試利用多個數據集綜合分析,提高可靠性,獲得了一定成果[8]。在本研究中,我們利用差異分析方法,鑒定出在多個COPD 相關mRNA 數據集中均差異表達的2 個基因為FGG和FGA,結合不同數據庫來源、不同組織樣本、不同種屬的數據集分析它們的表達特點,結果提示纖維蛋白原γ 鏈(fibrinogen gamma chain,FGG)和纖維蛋白原α 鏈(fibrinogen alpha chain,FGA)可能是參與COPD 發病機制的生物標志物。FGG 與FGA 在蛋白水平與mRNA 表達是否一致不得而知,因此我們構建了小鼠吸煙模型進行了驗證,具體報告如下。
1.1 數據來源 從基因表達數據庫(GEO)找到3個人肺組織來源的mRNA 表達數據集GSE57148、GSE47460(測序平臺:GPL14550)、GSE76925,人小氣道上皮(支氣管鏡刷檢獲得)來源數據集GSE5058,小鼠肺組織來源數據集GSE17737。腫瘤基因組圖譜數據庫(the Cancer Genome Atlas,TCGA)獲得病理正常的癌旁肺組織的mRNA表達數據。
1.2 差異基因獲取方法 利用R 軟件的limma包對GSE57148 表達矩陣數據進行差異基因分析,使用GEO2R 在線分析獲得GSE47460(GPL14550 平臺)數據集差異基因的.txt文件,顯著差異基因標準為|log-FC|>0.5,adj.P. Val<0.05,對獲得的兩組差異基因取交集,在GSE76925 進行GEO2R 在線分析獲得的差異基因文件中進行驗證。
1.3 GO 分析 在DAVID 網站(6.8)對獲得的上調基因及下調差異基因分別做GO 富集分析,以P<0.05,FDR<0.01為標準篩選結果。
1.4 基因表達特征分析 選擇人肺組織數據集GSE76925、小氣道上皮數據集GSE5058、小鼠肺組織數據集GSE17737 和TCGA 病理正常的癌旁肺組織的mRNA 表達數據,在各個表達矩陣中提取FGG 與FGA 的mRNA 表達值,結合各組數據包含的吸煙或COPD狀態信息進行特征分析。
2.1 動物模型構建及樣本取材 雄性C57BL/6J 小鼠(8周齡,體重20~25 g)16只購自北京維通利華實驗動物中心,許可證號為SCXK(京)2016-0006。隨機分配為對照組與吸煙組,每組8 只,采用煙熏法建立小鼠COPD 模型,對照組予新鮮空氣,吸煙組在自制染毒箱內以南京牌香煙(焦油量11 mg)煙霧(cigarette smoke,CS)作為刺激物處理30 min,每次使用5支香煙,每天2 次,間隔4 h,每周暴露5 天,連續處理24 周,處理完成后麻醉小鼠行氣管插管,0.8 mL 生理鹽水沖洗肺部3 次,收集支氣管肺泡灌洗液(bronchoalveolar lavage fluid,BALF),從胸腔取肺,左肺制勻漿離心后凍存上清,右肺行組織切片,4%甲醛固定肺組織24 h后石蠟包埋。所有動物實驗方案均經揚州大學研究倫理委員會批準。
2.2 ELISA 采用ELISA 試劑盒,按說明書操作,檢測小鼠肺組織及肺泡灌洗液中白細胞介素6(interleukin-6,IL-6)水平。
2.3 HE 染色及免疫組化染色 蠟塊樣本正中矢狀面切片,二甲苯脫蠟,梯度乙醇洗脫二甲苯,蘇木紫染色,1%酸性乙醇分化后水洗,伊紅染色后,梯度乙醇脫水,二甲苯透明后蓋片,觀察肺泡間隙擴大情況。蠟塊樣本正中矢狀面切片,以二甲苯脫蠟、乙醇水合、檸檬酸鈉高溫修復、兔抗小鼠FGG、FGA、α-平滑肌肌動蛋白(α-smooth muscle actin,α-SMA)和E-鈣黏蛋白(E-cadherin)抗體孵育;山羊抗兔IgG H&L(HRP)Ⅱ抗在室溫下染色20 min,最后DAB 反應顯色。所有切片均采用Olympus顯微鏡拍攝。
采用SPSS 19.0統計軟件包進行統計學處理,所有實驗均獨立重復3 次,計量資料使用均數±標準差(mean±SD)表示,多組間比較采用單因素方差分析,并采用SNK 法進行事后比較,兩組均數間比較采用t檢驗,以P<0.05為差異有統計學意義。
以adj.P.Val<0.05 和|logFC|>0.5 的閾值進行篩選之后,GSE57148 數據集中鑒定出850 個差異基因(上調495 個,下調355 個),GSE47460(GPL14550)鑒定出238 個差異基因(139 個上調,99 個下調)。兩組取交集獲得共同的COPD 與非COPD 差異基因(上調22 個,下調7 個),在GSE76925 差異基因結果中進行驗證,仍然符合adj.P. Val<0.05 和|logFC|>0.5 標準的差異基因包括8 個上調的差異基因,分別是FGA、FGG、COL14A1、COMP、NPTX1、TIMP4、GREM1和CYP1B1,及2 個下調差異基因分別是SLITRK6和PRPH。
在DAVID 網站(6.8 版本)對上調基因及下調基因分別做GO 富集分析,選擇P<0.01,FDR<0.01 為標準,下調基因無陽性結果。上調差異基因GO 分析結果主要包含生物學過程、細胞定位和分子功能3個方面,其中生物學過程結果主要有細胞外基質組織、膠原原纖維組織、凝血,纖維蛋白凝塊形成、肽類激素分泌的正調控等;基因主要定位于細胞外間隙、纖維蛋白原復合物、細胞外基質、血小板α 顆粒中;分子功能僅包括一項蛋白質結合、橋接。其中FGA與FGG 以及COL14A1,共同定位于細胞間隙,參與細胞外基質及膠原纖維合成等生物學過程,涉及分子功能是蛋白質結合和橋接。FGA與FGG還共同參與凝血,纖維蛋白凝塊形成等其他多個生物學過程。
COPD患者肺組織FGG與FGA的表達以及FGG/FGA(FGG 與FGA 表達量的比值)均高于表型正常的吸煙者(P<0.05),見圖1A、B。為分析它們診斷COPD 的價值,對FGG/FGA、FGG 和FGA 分別作ROC曲線分析,FGG/FGA 曲線下面積為0.7315,FGG 與FGA 曲線下面積分別為0.7097 和0.6275,見圖1C。吸煙20 包1 年以上者肺組織的FGG 表達與FGG/FGA 高于吸煙20 包1 年以下的低劑量吸煙者,見圖1D、E。TCGA 數據顯示當前吸煙者肺組織FGG與FGA 表達顯著高于非吸煙者,戒煙小于15 年者仍不能完全恢復正常,見圖1F。

Figure 1. FGG and FGA expression in the lung were affected by smoking and COPD. A:expression of FGG and FGA in smokers and COPD patients;B:the ratio of FGG to FGA expression in smokers and COPD patients;C:ROC analysis of FGG,FGA and FGG/FGA;D:FGG and FGA expression in the lungs analyzed according to the number of cigarettes packs-year;E:the ratio of FGG to FGA expression in the lungs analyzed according to the number of cigarettes packs-year;F:FGG and FGA expression in pathologically normal lung tissue from patients from TCGA by different smoking status. Mean±SD.n=3.*P<0.05,**P<0.01vs smokers;#P<0.05vs 0~20 group;△P<0.05vs non-smokers;△P<0.05vs current smokers.圖1 FGG與FGA表達受吸煙史及COPD疾病的影響
肺組織的FGG 與FGA 水平不受年齡和性別的強烈影響,見圖2A、B。小氣道上皮來源的數據中,FGG 與FGA 水平在COPD 患者中同樣高于表型正常的吸煙者,COPD 組患者FGA 表達水平高于COPD 早期分組,且在COPD 早期分組又高于表型正常吸煙者,見圖2C。香煙煙霧處理同樣會導致小鼠肺組織FGG與FGA基因表達增高,煙霧處理時間越長,這種趨勢越明顯,脫毒處理后這種趨勢可以部分逆轉,見圖2D。

Figure 2. Relationship between FGG and FGA expression with age,sex,tissue origin and species. A:FGG and FGA expression in lungs from the GSE76925 by sex;B:FGG and FGA expression in lungs from the GSE76925 by age;C:FGG and FGA expression in human tracheal epithelia;D:FGG and FGA expression in the lungs of mice that were sham-treated or that were exposed to cigarette smoke for different weeks. Mean±SD.n=3.*P<0.05vs smokers group;#P<0.05vs early COPD group;△P<0.05vs sham group;@P<0.05vs smoke 12 weeks group;▲P<0.05vs smoker 24 weeks group.圖2 FGG和FGA表達與年齡、性別和組織來源與種屬的關系
經ELISA 試劑盒檢測,吸煙組小鼠肺泡灌洗液及肺組織勻漿中,IL-6 水平均高于對照組(P<0.01),見表1。

表1 ELISA檢測小鼠BALF及肺組織勻漿中IL-6的水平Table 1. Detection of IL-6 in BALF and lung homogenate of the mice by ELISA(ng/L. Mean±SD.n=8)
如圖3 所見,吸煙組小鼠肺組織可見部分肺泡腔擴大、肺泡間隔斷裂、肺泡腔融合形成,而對照組小鼠肺泡結構相對完整。

Figure 3. HE staining of mouse lung tissues. The mice in the 2 groups were treated with air and cigarette smoke,respectively.圖3 小鼠肺組織HE染色
免疫組織化學方法檢測小鼠肺組織FGG、FGA、α-SMA與E-cadherin的表達,結果表明香煙煙霧處理可致肺組織中FGG、FGA 和α-SMA 水平升高,E-cadherin 水平下降,FGG 與FGA 主要表達于支氣管及肺泡上皮細胞,以肺泡上皮細胞為主,見圖4。
本研究中,我們對GSE57148 與GSE47460 數據集分別進行了差異基因分析后取交集,以上數據集的共同特點是均采用COPD 患者與非COPD 患者的分組方式,均為肺組織標本,每組樣本量都大于90。GSE76925是一個以COPD 患者與表型正常吸煙者為分組方式的數據集,將前述結果在該數據集再次進行驗證。對最終獲得的差異基因進行了GO 分析,顯示以上差異基因中FGA與FGG以及COL14A1共同定位于細胞間隙,參與細胞外基質及膠原纖維合成等生物學過程。而細胞外基質重塑是COPD 的重要特征[9]。
COL14A1在肺動脈高壓患者的血管內膜中層顯著上調,通過穩定膠原纖維增加了血管硬度[10],COL14A1與COPD的關系尚未見報道。
FGG 與FGA 除參與細胞外基質重塑,還共同參與凝血等多個生物學過程。很多凝血指標,如血漿纖維蛋白原等變化,被證明與COPD 相關[11]。FGA、FGB 和FGG 各自獨立編碼的3 個多肽鏈,以鏈內和鏈間的二硫鍵的形式,構成了纖維蛋白原[12]。纖維蛋白原被認為是可行的COPD 標志物,主要用來預測COPD 的不良預后[13]。FGG、FGA、FGB基因均被報道存在多個突變體,可致遺傳性纖維蛋白原缺陷[14-15]。
我們選擇FGG 與FGA 作為下一步研究對象。通過對GSE76925 數據分析發現,吸煙可致人肺組織FGG與FGA表達增高,戒煙有助于逆轉這個情況,但需時較長,TCGA 的數據表明戒煙小于15 年,這種趨勢仍不能完全緩解。研究表明,吸煙時間越長、吸煙強度越高,COPD 的風險就會顯著增加,戒煙后,與現在的吸煙者相比,曾經吸煙者患COPD 的風險較低[16],我們的統計結果有助于解釋驅動這一現象的內在原因。COPD 患者肺組織FGG/FGA 值高于表型正常吸煙者,輔助診斷COPD的效果甚至要優于FGG或FGA單個基因的表現。此外肺組織FGG 與FGA的mRNA 表達不受年齡和性別的強烈影響,因而具備成為COPD標志物的良好潛力。
在一個小氣道上皮來源的數據集中,我們發現FGA 還有助于區分肺一氧化碳彌散量(diffusion capacity for carbon monoxide of lung,DLCO)下降的COPD 早期患者,DLCO 與COPD 的發病和預后顯著相關[17],與肺組織樣本的區別在于,小氣道上皮樣本中FGG 與FGA 表達水平相接近。肺組織FGG 與FGA 的mRNA 表達變化,先于COPD 發生就已出現,這為COPD的早期診斷提供了可能。
吸煙及COPD 狀態下,肺組織FGG 與FGA 在蛋白水平是否與mRNA水平一致,尚未得到驗證。由于人肺組織獲取困難,我們決定以小鼠為研究對象,在來自小鼠的數據集中,我們再次驗證了吸煙對小鼠肺FGG 與FGA 表達的影響,與人肺組織中得到的結果是基本一致的。我們以香煙煙霧全身暴露法構建了COPD 模型鼠[18],HE 染色顯示吸煙組小鼠出現肺氣腫改變,提示COPD造模成功。免疫組化結果顯示吸煙處理可致小鼠肺組織FGG 與FGA 肽鏈含量增加,FGG與FGA在蛋白質水平與mRNA密切相關。
ELISA 結果顯示,吸煙小鼠肺泡灌洗液及肺組織內的IL-6 水平高于對照組,提示吸煙會誘發肺組織炎癥,這與已有的研究結果是相符的。A549 細胞被證明在IL-6刺激下能合成纖維蛋白原,相應的3個多肽鏈表達均增高,但增高的水平不一致,這個過程受糖皮質激素影響[19],而香煙煙霧提取物刺激可使A549 細胞、單核細胞以及人支氣管上皮細胞內IL-6水平升高[20-21],吸煙或通過誘導肺局部炎癥促使肺上皮細胞合成FGG 與FGA 肽鏈,進而合成纖維蛋白原。金黃色葡萄球菌可通過與纖維蛋白原結合發揮致病作用[22],這可以部分解釋,COPD 患者更高的肺炎發生率和更差的預后[23]。FGG與FGA雖然是合成纖維蛋白原的原料,但我們的研究表明,FGG 與FGA的表達變化并不一致,顯然不能與纖維蛋白原變化水平相等同。
FGG 與FGA 除參與合成纖維蛋白原,是否存在其他參與COPD 發生的機制仍是未知領域。已有研究發現,FGG 可以通過激活上皮-間充質轉化(epithelial-mesenchymal transition,EMT)促進肝癌細胞遷移和侵襲[24]。FGA基因敲除促進A549 和H1299 細胞的增殖、遷移和侵襲,降低EMT 標志物E-cadherin 和細胞角蛋白5/8的表達[25]。EMT機制深度參與COPD發病過程中的氣道重構[26],小氣道重構與肺泡附件丟失是COPD 小氣道氣流受限的決定性因素[27],而小氣道與肺泡上皮正是FGG 與FGA 的主要表達區域。我們的動物實驗結果也顯示,吸煙可致小鼠肺組織α-SMA水平升高,E-cadherin水平下降。吸煙可能通過上調IL-6 影響FGG 與FGA 的表達調節肺泡上皮細胞EMT轉化,參與COPD的發生。
綜上所述,通過生物信息學分析,我們發現FGG與FGA 在肺組織的表達水平與吸煙及COPD 的發生顯著相關,FGG/FGA 有助于早期識別COPD,具有成為COPD 標志物的潛力。動物實驗證明FGG 與FGA在蛋白水平與mRNA 水平變化一致,吸煙或通過上調IL-6 刺激小鼠肺組織FGG 與FGA 的合成,繼而影響EMT 水平參與COPD 的發生。戒煙有助于緩解吸煙引起的肺組織基因表達異常。