王嬋娟,郝志敏,張偉蘭,熊三軍,郭美祥
上海市奉賢區中心醫院全科醫學科,上海 201400
進行性核上性麻痹(PSP)是一種神經退行性疾病,核心臨床癥狀為眼肌麻痹、姿勢不穩、運動減少、認知功能障礙,病理學檢查可見Tau蛋白異常磷酸化[1-4]。PSP發病較為隱匿,患者在疾病早期往往缺乏典型癥狀,部分患者臨床表現與原發性帕金森病、帕金森綜合征相似[5],且無特異的實驗室檢查,這為PSP的早期臨床診斷帶來了不便,因此找到一種或多種可提示PSP發生和發展的生物標志物,對于PSP的早發現、早干預具有重要意義。在治療方面,由于PSP的發病機制尚未闡明,故目前沒有特異性治療藥物,臨床上僅應用左旋多巴和安坦等緩解癥狀[6-9]。尋找PSP的潛在發病機制,是開發治療藥物的關鍵,亦是當前PSP研究的重點[10]。生物信息學是一門新興的生命科學與計算科學的前沿交叉學科,其通過對高通量測序結果進行二次分析,可幫助人們更加深刻地認識疾病的本質,更加高效地尋找疾病潛在治療靶點。為此,本研究擬利用基因表達數據庫2R(GEO2R)中的數據,對在PSP中差異表達基因(DEGs)進行分析,探索PSP潛在的生物標志物和治療靶點。
1.1一般資料 通過在美國國家生物技術信息中心(NCBI)數據庫中查詢PSP患者基因表達芯片,確定了GSE6613芯片數據集(共包含105張芯片的數據)為研究目標,其中健康者芯片23張,PSP患者芯片6張,帕金森病患者芯片77張。本研究僅分析PSP患者(PSP組,n=6)和健康者(健康對照組,n=23)的數據。該芯片數據集的建立依托于GPL96平臺,本課題組在Gene Expression Omnibus(GEO)數據庫中下載了該數據集的全部矩陣文件,此矩陣文件中包含了所有標本全部被檢測基因的表達水平。
1.2方法
1.2.1DEGs篩選 GEO2R平臺(http://www.ncbi.nlm.nih.gov/ geo/GEO2R)是GEO數據庫中以R語言為基礎的交互式分析工具[11]。本研究利用GEO2R平臺對PSP患者及健康人群全血細胞的DEGs進行篩選。以基因倍數改變(FC)取對數值(log2FC)>1.5作為上調DEGs的篩選標準;以log2FC<-1.5作為下調DEGs的篩選標準;P<0.05為差異有統計學意義。下載該芯片所有被檢測基因原始表達水平數據。
1.2.2基因本體論(GO) GO富集分析和京都基因與基因組百科全書(KEGG)信號通路分析能夠注釋一組基因的多項功能,包括分子功能(MF)、細胞組分(CC)和生物學過程(BP)。KEGG本質上是一種獲取基因生物學功能甚至高級基因組信息的資源,KEGG信號通路分析能夠提示某些疾病相關基因及藥物的生物學通路。本研究通過DAVID(http://david.ncifcrf.gov,6.7版)進行了該芯片的GO富集分析和KEGG信號通路分析。以P<0.05為差異有統計學意義。
1.2.3蛋白-蛋白相互作用網絡的構建 蛋白-蛋白相互作用(PPI)網絡能夠識別健康個體與患者之間的核心DEGs和關鍵基因模塊。首先將本芯片中全部的DEGs導入STRING在線分析軟件(http://www.stringdb.org/),預測這些基因所編碼蛋白之間的相互作用;隨后,在STRING分析的基礎上,采用Cytoscape軟件平臺構建基因的PPI網絡,并根據這些基因的連接度排序,篩選出連接度最高的基因。
1.2.4臨床標本分組 選取本院2016年1月至2021年12月留存的9例PSP患者外周血標本作為試驗組,其中男6例、女3例,年齡為(70.78±5.95)歲;另外從2022年1—2月健康查體人群中,隨機選取61~81歲的男性血標本6例、女性血標本3例,作為對照組,年齡(72.11±8.02)歲。兩組研究對象在抽血前均已簽署知情同意書。納入標準:(1)試驗組患者符合《中國進行性核上性麻痹臨床診斷標準》[4];(2)對照組人群無神經系統疾病。排除標準:(1)存在腦血管疾??;(2)患有惡性腫瘤;(3)患者或家屬拒絕保存血液標本。
1.2.5相關基因轉錄水平檢測 應用RNA提取試劑盒提取血液標本中的總RNA,并反轉錄成cDNA,經實時熒光定量PCR試劑盒檢測相關DEGs及PPI網絡中連接度最高的KRAS基因的相對表達水平,各引物序列見表1。每個標本設置3個重復孔。擴增基因采取兩步法:95 ℃、15 min預變性;95 ℃、10 s,60 ℃、32 s進行38循環。應用2-ΔΔCt法計算各基因的相對長度。選取GAPDH作為內參基因,上游:CTGGGCTACACTGAGCACC,下游:AAGTGGTCGTTGAGGGCAATG。

表1 各基因引物序列

續表1 各基因引物序列

2.1DEGs的篩選結果 共篩選出DEGs 98個,上調基因54個,下調基因44個。在98個DEGs中,差異最大的5個上調基因分別為MYOM2、EMP1、DKK2、FBN1、POLA2;差異最大的5個下調基因分別為IVD、TMED7、MSMO1、CASP3和DLG1。見表2。

表2 DEGs的基本生物學功能
2.2GO富集分析 分析本芯片中所有的DEGs,發現上調DEGs的MF包括轉錄因子結合、核酸結合、金屬離子結合,而下調DEGs的MF主要包括蛋白質復合物結合、微管結合、蛋白質結合。
2.4PPI網絡的構建及核心基因的篩選 通過構建PPI,篩選出連接度最高的基因——KRAS,以及與其相關的7個基因:MSH6、LOX、CASP3、AKTIP、KRT20、RECK和PBRM1。見表3。

表3 DEGs的KEGG富集分析
2.5臨床標本各基因表達差異 與對照組比較,試驗組EMP1和DKK2基因表達上調,DLG1和KRAS基因表達下調,差異均有統計學意義(P<0.05),見表4。

表4 臨床標本各基因表達差異比較

組別IVDTMED7MSMO1CASP3DLG1KRAS對照組0.93±0.110.94±0.120.98±0.121.00±0.100.94±0.830.99±0.11試驗組0.95±0.090.90±0.090.91±0.110.96±0.080.80±0.170.69±0.09t0.2440.881.2380.8322.2555.912P0.8110.3910.2330.4170.038<0.001
PSP是一種較為少見的神經變性疾病,以眼球運動障礙、姿勢不穩、運動障礙以及認知功能障礙為核心臨床特征[1-2],我國尚無確切的流行病學數據,日本的一項研究顯示,PSP總體患病率約為18/10萬[5],PSP的主要病變部位在中腦、蒼白球、丘腦底核、橋腦被蓋、小腦齒狀核和小腦上腳等。目前關于PSP的病因和發病機制尚不明確,且缺乏特異性的輔助檢查手段,臨床上診斷和鑒別困難,較易誤診為其他神經退行性疾病。
本研究通過對GEO數據庫中的PSP患者及健康人群全血細胞的DEGs進行篩查,共發現98個DEGs。利用臨床血液標本,進一步對差異最大的5個上調基和差異最大的5個下調基因進行驗證發現,EMP1和DKK2基因表達上調,DLG1基因表達下調。其中EMP1編碼一種上皮膜蛋白,編碼蛋白位于質膜上,其主要參與濾泡聚集和細胞死亡[11]。DKK2可通過抑制LRP5/6與WNT的相互作用,促進LRP5/6內化的跨膜蛋白KREMEN形成三元復合物,拮抗典型WNT信號。在成年人中,DKK與骨形成、骨病、癌癥和阿爾茨海默病有關[12]。DLG1編碼一種正常發育所需的基本多結構域支架蛋白,可在黏附、連接、組裝,信號轉導、細胞增殖、突觸形成和淋巴細胞活化中發揮作用[13]。這與生物信息學分析結果不完全一致,可能是由于公共數據庫中的數據來源于白種人和黑種人,而臨床驗證的基因數據來源于黃種人,基因表達在不同種族之間存在差異,同時標本量過小也可引起結果的不一致。但是EMP1、DKK2和DLG1基因在兩部分實驗中表達趨勢是一致的,且在PSP的既往研究中鮮有報道,這為PSP的生物標志物篩選提供了參考。同時,本課題組還根據這些DEGs的相互作用關系構建了PPI,發現KRAS基因的連接度最高,臨床標本驗證亦可發現其表達水平降低。KRAS基因是哺乳動物RAS基因家族的Kirsten-RAS基因同源物,編碼一種屬于鳥苷三磷酸酶(GTPase)超家族的蛋白質,其可通過將效應分子直接與GTP結合來激活多條信號通路[14]。與其相關的7個基因中,MSH6基因編碼DNA錯配修復MutS家族中的一個成員,其可在修復錯配核苷酸之前識別錯配核苷酸[15];LOX基因編碼賴氨酰氧化酶家族的一員,這種酶的銅依賴性胺氧化酶活性在膠原和彈性蛋白的交聯中起作用[16];CASP3基因編碼的蛋白質是一種半胱氨酸天冬氨酸蛋白酶,在細胞凋亡的執行階段起著核心作用,與阿爾茨海默病中的神經元死亡有關[17];AKTIP基因編碼蛋白直接與絲氨酸/蘇氨酸激酶蛋白激酶B相互作用,在細胞凋亡中發揮作用[18];KRT20基因編碼的蛋白質是角蛋白家族的一員,調控上皮細胞結構完整性[19];RECK基因編碼的蛋白質是一種富含半胱氨酸的細胞外蛋白,具有蛋白酶抑制劑樣結構域,在正常細胞中作為基質金屬蛋白酶-9的負調節因子,基質金屬蛋白酶-9是參與凋亡、腫瘤侵襲等生物學進程的關鍵酶[20];PBRM1基因編碼ATP依賴的染色質重塑復合物的一個亞單位,該蛋白是核激素受體配體依賴性轉錄激活所必需的復合物的組成部分[21]??梢姾诵幕騅RAS主要調控遺傳物質的復制與細胞凋亡相關生物學進程,是PSP的可能發病機制和潛在治療靶點之一。
綜上所述,本研究基于生物信息學首次對PSP和健康體檢人群全血細胞表達差異基因進行分析,從生物信息學角度提出炎癥、免疫紊亂、代謝紊亂等與PSP的發病密切相關。結合臨床標本驗證發現,EMP1、DKK2和DLG1基因差異表達顯著,將這些標志物結合臨床,有望提高PSP診斷準確率。同時,依據PPI網絡,挑選出了有望成為PSP治療靶點的KRAS基因,為PSP的進一步研究提供了參考。