張洪祿,滕 悅,湯唯艷,湯依群,吳劍秋
(1.江蘇省腫瘤醫院內科,江蘇 南京 210000;2.中國藥科大學基礎醫學與臨床藥學學院,江蘇 南京 210000)
非特指性外周T 細胞淋巴瘤(PTCL-NOS)是外周T 細胞淋巴瘤(PTCL)中最常見的類型,超過30%的PTCL 患者被歸類于PTCL-NOS[1]。由于PTCL-NOS 具有高度異質性和耐藥性,目前所采用的一線方案是沿襲B 細胞淋巴瘤治療方案而來,絕大部分治療方案缺乏高水平的證據或生物學基礎[2]。雖然近年來不斷有針對PTCL-NOS 的新藥面世,但此類患者與B 細胞淋巴瘤患者相比仍存在預后差、復發率高的問題,因此闡明PTCL-NOS 的分子機制和尋找有效藥物對該病的治療尤為重要。近年來,生物信息學技術在確定疾病潛在的關鍵基因靶點、信號途徑,疾病診斷和疾病發生的預測等多方面發揮著越來越重要的作用。本研究使用R 語言軟件與在線生物信息學分析工具,篩選影響PTCL-NOS 的關鍵信號通路和差異表達基因,并對可能對PTCL-NOS 產生治療作用的藥物進行篩選,以期為PTCL-NOS 的研究和治療提供新的思路。
1.1 GEO 基因芯片的獲取和分析 登錄美國國立生物中心基因數據庫(NCBI-GEO)網站(https://www.ncbi.nlm.nih.gov/geo/),將篩選研究類型設置為expressionprofilingbyarray,篩選種屬為homospiens,檢索詞為expression data from PTCL 后,檢索到GSE132550 芯片數據集,GSE132550 芯片數據集中包含了68 個PTCL-NOS 患者的樣本,18 個Lennert淋巴瘤患者樣本和16 個來自于健康志愿者T 細胞的樣本。下載GSE132550 的表達譜(.txt 格式文件)和相關臨床信息(.soft 格式文件)。應用GPL18281平臺對其進行表達譜注釋分析。選取GSE132550 芯片數據集中PTCL-NOS 和健康志愿者的樣本進行進一步研究。
1.2 差異基因表達分析 通過R 語言對芯片數據進行質量分析和標準化處理。為提高差異基因分析的準確性,將差異基因分析閾值設定為|Log2FC(foldchange)|>4,P<0.01。在R 語言中加載附加模塊Limma 包和affyPLM 包,對PTCL-NOS 樣本和健康T 細胞樣本進行差異基因的表達分析[3]。
1.3 基因本體論與KEGG 途徑富集分析 將之前所獲得的差異基因上傳至生物信息學微陣列分析數據庫DAVID(https://david.ncifcrf.gov/tools.jsp)以獲得基因本體論(GO)和京都基因和基因組百科全書(KEGG)通路的分析結果。GO 的結果包括生物學的3 個方面:細胞構成(cell components,CC)、分子功能(molecular functions,MF)和生物學過程(biological processes,BP)。
1.4 差異基因的蛋白質交互網絡富集分析 STRING(11.0 版)(https://string-db.org/) 是一個在線數據庫,包含已知和預測的蛋白質-蛋白質相交互用(PPI)[4]。將所有差異基因上傳到STRING 中,并將最小交互分數設置為0.9(最高條件)以上作為顯著閾值。將所獲得的PPI(.TSV 格式文件)上傳到Cytoscape 軟件以構建PPI 網絡[5]。隨后,采用Cytoscape 軟件內的分子復合物檢測(MCODE)-app技術來識別關鍵基因間的連接網絡。MCODE 中的所有參數設置為default。
1.5 藥物-基因相互作用分析 DGIdb(https://www.dgidb.org)是一個基于數十個可信數據庫的,用于篩選分析藥物-基因相互作用的在線數據庫[6]。將MCODE 獲得的關鍵基因上傳到DGIdb 中,以搜索現有的藥物-基因相互作用,并利用與藥物匹配的關鍵基因進行功能富集分析。
1.6 統計學分析 所有的統計分析均由R 軟件(4.0.2)進行,整個分析流程見圖1。

圖1 數據分析流程
2.1 差異表達基因的獲取 用R 軟件分析GSE132550 數據集中PTCL-NOS 樣本和健康T 細胞樣本,根據|Log2FC|>4,P<0.01 的篩選標準,共獲得1139 個存在差異表達的基因,其中包括670 個上調基因和469 個下調基因,見圖2。

圖2 1139 個差異基因的火山圖
2.2 GO 與KEGG 信號通路的富集分析 將所有的差異基因上傳到DAVID 數據庫進行GO 富集分析,得到差異基因的主要富集項目,包括KEGG 信號通路、BP、CC 和MF。在KEGG 信號通路中差異基因主要富集于PI3K-AKT 信號通路,細胞外基質受體相互作用通路和阿米巴病相關信號通路,見圖3;BP注釋中差異基因主要存在于細胞外基質組織、細胞外結構組織和細胞連接組件,見圖4;CC 注釋中差異基因主要涉及膠原蛋白-細胞外間質、基底膜和膠原三聚體的組成成分,見圖5;MF 注釋中差異基因與細胞外基質結構成分、生長因子結合和膠原蛋白結合密切相關,見圖6。

圖3 KEGG 信號通路富集結果

圖4 BP 富集結果

圖5 CC 富集結果

圖6 MF 富集結果
2.3 PPI 富集分析 將1139 個差異基因上傳到STRING 數據庫進行PPI 富集分析,得到包含552 個基因節點和1888 條連線的PPI 網絡,使用Cytoscape軟件中的MCODE-app 篩選出包含顯著差異基因的模塊,交互模塊(分數:15.655)涉及30 個基因節點和227 條連線,模塊中的差異基因主要包含在G 蛋白偶聯受體信號通路、胞外區和質膜中,見圖7。

圖7 30 個顯著基因組成的蛋白交互網絡
2.4 藥物與基因的相交互用及潛在基因功能富集分析 將2.3 中模塊1 的30 個MCODE 基因上傳到DGIdb 數據庫中進行藥物-基因相交互用分析,在篩選出與基因存在特定交互關系的藥物后,發現了105 個藥物靶向9 個特定基因(其中包括90 種針對ADRA2A 的藥物),所有的藥物都有其初始適應證,見表1;這些基因主要富集在G 蛋白偶聯受體信號通路(BP)、質膜(CC)和神經活性配體-受體相交互用(KEGG 通路),見圖8、表2。

圖8 9 個存在藥物-基因相交互用的基因富集弦圖

表1 基因-藥物相互作用

表2 具有基因-藥物交互結果的9 個基因富集分析
PTCL-NOS 是PTCL 最常見的亞型,通常表現出侵襲的臨床過程且分子機制尚未完全闡明[7]。幾乎所有PTCL-NOS 的治療方案都缺乏高水平的證據、分子或生物學基礎[8]。目前,其一線治療方案主要來源于侵襲性B 細胞淋巴瘤的治療方案,存在復發率高、遠期療效差等問題[9]。近年來,隨著轉錄組學的發展,許多疾病的分子特征和靶向藥物的發現,為個體化治療提供了可能。本研究旨在通過對PTCL-NOS 基因組學和轉錄組學的分析,采用生物信息學方法尋找TCL-NOS 關鍵基因和靶向藥物。
本研究發現,PTCL-NOS 患者的部分KEGG 信號通路活動發生了明顯改變,其中PI3K-Akt 信號通路的改變最為顯著,共有36 個包含在該通路內的基因發生了表達改變。磷脂酰肌醇-3 激酶(PI3K)/蛋白激酶B(AKTe)/雷帕霉素(mTOR)信號通路的哺乳動物靶點在包括代謝、凋亡、血管生成和細胞增殖在內的生物調節中起著重要作用,也是人類癌癥中最常見的失調信號通路之一[10]。PI3K 是磷脂酰肌醇-3,4,5-三磷酸(PIP3)的脂類激酶。PIP3 是AKT的對接位點,通過激活下游效應子mTOR 信號通路促進細胞生長、蛋白質合成、細胞運動和存活[11]。PTEN 是PI3K 的負性調節因子,能抑制PI3K 抑制腫瘤生長。在癌癥環境下,PTEN 的突變使其失去對PI3K 的調節能力,進而失調下游通路[12]。總之,在癌癥中,PI3K/AKT/mTOR 通路的過度激活增強了營養轉運蛋白和代謝酶的活性,導致細胞代謝改變,從而為腫瘤細胞的生長提供了合成代謝需求,同時也增加了腫瘤細胞的耐藥性[13]。
根據DGIdb 數據庫的基因-藥物相交互用分析,共有105 種治療PTCL-NOS 的潛在藥物(其中有90 種藥物針對ADRA2A),靶向9 個基因(ADRA2A、S1PR1、S1PR3、S1PR4、CP、FN1、APOE、SERPINA1、C3)。ADRA2A 被認為是多種腫瘤細胞系的潛在調節因子[14]。SERPINA1 過表達顯著改善了癌細胞遷移、集落形成和對細胞凋亡的抵抗力[15]。APOE 可通過與膜受體結合介導循環脂蛋白和組織之間的脂質轉移[16]。APOE 可通過LR8 受體直接抑制循環髓源性抑制細胞的存活,并在激活免疫系統中發揮抗腫瘤作用[17]。FN1 在多種癌癥中上調,沉默FN1 可促進腫瘤生長和轉移[18,19]。S1P-S1PRs 信號通路誘導免疫細胞從淋巴器官流入血液,從而影響抗腫瘤免疫反應[20,21]。西尼莫得是一種高效的S1PRs拮抗劑,已被批準用于治療多發性硬化癥,其安全性和有效性已被證實。另一種S1PRs 抑制劑芬戈莫德也證明了其治療癌癥的潛力[20]。
綜上所述,本研究發現9 個與PTCL-NOS 有關的關鍵基因(ADRA2A、S1PR1、S1PR3、S1PR4、CP、FN1、APOE、SERPINA1、C3)和105 個FDA 批準的藥物,如芬戈莫德、西尼莫得、氯化鋅、丙氯拉嗪等。另外PI3K-AKT 信號通路對于PTCL-NOS 疾病的作用也值得關注。但由于本研究獲得的關鍵基因和藥物是基于軟件統計處理和數據庫分析,它們是否能在PTCL-NOS 中發揮作用仍需進一步的分子生物學實驗來驗證。