張莉彬 宋凱利



摘要:基因網絡是一種復雜的生物網絡,描述了基因與其他作用因子之間的調控關系。相同的基因可以和不同的調控因子通過相關作用關系構成基因調控網絡,而miRNA是近年來研究發現的一種新型基因調控元件,現已成為基因調控網絡的重要組成部分。鑒定與多種癌癥相關的miRNA及其靶基因,有助于了解基因與癌癥等復雜疾病的關系,并為針對泛癌癥的生物藥物研制及靶向治療提供參考。
關鍵詞:基因;miRNA;癌癥
中圖分類號:TP301.6 文獻標識碼:A 文章編號:1007-9416(2019)02-0057-02
0 引言
MicroRNA簡稱miRNA,是一類內源性非編碼的小RNA分子,它們通過與靶基因相互作用來調控復雜疾病的生物過程,尤其在許多癌癥進程中起到了關鍵作用。針對單一基因或miRNA的研究對深入了解癌癥的病發過程具有一定的局限性,本文則通過研究與泛癌癥相關的基因和miRNA數據,對miRNA之間和基因之間做關聯分析,提出了一種miRNA-基因雙層調控網絡的構建方法,解釋了參與調控多種癌癥過程的重要作用因子之間的合作機制,為癌癥的風險預測以及生物靶向藥物的研制提供幫助。
1 雙層基因調控網絡的構建方法流程
1.1 構建方法流程圖
構建雙層基因調控網絡的方法包括:分析網絡中重要調控因子miRNA的表達數據;利用統計檢驗方法選出與多種癌癥相關的miRNA;度量miRNA之間的皮爾森相關性;根據可調控癌癥的數量和相關性對miRNA進行排序,篩選出強相關的miRNA,獲取其靶基因以及它們之間的相互作用關系[1]。
1.2 方法構建步驟
第一步,預處理miRNA數據集:
(1)去掉原始樣本中有缺失值的數據,剔除平均表達值小于10的miRNA以降噪;(2)對每行數據進行t檢驗夠過濾掉P-value大于 0.5的miRNA;(3)分別計算各組miRNA數據集中患病樣本表達值與正常樣本表達值之間的Fold Change(FC)值,設定閾值為2,即FC絕對值大于2時預示對應的miRNA在癌癥中表達顯著異常;
篩選出的miRNA是影響多種癌癥的生物過程的miRNA。
第二步,根據T值和C值對miRNA進行排序,Ti表示miRNA i在多種癌癥中表達異常的次數,Ci按照如下公式計算:
;
其中,N為至少在五種癌癥中表達異常的miRNA組成的集合,n為集合N的元素個數,PCC(i,j)為miRNA i與miRNA j的皮爾森相關系數值。選出排序最高的若干miRNA記為重要miRNA。
第三步,使用miRanda、miRDB、RNA22、TargetScan和CancerMiner這五種方法預測重要miRNA的靶基因,根據False Discovery Rate(FDR)小于某設定閾值的條件分別取五種預測結果的交集,作為靶基因預測結果。FDR設定閾值為0.01,即選取FDR小于0.01的基因作為相應miRNA的候選靶基因,以此降低數據內部噪聲和提高靶基因鑒定準確率。
第四步,將各miRNA的五種靶基因結果做交集之后,利用STRING數據庫,通過基因編碼的蛋白質評估得到的交集中基因之間的作用關系。
第五步,綜合重要miRNA之間的聯系、靶基因之間的聯系以及miRNA-基因之間的聯系,構建雙層基因調控網絡。
2 雙層基因調控網絡的構建方法實現流程
2.1 構建方法實現流程
下面結合實驗對本文提出的網絡構建方法作詳細的描述。
利用PanCancer項目中相關數據集構建雙層基因調控網絡:
PanCancer項目中,七組數據集有正常樣本作為對照,即七種癌癥的miRNA數據集可以使用。這七種癌癥分別是膀胱尿路上皮癌(BLCA)、乳腺浸潤癌(BRCA)、頭頸部鱗狀細胞癌(HNSC)、腎透明細胞癌(KIRC)、肺腺癌(LUAD)、肺鱗狀細胞癌(LUSC)、子宮內膜樣腺癌(UCEC)。每組數據集中都有1045個miRNA,樣本數量信息如表1所示。
在上述數據集上的具體實施步驟如下:
(1)對7組miRNA原始數據集進行預處理:1)去掉原始樣本中有缺失值的數據,剔除平均表達值小于10的miRNA以降噪;2) 對每行數據進行t檢驗夠過濾掉P-value大于0.5的miRNA;3)分別計算各組miRNA數據集中患病樣本表達值與正常樣本表達值之間的FC值,設定閾值為2;
通過以上方法從1045個miRNA中篩選出235個miRNA,可認為這些miRNA影響多種癌癥的生物過程。
(2)在選出的miRNA基礎上再篩選出至少在五種癌癥中表達異常的miRNA,度量這48個miRNA之間的皮爾森相關性,根據T值和C值對miRNA進行排序,選出排序最高的八個miRNA,分別為miR-590,miR-141,miR-19a,miR-93,miR-96,miR-130b,miR-345,miR-18a。
(3)使用上述五種方法預測重要miRNA的靶基因,根據FDR小于0.01的條件分別取五種預測結果的交集。再將各miRNA的靶基因結果做交集,最終得到60個基因,利用STRING數據庫通過基因編碼的蛋白質評估最終得到的交集中基因之間的作用關系。
(4)綜合八個miRNA之間的聯系、48個基因之間的聯系和miRNA及其靶標之間的聯系,構建雙層基因調控網絡,如圖1所示。
2.2 網絡分析
該網絡綜合了多方面信息,有利于全面了解影響泛癌的重要作用因子以及作用因子合作調控癌癥過程的機制。以下是對所構建網絡的可靠性分析:
首先,miRNA之間具有強相關性,其中,mir-130b,mir-19a和mir-93是與泛癌相關的miRNA家族成員,它們彼此合作共同調節相同的癌癥。同時,mir-93和mir-19a被推斷有助于乳腺腫瘤、胃腫瘤、前列腺腫瘤和卵巢腫瘤這些癌癥的發展。而在過去研究中總被忽略的miR-590,與其他七個miRNA的皮爾森相關系數值都超過了閾值,實際上它會通過與其他幾種常見的致癌miRNA合作來促進癌癥的發展[2]。mir-590可以調節其靶腫瘤抑制基因PDCD4和PTEN的表達,其中參與細胞周期調節磷酸酶蛋白質產物的表達而成為腫瘤抑制基因的PTEN,是共調控模塊中所有miRNA的常見靶標,可被視為癌癥共有的治療靶標。
其次,眾多癌癥過程中都發生了基因間的相互作用,如MMP2和TIMP3的表達之間有著強相關性,MMP2是涉及許多癌癥的蛋白水解酶,TIMP3的特異性組織抑制劑可調節細胞活性,它們的不平衡表達是肺癌、乳腺癌、結腸癌等多種癌癥發展過程中的重要危險因素。E2F1充當調節RRM2表達水平的轉錄因子,而RRM2的高表達促使直腸癌腫瘤的生長和侵襲。與正常組織相比,大多數癌癥組織中兩者的蛋白質水平均升高且相互平行[3]。FOXO1可抑制胰腺β細胞中的TXNIP轉錄,在細胞腫瘤的形成過程中起著關鍵作用。此外FOXO1還可上調TXNIP在神經元和內皮細胞中的表達,并下調TXNIP在肝臟中的表達。
3 結語
本文基于miRNA與基因之間的調控關系以及兩者與癌癥之間的重要聯系,通過構建miRNA-基因調控網絡來幫助分析復雜疾病的機理?;诋斍昂A康南嚓P數據,挖掘多種癌癥中miRNA與miRNA、miRNA與靶基因基、基因與基因間多方位信息,綜合于一體,以雙層網絡的形式呈現出來,可更直觀地體現出miRNA通過協作靶向基因調控泛癌癥的過程。此項研究會為疾病的研究提供更加全面豐富的信息,有助于從系統層面了解疾病的發病機制和過程,為診斷和治療疾病提供理論借鑒,將會在未來的生命科學研究中發揮關鍵作用。
參考文獻
[1] 張莉彬.利用miRNA表達譜構建miRNA-基因調控網絡[D].西安電子科技大學,2017.
[2] Hongfei Y , Wenhong Z , Wentao Z , et al.Roles of miR-590-5p and miR-590-3p in the development of hepatocellular carcinoma[J]. Journal of Southern Medical University,2013,33(06):804-811.
[3] Zejun F , Chaoju G , Hong L , Xiaomin Z , Lingming M , Mintao S , Lanlan Q , Shuchai L , Zhihua Z , Ronghui Z , Hongqian Gu , Xiang C . E2F1 promote the aggressiveness of human colorectal cancer by activating the ribonucleotide reductase small subunit M2[J]. Biochemical & Biophysical Research Communications, 2015, 464(2):407-415.
Method for Constructing Double-layer Gene Regulation Network
ZHANG Li-bin,SONG Kai-li
(Xi'an Aviation Vocational and Technical College, Xi'an? Shaanxi? 710023)
Abstract:A genetic network is a complex biological network that describes the regulatory relationship between genes and other contributing factors. The same gene can form a gene regulatory network through a related relationship with different regulatory factors. miRNA is a novel gene regulatory element discovered in recent years and has become an important part of the gene regulatory network. Identification of miRNAs and their target genes associated with various cancers can help to understand the relationship between genes and complex diseases such as cancer, and provide reference for biopharmaceutical development and targeted therapy for pan-cancerous diseases.
Key words:gene; miRNA; cancer