摘要[目的]了解世界各地EV71病毒的親緣關系。[方法]下載了NCBI數據庫所有EV71全基因組序列,以常用的Kimura 2parameter距離和E距離進行距離矩陣鄰接法建樹。[結果] 基于E距離和Kimura 2parameter距離構建的進化樹結果一致,2種方法均支持EV71進化樹反映出的基于全基因組的病毒親緣關系。[結論]E距離是病毒系統發育應用中另一種頗具潛力的新距離,能為鑒定EV71病毒親緣關系提供支持。
關鍵詞 EV71病毒;全基因組;E距離;Kimura 2parameter距離;親緣關系
中圖分類號S188文獻標識碼A文章編號0517-6611(2014)30-10469-03
基金項目國家自然科學基金青年項目(31301388);中國博士后面上項目(2014M562109);湖南省自然科學基金項目(14JJ3092);湖南省科學技術廳科技計劃項目(2014GK3046)。
作者簡介徐西林(1991- ),女,湖南新邵人,碩士研究生,研究方向:生物信息學。*通訊作者,講師,博士,碩士生導師,從事生物信息學方面的研究。
手足口病(Hand,foot and mouth disease,HFMD)是由多種人腸道病毒引起的兒童常見急性傳染疾病[1],主要腸道病毒包括腸道病毒7l型(Enterovirus 71,EV71)和柯薩奇病毒A16型(Coxsackie virus A16,CoxA16)[2-3]。EV71及CA16所致的手足口病在臨床癥狀上難以區分,但EV71感染易伴發無菌性腦炎、腦干腦炎、神經源性肺水腫等,危害更大,致死率較高[4-6]。
人腸道病毒EV71型于1969年在美國加利福尼亞州從一例腦炎病例中首次分離得到[7],自此該病毒在全世界范圍內均有暴發和流行。我國于1981年在上海首次報道手足口病的流行,此后在北京、河北、福建、吉林、山東、湖北、西寧、廣東等省(市)均有報道[4]。EV71病毒屬于小RNA病毒科腸道病毒A組成員,基因組單股正鏈RNA[8]。病毒顆粒為二十面體對稱球形結構,無包膜和突起,直徑為24~30 nm。基因組長度約7 405 bp,僅有1個開放讀碼框架[9],編碼4個結構蛋白(VP4、VP2、VP3、VP1)和7個非結構蛋白[10]。
Kimura 2parameter距離是構建系統進化樹的常用距離法,E距離法是根據各堿基π電子共振能來計算不同序列間的分子進化距離[11]。筆者以2種不同距離方法為基礎,對目前公布的所有EV71毒株全基因序列進行分析,研究世界范圍內EV71的遺傳學背景和進化關系。
1材料與方法
1.1材料從美國國立生物技術信息中心(NCBI)數據庫中搜索腸道病毒71型(Enterovirus71,EV71)全基因組序列(下載截止日期:2013年11月15日)。為了數據的后續分析及準確性,進一步從EV71全基因組序列中篩選出注釋有具體地區來源的開發閱讀框(ORF)代表序列。
1.2方法分子系統發育分析是生物信息學中的重要研究領域[12],主要研究手段是選取一組同源的DNA或蛋白質序列,通過計算各個序列間的進化距離構建反映物種進化關系的進化樹[13]。構建進化樹的方法主要有距離法、最大簡約法、最大似然法3種。距離法是比較常用的一種構樹方法[14],通過計算各序列之間的距離得到一個距離矩陣,采用特定的聚類算法對距離矩陣進行分析得到進化樹。該研究以鄰接法(NeighborJoining,NJ)為基礎,以2種不同的距離方法構建系統發育進化樹。
1.2.1Kimura 2parameter距離模型。NJ法構建進化樹時需選擇模型,對于核酸序列一般選擇Kimura 2parameter模型。打開MEGA6.06軟件,導入序列文件data>>選擇數據類型“Nucleotide Sequences”,構建系統發育樹Phylogeny>>Construct NeighborJoining Tree>>模型選擇“Kimura 2parameter model”,點擊compute計算生成進化樹并保存。
1.2.2E距離參數模型。E距離是基于π電子共振能發展的一種新的計算分子進化距離的方法,其計算公式來源于群落生態學中群落相異性系數公式。在群落生態學中,采用物種數、頻率、信息量等計算群落相似性或相異性系數是測定群落相似性的一套較成熟的方法。群落相異性系數的公式為:D=1-2ca+b,式中,D為相異性指數,a為A群落中物種數,b為B群落中物種數,c為A、B 2個群落中共有物種數。E距離是將比較兩序列看作兩群落并按位比較,用群落相異性系數公式來計算序列間的分子進化距離。已知各堿基π電子共振能比值為T∶C∶G∶A=0.17∶0.23∶0.27∶0.32,E距離可定義為:E=1-2ca+b,其中a、b分別為序列A、B的堿基π電子共振能和,c為序列A、B按位比較時共有的堿基π電子共振能和。該研究先計算序列兩兩比對獲得E距離矩陣,再利用MEGA6.06基于E距離參數模型和NJ法構建系統進化樹。
2結果與分析
2.1EV71核酸序列信息以2013年11月15日NCBI的核酸數據庫為準,獲得EV71基因組序列共221條,其中140條序列來自中國的20個省份,60條序列來自國外11個城市,21條序列地區未知(表1)。去除地區注釋不明序列后,按地域對序列進行分類,從來源于同一地區的序列中選出1條作為該地域的代表序列,最終共選取31條EV71病毒ORF區域代表序列(表2),序列長度均為6 582 bp。