999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

微生物二元網絡作用關系研究

2015-07-28 12:40:30高紅艷
現代電子技術 2015年11期

高紅艷

摘 要: 基因測序技術的快速發展產生了大量海洋微生物數據,使難培養的海洋微生物種群研究成為可能。很多學者在海洋微生物種群作用模式多樣性、組成多樣性及功能多樣性方面展開了相應研究,有助于大家認識海洋微生物的分布特征及其在海洋生態系統中的功能和所扮演的角色。然而,海洋微生物在生長過程中不僅受到其他微生物的影響,也受到海洋環境(溫度,鹽度等)的影響,而在這方面的研究進展很小。通過信息論的方法構建微生物與環境因子的二元網絡,并對其進行社團挖掘,從環境的角度去發現海洋微生物種群作用模式的多樣性。

關鍵詞: 生物信息學; 網絡構建; 信息論; 社團挖掘

中圖分類號: TN99?34 文獻標識碼: A 文章編號: 1004?373X(2015)11?0091?04

Research on interaction relationship in microorganism binary networks

GAO Hong?yan

(Institute of Physics and Optoelectronics Technology, Baoji University of Arts and Science, Baoji 721016, China)

Abstract: With the rapid development of gene sequencing technology, a large number of marine microorganism data is produced, which makes the research of more hard cultivating marine microbial population possible. The corresponding researched in diversity of interaction mode, constitute, function for marine microbial population were conducted by many scholars, which is helpful to understand the distribution features of marine microorganism, and functions and characters in marine ecosystem. The growth process of marine microorganism is not only influenced by other microbes, but also influenced by marine environment (temperature, salinity, etc.). However, the research progress in this field is little. The binary networks of microorganism and environment factors are constructed by information theory, the community detection for binary networks is proceeded. The diversity of interaction mode in marine microbial population is discovered in the view of environment.

Keywords: bioinformatics; network construction; information theory; community detection

0 引 言

海洋微生物是海洋生態系統中的重要組成部分,對海洋微生物種群作用模式多樣性、組成多樣性及功能多樣性開展研究,將有助于人們認識海洋微生物的分布特征及其在海洋生態系統中的功能和所扮演的角色,對深入開展海洋生態環境研究具有重要的意義[1?2]。現代微生物學研究表明,99%以上的海洋微生物目前不能(或很難)被純培養,也就是說目前對海洋微生物的認知只占其總量[1]的l%。近幾年,隨著微生物基因組學、PCR和高通量、低成本測序技術的發展,環境基因組學推動了海洋微生物多樣性研究的快速發展。運用環境基因組學技術(如16S/18S rRNA基因序列分析)研究海洋微生物生態系統,不僅可以獲得有關海洋微生物生理多樣性和生物功能的詳細信息,還有助于了解微生物如何響應環境脅迫,并將其應用于海洋病害防治。

16SrRNA基因是細菌染色體上編碼rRNA相對應的DNA序列,存在于所有細菌的染色體基因組中,由于其高信息量、高保守性及與大多數生理、遺傳標記一致,16SrRNA基因檢測技術已經成為微生物種群多樣性及作用模式研究的有力工具。如Hewson等在澳大利亞莫頓灣的八個采樣點上取樣本[3],采用Pyrosequencing技術產生細菌浮游生物16S/23S rRNA序列,在不同序列相似度閾值水平上生成微生物操作分類單元(Operation Tax Unit,OTU),通過統計OTU在不同采樣點的微生物豐度值,研究不同地點的海洋微生物種群分布特性;Huhrman和Martiny等人采用遺傳指紋圖譜技術[4],基于判別分析、時間序列分析、多元回歸分析等多種統計方法對美國加州南部海域微生物的時間和空間分布模式進行了研究;Andersson等在波羅的海海域一個采樣位點上進行8次表層海水采樣[5],時間跨度長達兩年,采用Pyrosequencing技術產生269 420條細菌浮游生物16SrRNA序列,在97%序列相似性水平下聚類生成4 624個OTU,基于Spearman秩相關性分析了OTU與環境因子的作用模式;Gilbert等人在2003~2008年間從西英海峽觀測站采樣點采集76個表層海水樣本[6],采用Pyrosequencing技術產生968 140條16SrRNA序列,采用α?多樣性計算、判別分析等統計方法分析了不同季節下的海洋微生物分布特性,發現了豐度值最高、分布最廣泛的微生物種群,并且得出了微生物種群在不同季節下的分布差異較大,而不同年份間分布差異較小的結論。上述這些研究為分析海洋微生物種群組成多樣性、物種間復雜聯系多樣性及生物功能提供了基礎。然而這些研究大多基于統計學方法,且沒有考慮海洋環境因子的影響,無法深程度地挖掘隱含在這些大量數據中的海洋微生物作用模式。

一般地,同一個生態系統下的各個物種與環境因子(Environment,ENV)之間也存在相關關系,可以通過種群數量隨時間的變化趨勢來判斷,當物種和環境之間的數量呈同步變化時,它們可能存在依賴關系;也有可能存在非線性關系,有時從曲線變化趨勢中很難得到。本文以季節為時間單位,分別構建春、夏、秋、冬四個季節下的OTU?ENV二元作用網絡,通過二元網絡挖掘方法研究海洋微生物的作用模式。

1 數據集和理論方法

1.1 數據集

本文16SrRNA數據和環境因子來自文獻[6],在2003年1月—2008年12月共采集76個樣本,通過多種子策略的啟發式454序列聚類方法,獲得969 400條16SrRN序列,這些序列可從VAMPS(http://vamps.mbl.edu/index.php)上下載。其春(4~6月)、夏(7~9月)、秋(10~12月)、冬(1~3月)四個季節的采樣數分別為24、21、15和16,四個季節相應的16SrRNA序列數分別為276 932、247 907、212 921和231 640條。環境因子共有18個,也是76個時間點,與16SrRNA的采樣時間點一一對應,但有的時間點有缺失值,本文通過取近鄰平均值來補全缺失值,得到18個ENV。

生物學研究表明,序列相似性越高的物種在生物進化樹上越相近,一般認為相似度大于99%的序列在微生物分類學上屬于同一物種。本文采用多種子策略基于啟發式的序列聚類算法[7],該算法具有良好的魯棒性能,與傳統的啟發式序列聚類算法相比,該算法能降低OTU過估計問題,提高聚類精度,有效地進行操作分類單元計算。在99%序列相似性閾值下對968 140條16SrRNA序列進行聚類,可生成6 793個OTUs。

1.2 理論方法

信息論:相對于皮爾遜相關系數而言,互信息考慮了向量間的非線性關系[8]。在介紹互信息之前,先介紹一下信息熵。一個隨機向量[X={x1,x2,…,xN},][D=][max(X)-min(X)]。將[D]分成[M]個區間,得到一個區間集[{Dj}, j=1,2,…,M。]滿足[?j{Dj}=D]和[Dj?Dk=?,]如果[j≠k,][M]是將[D]分成的區間個數。定義[δ]函數:

[δ(Δxi,Dj)=1,if Δxi∈Dj0,else, i=1,2,…,N;j=1,2,…,M]

區間[Dj]的概率為:

[pX(Dj)=1Ni=1Nδ(Xi,Dj), j=1,2,…,M] (1)

根據香農理論,變量[X]的信息熵是:

[H(X)=-j=1MpX(Dj)logpX(Dj)] (2)

根據上文提到的[δ]函數,現有兩個隨機向量[X={x1,x2,…,xN}]和[Y={y1,y2,…,yN}。]定義聯合[δ]函數:

[δ(Δxi,Δyi,Dj,Dk)=1, if Δxi∈Dj and Δyi∈Dk0, else, i=1,2,…,N;j,k=1,2,…,M]

聯合區間[{Dj,Dk}]的概率是:

[pX,Y(Dj,Dk)=1Ni=1Nδ(Δxi,Δyi,Dj,Dk), j,k=1,2,…,M]

類似的,可定義聯合熵[H(X,Y)]:

[H(X,Y)=-j=1Mk=1MpX,Y(Dj,Dk)logpX,Y(Dj,Dk)]

聯合熵不大于各自的熵之和,即:

[H(X,Y)≤H(X)+H(Y)] (3)

如果[X]和[Y]在統計上是獨立的,則有:

[H(X,Y)=H(X)+H(Y)] (4)

兩個向量間的互信息定義為:

[MI(X,Y)=H(X)+H(Y)-H(X,Y)] (5)

根據等式(3),有:[MI(X,Y)≥0。]根據等式(4)可知:如果[X]和[Y]在統計上是獨立的,則它們的互信息是0。綜上所述,由公式(5)得到的互信息可以用來度量兩個OTU之間或OTU與ENV之間的依賴關系,不管是線性的還是非線性的。

LP(Label Propagation)算法,目前,二元網絡的研究通常有兩種思路:第一種把二元網絡投影到單頂點網絡,然后進行網絡分析。單頂點網絡無法完整描述出原始二分網絡的全部信息,即造成了原始二分網絡信息的丟失。第二種是直接基于原始二分網絡進行分析,最大程度上保留了原始二分網絡的信息。Newman將科學家合作網投影到單頂點網絡進行了研究[9],網絡的連邊是帶權重的。Lambiotte和Ausloos提出了一種聚類方法——PIB(percolation Idea?Based),并在聽眾與歌曲網中加以實現[10],得到聽眾節點的社團結構和歌曲的社團結構,但無法得出兩類節點之間的聯系。Barber在二元網絡模塊度[Q]基礎上去挖掘二元網絡[11],當[Q]值最大時得到最佳社團結構,但其方法得需先知道分團數。本文采用Raghavan等人提出的LP算法[12]去分析海洋微生物網絡,LP算法思想簡單,復雜度小,準確度也高。LP算法思想如下:

(1) 初始化,二元網絡中每個節點都有一個單獨的標簽,即開始時都屬于一個單獨的團。

(2) 更新每個節點的標簽。使每個節點的標簽等于其鄰居節點標簽個數最大的標簽。如果其鄰居節點標簽個數最大的標簽不止一個,則隨機選取。

(3) 重復步驟(2),直到每個節點的標簽都等于其鄰居節點標簽個數最大的標簽。

2 實驗結果仿真分析

為了研究四個季節微生物與環境因子之間的相互作用,用互信息構建海洋微生物相關作用網絡,得到四個季節下的OTU?ENV作用網絡。春季網絡有29個節點,22條邊;夏季網絡有45個節點,45條邊;秋季網絡有106個節點,159條邊;冬季網絡有66個節點,64條邊。其中秋季的作用網絡如圖1所示,圓點表示OTU,三角形表示ENV。由此可知,春、夏、冬三個季節的網絡圖比較簡單,有的就是一個單獨的團,秋季網絡圖節點比較多,相對來說復雜一點。

用LP算法直接在四個季節網絡中進行挖掘,秋季網絡的挖掘結果如圖2所示。每個季節挖掘出的團數如表1所示。實驗結果顯示,環境因子E3、E5和E12在四個季節里均出現,說明這三個環境因子在微生物的生長階段有一定的影響。E3、E5和E12分別是DX1、PAR和NO2+NO3。

文獻[6]也構建了微生物和環境因子的網絡,可以看出E12(NO2+NO3)在微生物的四季生長中起著重要作用。本文通過二元網絡的挖掘,也發現E12對海洋微生物的重要影響,所以重點分析E12。生物分類學家用域、界、門、綱、目、科、屬、種七個類對生物進行分類,本文參照此分類對各個季節的網絡進行了分析。其中秋季網絡中有7個OTUs和E12相連,7個OTUs全是變形菌門(Proteobacteria)。在綱級下,5個OTUs是α?變形菌綱(Alphaproteobacteria),1個OTU是γ?變形菌綱(Gammaproteobacteria),1個OTU是δ?變形菌綱(Deltaproteobacteria)。在目級下,有3個OTUs是立克次體目(Rickettsiales),1個OTU是紅螺菌目(Rhodospirillales),1個OTU是交替單胞菌目(Alteromonadales),1個OTU是脫硫桿菌目(Desulfobacterales),1個OTU是海洋螺菌目(Oceanospirillales)。在科級下,2個OTUs是SAR11群,1個OTU是紅螺菌科(Rhodospirillaceae),1個OTU是交替單胞菌科(Alteromonadaceae),1個OTU是Nitrospinaceae科,其他2個OTU未知。

通過四個季節對E12(NO2+NO3)所在團的分析,得出E12(NO2+NO3)環境因子在變形菌的生長過程中起著一定的作用,而且在不同的季節里,變形菌和擬桿菌共同出現的可能性很大,說明這兩種菌類在生長過程中相互影響,究竟是共生、寄生、捕食和競爭哪種關系,需要進一步的研究。

3 結 語

挖掘海洋微生物的多樣性對海洋資源的開發起著關鍵的作用。運用宏基因組技術研究海洋微生物,不僅可以獲得有關海洋微生物的作用模式、生理多樣性和生物功能的詳細信息,還有助于了解微生物如何響應環境脅迫。本文采用多種子策略基于啟發式的序列聚類算法將16SrRNA基因序列聚類成OTU,用微生物豐度向量表示OTU單元,基于互信息定義OTU單元與環境因子間是否存在網絡連接邊,分別構建春、夏、秋、冬四季微生物二元作用網絡,進而采用二元網絡LP算法進行挖掘。挖掘結果分析表明:春、夏、秋、冬海洋微生物與環境因子間作用網絡滿足復雜網絡“小世界”和“無尺度”特性;四個季節下的海洋微生物與環境因子的作用模式存在一定的差異,且四個季節下海洋微生物間的作用模式也存在一定差異。

參考文獻

[1] KARL D M. Microbial oceanography: paradigms, processes and promise [J]. Nature Reviews Microbiology, 2007, 5(10): 759?767.

[2] FALKOWSKI P G, VARGAS C D. Shotgun sequencing in the sea: a blast from the past? [J]. Science, 2004, 304(5667): 58?60.

[3] HEWSON I, FUHRMAN J A. Richness and diversity of bacterioplankton species along an estuarine gradient in Moreton Bay, Australia [J]. Applied and Environmental Microbiology, 2004, 70(6): 3425?3433.

[4] FUHRMAN J A, STEELE J A, HEWSON I, et al. A latitudinal diversity gradient in planktonic marine bacteria [J]. Proceedings of the National Academy of Sciences of the United States of America, 2008, 105(22): 7774?7778.

[5] ANDERSON A F, RIEMANN L, BERTILSSON S. Pyrosequencing reveals contrasting seasonal dynamics of taxa within Baltic Sea bacterioplankton communities [J]. The ISME Journal, 2009, 4(2): 171?181.

[6] GILBERT J A, STEELE J A, CAPORASO J G, et al. Defining seasonal marine microbial community dynamics [J]. The ISME journal, 2011, 6(2): 298?308.

[7] CHEN W, CHENG Y, ZHANG C, et al. MSClust: A multi?seeds based clustering algorithm for microbiome profiling using 16S rRNA sequence [J]. Journal of Microbiological Methods, 2013, 94(3): 347?355.

[8] COVER T M, THOMAS J A. Elements of information theory [M]. New York: Wiley, 1991.

[9] NEWMAN M E. Scientific collaboration networks. I. Network construction and fundamental results [J]. Physical Review E, 2001, 64(1): 543?551.

[10] LAMBIOTTE R, AUSLOOS M. Uncovering collective listening habits and music genres in bipartite networks [J]. Physical Review E, 2005, 72(6): 1102?1108.

[11] BARBER M J. Modularity and community detection in bipartite networks [J]. Physical Review E, 2007, 76(6): 326?331.

[12] RAGHAVAN U N, ALBERT R, KUMARA S. Near linear time algorithm to detect community structures in large?scale networks [J]. Physical Review E, 2007, 76(3): 426?432.

主站蜘蛛池模板: 亚洲人成日本在线观看| 亚洲一级毛片在线观播放| 日本亚洲成高清一区二区三区| 97久久超碰极品视觉盛宴| 蜜臀AV在线播放| 欧美区一区| 亚洲六月丁香六月婷婷蜜芽| 中国国语毛片免费观看视频| 色综合天天娱乐综合网| 97国内精品久久久久不卡| 91成人在线观看视频| 婷婷色丁香综合激情| 波多野结衣中文字幕一区| 日韩欧美在线观看| 丰满少妇αⅴ无码区| 色135综合网| 国产AV毛片| 55夜色66夜色国产精品视频| 国产国产人成免费视频77777| 91精品人妻一区二区| 亚洲国产中文在线二区三区免| 国产va视频| 久久久久国产精品熟女影院| 国产91蝌蚪窝| 国产综合亚洲欧洲区精品无码| 日韩二区三区| www成人国产在线观看网站| 找国产毛片看| 成人国产精品2021| 午夜色综合| 91热爆在线| 一级一级一片免费| 亚洲伦理一区二区| 久久精品人妻中文系列| 一本一道波多野结衣av黑人在线| 国产传媒一区二区三区四区五区| 爆操波多野结衣| 2019国产在线| 伊人久久婷婷五月综合97色| 澳门av无码| 国产精品一区二区在线播放| 欧美日本激情| 一区二区欧美日韩高清免费| 国产精品高清国产三级囯产AV| 在线免费看片a| 国产在线观看91精品亚瑟| 国产精品浪潮Av| 亚洲午夜国产片在线观看| 最新精品久久精品| 在线观看视频99| 亚洲色图欧美激情| 亚洲视频三级| 国产成人综合久久精品下载| 国产一区三区二区中文在线| 免费无码在线观看| 国产成人1024精品| 理论片一区| 国产免费一级精品视频| 亚洲一道AV无码午夜福利| 无码丝袜人妻| 综1合AV在线播放| 欧美一区精品| 日韩中文无码av超清| 97在线视频免费观看| 91精品视频播放| 国产色伊人| 亚洲 成人国产| 国产精品片在线观看手机版| 欧美成一级| а∨天堂一区中文字幕| 国产99视频精品免费视频7| 色偷偷av男人的天堂不卡| 99久久亚洲精品影院| 夜精品a一区二区三区| 在线播放91| 亚洲欧美另类日本| 亚洲美女一级毛片| 国产极品粉嫩小泬免费看| 五月天久久综合国产一区二区| 亚洲成a∧人片在线观看无码| 国产在线无码av完整版在线观看| 天天操天天噜|