延邊大學(133000)單元春
吉林省醫療器械檢驗所(130026)刁紅雨
分子群體遺傳學是利用DNA序列的變異式樣來研究群體的遺傳結構及引起群體遺傳變化的因素與群體遺傳結構的關系。群體遺傳學分析軟件,是利用群體的基因頻率和基因型頻率進行多項遺傳學數據的統計分析的便捷式操作軟件。目前國內群體遺傳學的研究越來越熱門,對遺傳學的數據分析也提出了更高的要求 ,本文對群體遺傳學分析軟件進行了比較分析。
MEGA是一種利用核酸或蛋白序列重建進化樹的軟件,具有分析核酸多樣性、推測物種間的進化距離等功能,可以在Windows、Mac OS、Linux平臺下操作。輸入的序列需要用序列比對軟件比對之后才可以使用,保存的序列經過比對后保存為*.MEG格式,即可用來構建四種類型的系統發育樹,分別為neighbor joining、maximum parsimony、minimum evolution和UPGMA4種算法。軟件本身提供了不同數據格式的轉換功能,增強了軟件的通用性[1]。此外,該軟件還能夠得出不同序列間的距離矩陣。結果可以直接保存本身格式或者保存為圖像格式,結果輸入隨時可以使用標注,標注的內容可以被保存和復制。(該軟件可在http://bioinformatics.psb.ugent.be/software/details/3下載)。
GENEPOP是一種具有進行正合檢驗(如哈迪-溫伯格平衡、種群差異、連鎖不平衡等)、估算群體遺傳學參數(如Fst、基因頻率等)、轉換輸入文件格式功能的分析軟件,但它不能直接計算出居群間的實際遺傳距離。該軟件可以在MS-DOS環境下運行,也可以在線使用(http://wbiomed.curtin.edu.au/genepop/index.html)。GENEPOP的數據輸入文件為純文本文件,數據文件要與GENEPOP存于同一子目錄下才可使用,可以用2位或3位數對數據進行編號,輸入文件中缺失的數據可以用00或000表示。輸出結果可以在EDIT文字處理程序中進行查看[2]。(可通過匿名FTP在服務器ftp.cefe.cnrsmop.fr的pub/pc/msdos/genepop子目錄下下載[3])
POPGENE32是一種用C++語言編寫,利用顯性、共顯性標記和數量性狀來分析種間種內的遺傳變異以及基因流的軟件,可以在輔助軟件TREEVIEW幫助下生成系統發生樹[4],可在Windows界面下操作。POPGENE對輸入格式要求十分嚴格,而且不易查出錯誤所在。它的文件由表頭和數據兩部分組成,表頭要用/*...*/符號限定,輸入的離散數據或基因頻率數據之前為每個population的ID和名字,如果這兩項沒有給出,則要在每個population之間留下至少一個空白行,由軟件自動生成ID。輸出為文本格式,需要人工查找目的數據,進化樹顯示也不直觀,而且不可以進行修改。(該軟件可在http://ualberta.ca/-fyeh/index.htm進行免費下載)
PHYLIP是一種功能強大的軟件包,主要功能軟件包包括:DNA和蛋白質序列數據分析、序列數據轉變為距離數據后的分析、對基因頻率和連續的元素進行分析、獨立看待每個堿基/氨基酸時的序列分析、按照DOLLO簡約算法進行序列分析、繪制和修改進化樹。但其設置參數復雜,軟件包眾多,并不十分適合大批量復雜數據處理。該程序可以在Windows、Dos、Macintosh、Linux平臺下運行。輸入的數據為分子序列、基因頻率、限制位點、離散數據等,輸入文件只能以記事板的ASCⅡ格式或Word中的純文本形式保存。輸入文件名必須為“infile”,輸出文件名必須為“outfile”或“outtree”。處理結果可以以文本形式打開,進化樹需要用其他軟件修改[5]。(可在http://evolution.genetics.washington.edu/phylip.html免費下載)
SHESIS軟件是一種具有哈迪-溫伯格平衡檢測、連鎖平衡水平檢測、單倍體型分析、卡方檢驗等基本功能的實用性軟件,可在線使用,只需要按標準格式錄入每個樣本的ID和等位基因數據,數據可從EXCEL里進行復制,粘貼到SHESIS數據錄入框中,只要保持每一縱行之間留有至少一行空白即可,沒有成功分型的樣本,等位基因需要用00來表示。觀察處理結果非常直觀易懂,不需要其他輔助性軟件,是目前很多科研機構廣泛使用的軟件。(可在http://analysis.bio-x.cn進行免費下載)
該軟件是2006年蔡穎等科研人員利用VBA語言開發的,用于短串聯重復序列基因座群體遺傳學統計分析的軟件。具體功能有:對群體遺傳學原始數據進行基因型和等位基因頻率統計,計算大部分群體遺傳學指標(雜合度、耦合率、個體識別能力、平均非父排除率等)、哈迪-溫伯格平衡檢驗、連鎖平衡檢驗等??梢栽赪indows系統下操作,輸入數據格式兼容性能好,輸出采用表格方式,不需要二次整理。軟件使用無需安裝,不占用系統資源[6]。目前我國群體遺傳學正在快速發展,大量不同物種基因組測序的研究需要一種簡便而快捷的統計分析工具來對數據進行精確有效的分析,以提取統計信息。本文對6種目前廣泛應用的群體遺傳學分析軟件的比較分析,可以看出,分析軟件正趨于方便數據錄入、多種平臺操作、集多項分析功能于一體、傻瓜式操作,旨在為群體遺傳學的科研發展提供更為科學、快速、可靠的統計工具。