醬香大曲中鏈霉菌菌株FBKL4.005全基因組測(cè)序及序列分析

2018-07-24 08:45:14李豆南王曉丹羅小葉邱樹毅

食品科學(xué) 2018年14期

李豆南，王曉丹，羅小葉，黃魏，邱樹毅,*

（1.貴州大學(xué) 貴州省發(fā)酵工程與生物制藥重點(diǎn)實(shí)驗(yàn)室，釀酒與食品工程學(xué)院，貴州貴陽(yáng) 550025；2.貴州大學(xué)生命科學(xué)學(xué)院，貴州貴陽(yáng) 550025）

鏈霉菌（Streptomyces）從分類學(xué)上歸屬于放線菌目，是最為高等的放線菌類群，具有發(fā)育良好的分枝菌絲，主要分布于土壤環(huán)境中。研究表明，該類群主要是一類革蘭氏陽(yáng)性、化能異養(yǎng)型好氧菌[1]，該菌屬下的菌株多數(shù)能夠合成結(jié)構(gòu)復(fù)雜的次生代謝產(chǎn)物（如抗生素等），具有良好的生物活性，是一類具有很大應(yīng)用潛力的微生物[2]。近年來，在醬香型、濃香型白酒釀造過程中也陸續(xù)分離得到該菌屬下的多種菌株，并對(duì)其代謝特性進(jìn)行了一定的探究，確認(rèn)該菌屬在釀造體系中存在重要的生物調(diào)控作用[3-4]。

全基因組測(cè)序是針對(duì)未知基因組序列的物種進(jìn)行個(gè)體全部基因組測(cè)序，具有測(cè)序覆蓋面廣、準(zhǔn)確性極高的技術(shù)優(yōu)勢(shì)[5]。近年來隨著該技術(shù)的快速發(fā)展，以第2代測(cè)序技術(shù)為主體的全基因組測(cè)序技術(shù)已成為了一種高效檢測(cè)手段，廣泛應(yīng)用于生物、醫(yī)學(xué)等領(lǐng)域。在微生物學(xué)方面，以低錯(cuò)誤率、低成本化和測(cè)序通量高為特征的羅氏454、Illumina HiSeq 2000測(cè)序平臺(tái)已演變?yōu)榛镜亩蚪M測(cè)序技術(shù)，成為了探究未知微生物類群多樣性、生物學(xué)特性、代謝功能機(jī)制的重要手段[6-7]，已經(jīng)在土壤、腸道環(huán)境中微生物類群的分析鑒定以及工程菌株的開發(fā)中發(fā)揮了重要的作用[8-10]。針對(duì)一些極端環(huán)境中的微生物而言，由于其難以分離、可培養(yǎng)性低的特點(diǎn)，傳統(tǒng)的分析方法已不適用，這時(shí)全基因組測(cè)序技術(shù)的優(yōu)勢(shì)便展現(xiàn)出來[11]，其中，在諸如油田中嗜熱采油芽孢桿菌（Geobacillus thermodenitrif i cans）[12]、新西蘭地?zé)釁^(qū)域中嗜酸甲烷氧化細(xì)菌[13-14]、水稻根際土壤中的斯氏假單胞菌（Pseudomonas stutzeri）[15]、蠟狀芽孢桿菌[16]、深海沉積物中耐壓耐冷的希瓦氏菌屬[17]、兩極地區(qū)永久凍土中的產(chǎn)甲烷菌類群[18]、氯消毒飲用水中的抗性變形菌類群[19]以及高酸性金屬礦中的硫桿菌、酸微菌群落[20]等極端環(huán)境下微生物的研究中均有該技術(shù)的運(yùn)用，為微生物防治石油污染、特殊代謝途徑的發(fā)現(xiàn)和極端環(huán)境微生物多樣性等方面的研究起到了巨大的推動(dòng)作用。

本研究的開展建立在課題組王曉丹等[21]之前的研究之上，其利用羅氏454 FLX+高通量測(cè)序平臺(tái)對(duì)貴州3 種醬香型高溫大曲中細(xì)菌的群落結(jié)構(gòu)多樣性進(jìn)行了深入研究，發(fā)現(xiàn)在屬水平上鏈霉菌屬為大曲中的優(yōu)勢(shì)細(xì)菌屬之一，含量均占到大曲總生物量的1%以上，暗示該類群可能具有重要的功能性作用；基于這一結(jié)果，本課題組通過分離方法的設(shè)計(jì)，成功從大曲中得到1 株具有耐高溫特性的鏈霉菌株FBKL4.005，并以該菌株為材料進(jìn)行全基因組測(cè)序分析，從基因功能注釋的角度快速剖析菌株的代謝特征，為日后醬香大曲中該類群功能性研究打下基礎(chǔ)。

1 材料與方法

1.1 材料與試劑

鏈霉菌菌株（實(shí)驗(yàn)室編號(hào)：FBKL4.005）篩選分離自茅臺(tái)某酒廠高溫醬香大曲；細(xì)菌基因組DNA提取試劑盒美國(guó)Biomiga公司；制霉菌素、新生霉素、瓊脂糖、Tris、EDTA二鈉北京索萊寶科技有限公司；其他化學(xué)試劑均為國(guó)產(chǎn)分析純。

1.2 儀器與設(shè)備

Thermo高速冷凍離心機(jī) 美國(guó)貝克曼庫(kù)爾特有限公司；核酸凝膠電泳儀、凝膠成像儀德國(guó)耶拿分析儀器股份公司；微型旋渦混合儀、Flex cycler多功能聚合酶鏈?zhǔn)椒磻?yīng)（polymerase chain reaction，PCR）儀美國(guó)Bio-Rad公司；BXM-30R立式滅菌鍋上海博訊實(shí)業(yè)有限公司醫(yī)療設(shè)備廠；SW-CJ-1D凈化工作臺(tái) 蘇州凈化設(shè)備有限公司。

1.3 方法

1.3.1 培養(yǎng)基的選擇與配方

菌株純化、斜面保藏培養(yǎng)基：ISP2培養(yǎng)基。

液體種子擴(kuò)培培養(yǎng)基：葡萄糖10 g/L、酵母膏4 g/L、蛋白胨4 g/L、酵母浸粉4 g/L、K2HPO44 g/L、KH2PO42 g/L、MgSO4·7H2O 0.5 g/L，pH 7.2～7.4。

1.3.2 菌株總DNA的提取

從實(shí)驗(yàn)室低溫（4 ℃）保藏的ISP2斜面培養(yǎng)基上刮取適量待測(cè)菌株，接種于100 mL液體種子擴(kuò)培培養(yǎng)基中，于45 ℃培養(yǎng)24 h后，采用細(xì)菌基因組DNA提取試劑盒提取基因組DNA，操作步驟參照試劑盒說明書進(jìn)行，所得基因組利用0.8%的瓊脂糖電泳后在凝膠成像儀上對(duì)提取效果進(jìn)行檢測(cè)并用于基因組測(cè)序。

1.3.3 全基因組測(cè)序數(shù)據(jù)處理及分析

基因組DNA提取后采用Illumina HiSeq 2000測(cè)序平臺(tái)完成全基因組測(cè)序，上機(jī)前先利用HiSeq平臺(tái)完成建庫(kù)，使用Agilent 2100對(duì)文庫(kù)的插入片段進(jìn)行檢測(cè)，并運(yùn)用實(shí)時(shí)定量PCR技術(shù)對(duì)文庫(kù)的有效濃度進(jìn)行準(zhǔn)確定量，保證文庫(kù)質(zhì)量。將測(cè)序得到的原始數(shù)據(jù)進(jìn)行過濾處理，分別去除質(zhì)量值不大于38的低質(zhì)量堿基、N堿基達(dá)到10 bp、與連接物之間overlap超過15 bp的reads，去除樣品宿主以及重復(fù)污染，得到有效數(shù)據(jù)。

經(jīng)過預(yù)處理后得到的有效數(shù)據(jù)，使用SOAP denovo組裝軟件[22-23]進(jìn)行序列拼接組裝，根據(jù)序列的雙端信息，確定出contig排列，取長(zhǎng)度大于500 bp的序列，根據(jù)不同的K-mer進(jìn)行組裝得到初步組裝結(jié)果，然后采用krskgf、gapclose等軟件對(duì)初步組裝結(jié)果進(jìn)行優(yōu)化和補(bǔ)洞，將contig連接成基因組序列，得到最終組裝結(jié)果，并與GO（Gene Ontology）、COG（Cluster of Orthologous Groups of proteins）、KEGG（Kyoto Encyclopedia of Genes and Genomes）、NR（Non-Redundant Protein Database）、TCDB（Transporter Classification Database）數(shù)據(jù)庫(kù)進(jìn)行比對(duì)分析，從而獲得菌株基因組功能注釋信息。

2 結(jié)果與分析

2.1 菌株基因組的組裝

利用SOAP denovo組裝軟件[22-23]對(duì)測(cè)序得到的序列雙端的信息數(shù)據(jù)進(jìn)行拼接（原始序列67 771 429 個(gè)reads，讀長(zhǎng)150 bp，文庫(kù)插入片段大小6 000 bp），共獲得7 個(gè)scaffolds和69 個(gè)contigs，共9 441 858 bp的序列信息，其中用于判斷基因組拼接效果優(yōu)劣的N50大小為352 516 bp，N90大小為116 315 bp；經(jīng)過優(yōu)化與補(bǔ)洞處理后，獲得菌株整個(gè)基因組大小為9 454 406 bp，GC含量為73.03%，基因平均長(zhǎng)度為976 bp，其中編碼區(qū)基因總數(shù)為8 316 個(gè)，占整個(gè)基因組序列大小86.01%。由菌株基因GC含量及測(cè)序深度分布圖可知（圖1），經(jīng)過拼接組裝后的GC含量主要分布在60%～80%之間，序列深度多分布在70～200×的范圍；Unigene長(zhǎng)度分布集中在300～1 100 bp及大于2 000 bp范圍內(nèi)（圖2），其中400～500 bp長(zhǎng)度的基因分布最多，達(dá)到669 個(gè)，占總數(shù)的8.00%左右。

圖1 菌株GC含量及測(cè)序深度分布圖Fig.1 GC Content and sequencing depth distribution

圖2 菌株Unigene長(zhǎng)度分布Fig.2 Unigene length distribution

2.2 菌株基因組的功能注釋

將菌株測(cè)序數(shù)據(jù)與GO（Released November，2013）、COG（Released September，2015）、KEGG（Released April，2016）、NR（Released April，2016）、TCDB（Released April，2016）功能數(shù)據(jù)庫(kù)進(jìn)行BLAST比對(duì)，同時(shí)使用antiSMASH（version 2.0.2）對(duì)基因組上已知次級(jí)代謝基因簇進(jìn)行預(yù)測(cè)，對(duì)上述結(jié)果完成過濾（BLASTP，evalue≤1e-5），對(duì)于每一條序列的BLAST結(jié)果，均選取得分最高的比對(duì)結(jié)果（identity≥0%，coverage≥40%）進(jìn)行注釋。發(fā)現(xiàn)菌株基因組共有7 946 個(gè)基因得到成功比對(duì)注釋，占基因總數(shù)的95.38%，共有258 個(gè)基因在所有數(shù)據(jù)庫(kù)中得到注釋，占基因總數(shù)的3.10%；其中，在NR、GO、COG數(shù)據(jù)庫(kù)中得到功能注釋的基因較多，分別為7 903、5 358 個(gè)和5 720 個(gè)，占基因總數(shù)的94.86%、64.31%及68.66%，而在TCDB數(shù)據(jù)庫(kù)中得到注釋的基因最少，僅有451 個(gè)，占基因總數(shù)的5.41%，具體的菌株基因組功能注釋分布情況見圖3。

圖3 菌株基因功能注釋分布情況Fig.3 Database distribution of gene functional annotation from the strain

2.2.1 NR數(shù)據(jù)庫(kù)基因注釋分析

表1 菌株基因組NR數(shù)據(jù)庫(kù)比對(duì)分析結(jié)果Table1 Results of BLAST with NR database

續(xù)表1

NR是一個(gè)非冗余的蛋白質(zhì)數(shù)據(jù)庫(kù)[24]，通過BLAST軟件，將菌株FBKL4.005的基因序列翻譯為相應(yīng)的氨基酸序列，并與NR數(shù)據(jù)庫(kù)進(jìn)行比對(duì)，得到最終的注釋結(jié)果。菌株一共有7 903 個(gè)基因被注釋到，占基因總數(shù)的94.86%，其中菌株FBKL4.005拼接基因組在屬水平上與現(xiàn)有的鏈霉菌屬（Streptomyces sp.）基因組核酸序列相似性在57.50%左右，總體相似度最高；而在種水平上則與吸水鏈霉菌（S. hygroscopicus）具有14.82%最高相似性。

2.2.2 COG數(shù)據(jù)庫(kù)基因注釋分析

圖4 菌株基因組COG數(shù)據(jù)庫(kù)比對(duì)分析結(jié)果Fig.4 COG functional classif i cation of maitake Unigenes

COG是由NCBI創(chuàng)建并維護(hù)的蛋白數(shù)據(jù)庫(kù)，根據(jù)細(xì)菌、藻類和真核生物完整基因組的編碼蛋白系統(tǒng)進(jìn)化關(guān)系分類構(gòu)建而成[25]。利用BLAST軟件，將菌株FBKL4.005的翻譯得到的氨基酸序列，與COG數(shù)據(jù)庫(kù)進(jìn)行比對(duì)，完成相應(yīng)基因的功能注釋。從功能注釋分析結(jié)果可以看出（圖4），菌株FBKL4.005基因功能注釋結(jié)果總共可以分為25 類，其中具有一般功能預(yù)測(cè)的注釋結(jié)果最為豐富，共778 個(gè)，占注釋基因總數(shù)的13.60%，其次是與物質(zhì)代謝密切相關(guān)的759 個(gè)轉(zhuǎn)錄注釋結(jié)果，占注釋基因總數(shù)的13.27%，而與碳水化合物轉(zhuǎn)運(yùn)和代謝、氨基酸轉(zhuǎn)運(yùn)與代謝、信號(hào)轉(zhuǎn)導(dǎo)機(jī)制等功能相關(guān)的基因也得到較多的注釋結(jié)果，分別為611、602 個(gè)和453 個(gè)，此外還發(fā)現(xiàn)了302 個(gè)功能未知的基因，有待今后進(jìn)一步研究。

2.2.3 GO數(shù)據(jù)庫(kù)注釋分析

表2 菌株基因組GO功能分類Table2 Gene ontology classif i cation of the strain

GO是1988年由基因本體聯(lián)合會(huì)創(chuàng)立基因本體論數(shù)據(jù)庫(kù)，能夠通過細(xì)胞學(xué)組件、生物學(xué)途徑、分子功能3 大分支數(shù)據(jù)庫(kù)對(duì)物種基因組進(jìn)行分類和準(zhǔn)確描述[26]。將菌株FBKL4.005翻譯氨基酸序列與GO數(shù)據(jù)庫(kù)進(jìn)行比對(duì)，對(duì)GO的不同分類比對(duì)結(jié)果進(jìn)行統(tǒng)計(jì)，得到菌株功能基因含量的分布情況（圖5）。菌株共有5 358 個(gè)基因在GO數(shù)據(jù)庫(kù)中被注釋到，在3 大類功能注釋數(shù)據(jù)下又可分為43 種功能注釋結(jié)果（表2），其中的細(xì)胞學(xué)組件類有10 個(gè)分支，共3 591 個(gè)基因注釋結(jié)果，菌株基因組與細(xì)胞、細(xì)胞組分功能組表現(xiàn)出最高相關(guān)性，各有1 514 個(gè)；生物學(xué)途徑類注釋存在22 個(gè)分支，共10 615 個(gè)，其中菌株基因組與代謝過程、細(xì)胞過程、生物調(diào)節(jié)、生物過程調(diào)控等功能組相關(guān)性較高，分別為3 161、2 677、993 個(gè)和979 個(gè)；分子功能類有11 個(gè)分支共7 044 個(gè)相關(guān)性注釋結(jié)果，其中菌株基因組與催化活性、連接功能組相關(guān)性最高，分別為2 987 個(gè)和2 697 個(gè)。

圖5 菌株的功能基因含量分布情況Fig.5 Functional gene distribution of strain FBKL4.005

2.2.4 KEGG數(shù)據(jù)庫(kù)注釋分析

KEGG建立于1995年，是全面分析基因表達(dá)產(chǎn)物在細(xì)胞中的代謝途徑及功能作用的重要參考，其中，最核心的便是KEGG PATHWAY數(shù)據(jù)庫(kù)；通過數(shù)據(jù)庫(kù)的比對(duì)查閱，可以快速方便地確定發(fā)揮某類功能相關(guān)的所有注釋基因[27-28]。本研究將菌株的氨基酸序列與KEGG數(shù)據(jù)庫(kù)進(jìn)行比對(duì)，對(duì)KEGG不同分類比對(duì)結(jié)果完成統(tǒng)計(jì)，發(fā)現(xiàn)菌株基因組共有3 492 個(gè)基因得到注釋，占菌株基因總數(shù)的43.95%，碳水化合物、氨基酸以及脂肪代謝為菌株基因組最主要涉及的幾種代謝通路，分別有355、345 個(gè)和155 個(gè)基因注釋結(jié)果。

進(jìn)一步通過KEGG PATHWAY數(shù)據(jù)庫(kù)分析，確定菌株有179 個(gè)物質(zhì)代謝通路得到注釋，其中嘌呤代謝（93 個(gè)）、糖酵解與糖異生作用（91 個(gè)）、丁酸甲酯代謝（82 個(gè)）、氨基苯甲酸酯降解代謝（79 個(gè)）、脂肪酸代謝（78 個(gè)）、精氨酸/脯氨酸代謝（76 個(gè)）以及氨基糖/核苷酸糖代謝（75 個(gè)）等通路與菌株基因組相比擁有較高的相關(guān)度（表3）。此外，通過比對(duì)結(jié)果的匯總還發(fā)現(xiàn)338 個(gè)與白酒特征風(fēng)味物質(zhì)產(chǎn)生通路、187 個(gè)與土腥味物質(zhì)代謝通路、87 個(gè)與環(huán)境污染物降解通路、74 個(gè)與大分子糖類物質(zhì)降解通路以及57 個(gè)與鏈霉素和新霉素等抗生素產(chǎn)生通路相關(guān)的基因；因此根據(jù)這些信息，初步推測(cè)該菌株在白酒釀造體系中可能與特征風(fēng)味產(chǎn)生有一定的關(guān)系，同時(shí)可能還具有一定的抗生素代謝功能和大分子物質(zhì)降解能力，為今后該菌株代謝功能的探究打下了基礎(chǔ)。

表3 菌株基因組KEGG數(shù)據(jù)庫(kù)主要代謝通路分析Table3 Main metabolic pathways of the strain from KEGG database

2.2.5 TCDB數(shù)據(jù)庫(kù)注釋分析

TCDB是轉(zhuǎn)運(yùn)蛋白分類數(shù)據(jù)庫(kù)，包括離子通道的分類系統(tǒng)，該數(shù)據(jù)庫(kù)提供了TC編號(hào)、描述信息和超過600 個(gè)轉(zhuǎn)運(yùn)蛋白家族的實(shí)例數(shù)據(jù)；而轉(zhuǎn)移系統(tǒng)則以5 個(gè)級(jí)別進(jìn)行分類，每個(gè)級(jí)別都對(duì)應(yīng)于TC編號(hào)里的一個(gè)編號(hào)，用以表示特定類型的轉(zhuǎn)運(yùn)蛋白質(zhì)[29]。研究中使用BLAST軟件，將菌株的氨基酸序列與TCDB數(shù)據(jù)庫(kù)進(jìn)行比對(duì)，分別得到TCDB一級(jí)分類統(tǒng)計(jì)結(jié)果與二級(jí)分類統(tǒng)計(jì)結(jié)果。其中從一級(jí)分類統(tǒng)計(jì)結(jié)果來看（表4），菌株基因組涉及到初級(jí)主動(dòng)運(yùn)輸以及電化學(xué)勢(shì)驅(qū)動(dòng)轉(zhuǎn)運(yùn)體功能的基因最多，分別為244 個(gè)與136 個(gè)，初步表明了菌株FBKL4.005可能多以主動(dòng)運(yùn)輸、電化學(xué)轉(zhuǎn)運(yùn)的方式分泌和吸收各種物質(zhì)；而從二級(jí)分類統(tǒng)計(jì)結(jié)果來看（圖6），與單向傳遞體、協(xié)同轉(zhuǎn)運(yùn)子、逆向轉(zhuǎn)運(yùn)子轉(zhuǎn)運(yùn)以及P-P磷酸化驅(qū)動(dòng)轉(zhuǎn)運(yùn)蛋白相關(guān)的基因最多，分別為211 個(gè)和136 個(gè)，為菌株主要的轉(zhuǎn)運(yùn)蛋白系統(tǒng)。

表4 菌株TCDB數(shù)據(jù)庫(kù)一級(jí)分類統(tǒng)計(jì)結(jié)果Table4 First level classif i cation of the strain by TCDB database

圖6 菌株TCDB數(shù)據(jù)庫(kù)二級(jí)分類統(tǒng)計(jì)結(jié)果Fig.6 Second level classif i cation of the strain by TCDB database

2.2.6 菌株次級(jí)代謝基因簇分析

次級(jí)代謝產(chǎn)物是微生物在一定的生長(zhǎng)時(shí)期，以初級(jí)代謝產(chǎn)物為前體合成的一系列大分子生長(zhǎng)非必需物質(zhì)；通過次級(jí)代謝基因簇注釋分析可以看出（表5），菌株基因組有關(guān)萜烯類物質(zhì)合成以及非核糖體肽合成酶的基因簇最多，各有5 個(gè)，此外還發(fā)現(xiàn)了與芳香類化合物合成有關(guān)的基因簇，其中萜烯類物質(zhì)是醬香型白酒生產(chǎn)中鏈霉菌屬的主要代謝產(chǎn)物，與釀造過程中的土霉味產(chǎn)生密切相關(guān)，同時(shí)在藥香型以及濃香型白酒中也均有該類物質(zhì)少量檢出[30-32]，是白酒中與風(fēng)味形成有關(guān)的物質(zhì)之一；而芳香類化合物則同樣存在于各種香型的白酒中，同樣是構(gòu)成白酒風(fēng)味的重要成分[33]。

表5 菌株次級(jí)代謝基因簇分析Table5 Secondary metabolic gene clusters of the strain

3 討論與結(jié)論

本研究采用Illumina HiSeq第2代高通量測(cè)序技術(shù)對(duì)分離自醬香大曲的具有耐高溫特性的鏈霉菌菌株FBKL4.005進(jìn)行全基因組測(cè)序，經(jīng)序列拼接組裝后，確定菌株基因組大小為9 454 406 bp，是一種GC含量高達(dá)73.03%的微生物類群，同時(shí)將整合基因組數(shù)據(jù)與GO、COG、KEGG、NR、TCDB等幾大基本數(shù)據(jù)庫(kù)的進(jìn)行比對(duì)分析，完成菌株基因組各方面功能的注釋及數(shù)據(jù)統(tǒng)計(jì)工作，從分子生物學(xué)的角度探究了該菌株的生物學(xué)特性以及代謝功能機(jī)制。

總體而言，菌株FBKL4.005在基因上與鏈霉菌屬尤其是該屬下的吸水鏈霉菌具有最高的相似性，從功能預(yù)測(cè)的角度來看，COG數(shù)據(jù)庫(kù)的比對(duì)結(jié)果顯示轉(zhuǎn)錄、碳水化合物、氨基酸代謝是菌株主要的功能預(yù)測(cè)結(jié)果；通過GO數(shù)據(jù)庫(kù)的比對(duì)，細(xì)胞、細(xì)胞組分、代謝過程、催化活性等注釋結(jié)果呈現(xiàn)出較高的相關(guān)性；利用KEGG數(shù)據(jù)庫(kù)中的代謝通路分析手段，確定了菌株主要代謝通路的組成，發(fā)現(xiàn)多個(gè)與白酒特征風(fēng)味、土腥味、糖類物質(zhì)降解、鏈霉素和新霉素產(chǎn)生等代謝通路相關(guān)的基因；此外，對(duì)菌株轉(zhuǎn)運(yùn)蛋白系統(tǒng)及次級(jí)代謝產(chǎn)物基因簇進(jìn)行了探究，從結(jié)果來看轉(zhuǎn)運(yùn)子轉(zhuǎn)運(yùn)、磷酸化驅(qū)動(dòng)轉(zhuǎn)運(yùn)蛋白系統(tǒng)主導(dǎo)的主動(dòng)運(yùn)輸、電化學(xué)轉(zhuǎn)運(yùn)為菌株運(yùn)輸物質(zhì)的主要方式，同時(shí)發(fā)現(xiàn)與白酒風(fēng)味、土腥味物質(zhì)代謝相關(guān)的基因結(jié)構(gòu)。而針對(duì)類似菌株，荊新云[34]也完成了全測(cè)序分析，獲得了全長(zhǎng)8 047 771 bp的基因組、7 570 個(gè)編碼基因以及23 個(gè)次生代謝產(chǎn)物基因簇，同時(shí)發(fā)現(xiàn)與其耐熱性相關(guān)普遍脅迫蛋白基因的拷貝數(shù)比一般鏈霉菌高。與耐高溫鏈霉菌4F相比，菌株FBKL4.005基因組更大、次生代謝基因簇較多，且發(fā)現(xiàn)了高溫鏈霉菌4F所沒有的風(fēng)味代謝相關(guān)基因，但其耐熱性基因卻未能有效證實(shí)。

研究針對(duì)醬香大曲中具有耐高溫特性的鏈霉菌菌株，采用全基因組測(cè)序技術(shù)對(duì)其生物學(xué)特性和代謝功能機(jī)制進(jìn)行探究，得到大量基因組學(xué)信息，為今后深入開展醬香大曲中耐熱性鏈霉菌代謝功能特征及相關(guān)機(jī)制的研究提供了重要的數(shù)據(jù)參考。